Sommaire

Google dévoile Gemini, la Révolution de l’IA

Une nouvelle ère de l’intelligence artificielle est sur le point de débuter chez Google, et son nom est « Gemini« , selon les dires du PDG Sundar Pichai. Gemini représente le dernier modèle linguistique de Google, présenté pour la première fois lors de la conférence des développeurs I/O en juin et maintenant accessible au grand public. Cette avancée majeure dans le domaine de l’IA promet d’impacter significativement l’ensemble des produits de Google.

Les différentes facettes de Gemini

Gemini ne se limite pas à un seul modèle d’IA. Une version allégée appelée Gemini Nano est conçue pour fonctionner nativement et hors ligne sur les appareils Android. Une version plus puissante, Gemini Pro, alimentera bientôt de nombreux services d’IA de Google et servira de base à Bard dès aujourd’hui. Enfin, un modèle encore plus performant appelé Gemini Ultra, principalement destiné aux centres de données et aux applications d’entreprise, sera disponible l’année prochaine.

Le déploiement de Gemini

Google lance actuellement le modèle de plusieurs manières. Bard est désormais alimenté par Gemini Pro, et les utilisateurs de Pixel 8 Pro bénéficieront de nouvelles fonctionnalités grâce à Gemini Nano. Les développeurs et les clients professionnels pourront accéder à Gemini Pro via :

  • Google Generative AI Studio ou
  • Vertex AI

dans Google Cloud à partir du 13 décembre. Bien que Gemini ne soit disponible qu’en anglais pour le moment, d’autres langues seront bientôt prises en charge. Pichai affirme que le modèle sera intégré à terme dans le moteur de recherche Google, ses produits publicitaires, le navigateur Chrome, et bien d’autres applications à travers le monde. Il représente l’avenir de Google, et il arrive à point nommé.

Nouvelle orientation : Gemini versus GPT-4

Avec un an et une semaine depuis le lancement de Chat GPT par OpenAI, Google présente maintenant Gemini. Plutôt que de se concentrer sur une comparaison directe avec GPT-4, Google met en avant les caractéristiques uniques de Gemini. Des analyses approfondies et des tests de comparaison ont été réalisés, démontrant les capacités exceptionnelles de Gemini dans des domaines spécifiques.

Les avantages de Gemini

Les avantages les plus évidents de Gemini, selon les benchmarks, résident dans sa capacité à comprendre et à interagir avec la vidéo et l’audio. Contrairement à OpenAI, qui a créé des modèles distincts pour les images et la voix, Google a développé un modèle multisensoriel dès le départ. Hassabis souligne l’intérêt de Google pour des systèmes très généraux et prévoit d’étendre les capacités de Gemini à d’autres sens tels que l’action et le toucher.

Au-delà des benchmarks : l’expérience utilisateur

Cependant, au-delà des benchmarks, la véritable épreuve de la capacité de Gemini viendra des utilisateurs quotidiens qui souhaitent l’utiliser pour générer des idées, rechercher des informations, écrire du code, et bien plus encore. Google voit le codage en particulier comme une application phare pour Gemini, avec un nouveau système de génération de code appelé AlphaCode 2. Sundar Pichai affirme que les utilisateurs remarqueront une amélioration dans pratiquement tout ce que le modèle touche.

Efficacité et sécurité de Gemini

Un aspect tout aussi important de Gemini est son efficacité. Entraîné sur les propres unités de traitement tensoriel de Google, il est plus rapide et moins cher à exécuter que les modèles précédents. Google lance également une nouvelle version de son système TPU, le TPU v5p, conçu pour être utilisé dans les centres de données pour l’entraînement et l’exécution de modèles à grande échelle.

Notre conclusion

En discutant avec Pichai et Hassabis, il est évident qu’ils voient le lancement de Gemini comme le début d’un projet plus vaste et comme un changement majeur en lui-même. Gemini est le modèle que Google attendait, celui vers lequel il travaillait depuis des années, peut-être même celui qu’il aurait dû avoir prêt avant qu’OpenAI et ChatGPT ne dominent le secteur. Google semble être encore attaché à sa devise « audacieux et responsable » tout en se préparant à l’intelligence artificielle générale, avec une approche prudente mais optimiste envers l’avenir de Gemini. En ce qui concerne ChatGPT d’OpenAI, qui a été lancé il y a un an et a rapidement dominé le secteur de l’IA, la compétition semble prendre une nouvelle tournure. Google, avec Gemini, n’aborde pas le défi comme une simple rivalité, mais plutôt comme une opportunité d’innovation et de différenciation. Plutôt que de se livrer à une comparaison directe, Google met en avant les caractéristiques uniques de Gemini, soulignant ses avantages dans la compréhension multimodale, la gestion de l’audio et de la vidéo, ainsi que son efficacité améliorée. La course à l’IA évolue, et avec Gemini, Google démontre sa détermination à être un acteur majeur dans cette révolution technologique. Alors que ChatGPT a marqué l’année écoulée en tant que leader incontesté, Gemini s’annonce comme une force nouvelle, prête à redéfinir les normes de l’IA et à ouvrir la voie à des applications plus avancées et diversifiées. L’avenir de l’IA est en constante évolution, et le paysage concurrentiel entre ChatGPT et Gemini promet d’apporter des avancées stimulantes pour les utilisateurs et les développeurs du monde entier.

 

Images @Google