« Imaginez si le Hulk des modèles de langues et l’IA de Tony Stark Jarvis avaient un enfant… Boom ! Voici Gemini. » En ligne, les fans de tech ne tarissent pas d’éloge pour le système d’intelligence artificielle générative de Google, et ce avec forces références de pop culture plus ou moins heureuses.

Mais comment fonctionne le modèle multimodal Gemini ? Quelles sont ses spécificités ? Mérite-t-il tous les superlatifs avant même sa sortie ?

Le précédent ChatGPT tendrait à nous convaincre que la nuance serait plus adaptée : si le modèle génératif d'OpenAI a dépassé les 100 millions d’utilisateurs dès janvier 2023 (ce qui en a fait l’application à la croissance la plus rapide juste avant que Threads de Meta ne batte ce record), sa fréquentation a stagné dès le mois de mai puis commencé à chuter en juin. Par ailleurs, le modèle d’OpenAI n’est pas exempt de risque et a même donné quelques signes de régression.

Du côté de Gemini, peu d’informations ont filtré. Le 14 septembre, toutefois, the Information révélait que Google aurait donné un accès anticipé à une version de son logiciel à une poignée d’entreprises. Cela pourrait indiquer que la firme se rapproche d’un lancement du produit dans ses outils à destination des consommateurs et des entreprises (via ses offres cloud).

Réunion de Google Brain et DeepMind