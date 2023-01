Tricherie aux examens, outil facile de rédaction et de création… Depuis plusieurs semaines, ChatGPT anime les discussions. Autant de débats qui ravivent de vieilles angoisses et appellent à un brin d'explication : de quoi est capable, au juste, ce genre de machines adeptes de conversation ?

Le 30 novembre 2022, bruissement sur les réseaux : OpenAI vient de sortir ChatGPT, un agent conversationnel créé et affiné à partir de son modèle de langage (large language model, LLM) GPT-3. Sous réserve de s’identifier sur la plateforme, n’importe qui peut aller discuter à l’écrit avec la machine en anglais, en français, en chinois et dans un vaste choix d’autres langues.

Rapidement, l’outil provoque des réactions contrastées. Des cas de tricherie sont rapportés depuis les écoles ou les facultés, l’une des plus prestigieuses conférences sur l’intelligence artificielle interdit l’usage de modèles de langage pour rédiger des articles scientifiques… Pendant ce temps, sur les réseaux, la communauté de l’intelligence artificielle débat ardemment des capacités réelles de ces machines. L’un des inventeurs de l’apprentissage profond, Yann LeCun, souligne par exemple que le langage a évolué de sorte à être facilement traité et compris par des réseaux de neurones biologiques. Rien ne l’empêcherait, dans ce cas, d’être abordé de la même manière par des réseaux de neurones artificiels.

Mais cette comparaison suffit-elle vraiment à considérer que le langage est parfaitement négocié, compris, intégré par ces machines ? Pour la linguiste Emily Bender, le spécialiste des technologies du langage Roger K. Moore et d’autres, c'est une vision bien trop simpliste de ce qu’est la langue – un peu comme lorsque le spectre de la conscience des machines avait été soulevé par l’un des ingénieurs de Google, en juin dernier.

ChatGPT, petit dernier d’une série d’innovations

Quel que soit le ou la scientifique que l’on interroge néanmoins, tout le monde admet que les résultats de ChatGPT sont impressionnants. Directeur de recherche à l’Inria, Serge Abiteboul les qualifie de « bluffants ». Chercheuse au sein de l’équipe Machine Learning and Information Access (MLIA) de l’Institut des systèmes intelligents et de robotique, Laure Soulier salue « ses performances en termes de génération de langage et en dialogue ». ChatGPT serait une sorte d'aboutissement des multiples progrès des dernières années – avant qu'une nouvelle technologie ne vienne le détrôner.

En 2017, une première rupture a eu lieu avec les modèles Transformer, comme le modèle BERT de Google. « Avant, on essayait de capturer le sens des mots, puis de les associer, rappelle Laure Soulier. Avec les Transformers, on a pu faire réaliser des tâches beaucoup plus génériques aux modèles de traitement du langage : des questions réponses, de la détection d’entités nommées [chercher des mots ou groupes de mots dans un corpus, ndlr], de la génération de texte… »

Deux ans plus tard, nouvelle rupture : des modèles comme les Generative Pre-Trained Transformers d’OpenAI (GPT-2 et GPT-3, en particulier) se mettent à fonctionner sur la base d’instructions (prompts). « Cela permet d’ajouter du contexte aux échanges d’informations, indique la chercheuse en éthique de l’intelligence artificielle au CNRS Giada Pistilli. Si, par exemple, vous lui avez demandé plus tôt quelle était la capitale de l’Italie et que dans une nouvelle phrase, vous lui demandez où trouver les meilleures pizzas, il sera capable de faire le lien. »

S'il s’agissait jusque-là de faire en sorte que la machine comprenne le sens d’un mot ou d’une phrase, désormais, on peut la faire dialoguer avec l’utilisateur, car elle peut analyser son propos, aller chercher des informations correspondantes et formuler une réponse cohérente.

Reproduire le langage, est-ce acquérir une forme de conscience ?