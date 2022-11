Une équipe de Meta AI a travaillé pendant plusieurs années sur une intelligence artificielle, Cicero, jouant au jeu de plateau Diplomatie. Résultat, après 40 parties anonymes en ligne, Cicero s'est classée dans les 10 % meilleurs joueurs ayant effectué plus d'une partie, avec une moyenne atteignant plus du double de celle des joueurs humains.

Après Deep Blue, AlphaGo, Nook et AlphaStar, voici Cicero qui rentre dans le game des IA joueuses. Cicero, elle, joue au fameux jeu de plateau Diplomatie. Et plutôt avec succès puisqu'elle arrive à être classée dans les 10% des meilleurs joueurs du site WebDiplomacy. Une équipe de Meta AI vient de publier un article dans la revue Science expliquant son fonctionnement.

Jouer aux échecs, au go, au bridge ou à StarCraft, comme ces autres avaient réussi à le faire à un bon niveau reste impressionnant.

Mais pour réussir à faire une IA qui joue à un bon niveau aux échecs ou au go, deux jeux où aucune information n'est cachée, il « suffit » d'utiliser l'apprentissage profond, et l'apprentissage par renforcement qui apprennent en jouant contre eux-mêmes avec une capacité de calcul et de modélisation suffisante.

Pour le bridge, les chercheurs de la start-up française Nukkai avaient utilisé des simulations de Monte-Carlo, outils mathématiques qui estiment les résultats possibles d'un événement incertain, optimisées avec de petits réseaux de neurones, ce qui leur avait permis d'être beaucoup moins énergivore qu'AlphaGo.

Pour StarCraft, les chercheurs qui ont bâti AlphaStar, qui a mis une déculottée à deux joueurs pros, ont dû ajouter à l'apprentissage profond et à l'apprentissage par renforcement, la théorie des jeux et des algorithmes évolutionnistes.

Diplomatie, un jeu plus complexe

Mais ces jeux restent des jeux où il n'y a pas de communication, ni de concertation à avoir avec les autres joueurs. L'équipe de Meta AI a voulu s'attaquer à un jeu plus complexe, Diplomatie.

Ce jeu mêle stratégie, discussions avec les autres joueurs, collaboration et... trahisons aux bons moments. Les bases du jeu sont que sept joueurs (représentant l'Angleterre, la France, l'Allemagne, l'Italie, l'Autriche-Hongrie, la Russie et la Turquie) mènent des négociations privées (en chat pour la version en ligne WebDiplomacy sur laquelle a joué Cicero) pour coordonner leurs actions afin de coopérer et de rivaliser les uns avec les autres en donnant des ordres à leurs unités militaires sur un plateau de jeu qui reprend la carte de l'Europe.

Allier raisonnements stratégiques et modèle de langage