Vous n'avez pas encore de notification

Page d'accueil

Options d'affichage

Abonné

Actualités

Abonné

Des thèmes sont disponibles :

Thème de baseThème de baseThème sombreThème sombreThème yinyang clairThème yinyang clairThème yinyang sombreThème yinyang sombreThème orange mécanique clairThème orange mécanique clairThème orange mécanique sombreThème orange mécanique sombreThème rose clairThème rose clairThème rose sombreThème rose sombre

Vous n'êtes pas encore INpactien ?

Inscrivez-vous !
NVIDIA GameGAN : une IA apprend les règles de Pac-Man et le reconstitueCrédits : ilbusca/iStock

C'est à l'occasion des 40 ans du jeu que l'entreprise américaine a dévoilé ce projet de recherche, en partenariat avec l'université de Toronto, le Vector Institute, le MIT et Bandai Namco. Il a même droit à son site dédié et une vidéo de présentation. La publication doit être diffusée dans la journée.

Pour faire simple, un réseau antagoniste génératif (GAN) a été entraîné dans le but de lui faire comprendre les règles de Pac-Man, afin qu'il puisse ensuite reconstituer le jeu. C'était chose faite en quelques jours avec quatre GV100 (Volta). Pour cela, GameGAN a dû s'enquiller pas moins de 50 000 sessions de jeu.

NVIDIA ayant entraîné une IA pour le faire, jouant de manière presque parfaite, ce qui n'est pas sans impact sur le résultat et les règles déduites. Le travail continue donc, le jeu tel que généré pourrait être disponible cet été. Mais attention, il y a une subtilité. Car même si beaucoup pensent qu'une IA est un principe presque magique, ce n'est pas le cas.

Ainsi, GameGAN n'a pas recréé Pac-Man à proprement parler, ou son code. Il a simplement appris à afficher des images correspondant à celles du jeu à l'écran. Il les fait évoluer en fonction des commandes enregistrées depuis un clavier ou une manette. Un outil qui saura montrer son utilité au-delà des jeux vidéo.

NVIDIA évoque ainsi la possibilité pour une IA de déduire certaines règles suite à l'observation d'une série de vidéos, pour la conduite autonome par exemple. Attention tout de même aux ratés, car il faudra lui apprendre à faire la différence entre les règles et les bonnes ou mauvaises habitudes de conduite...

16 commentaires
Avatar de Minikea INpactien
Avatar de MinikeaMinikea- 25/05/20 à 09:02:23

et si on tente des actions qu'il n'a pas rencontré lors de son entraînement, ça doit donner des trucs bizarres! ^^
(genre appuyer sur une touche qui faisait pas partie du panel de touches disponibles ou bien entrer le konami code :troll: )

Avatar de tazvld Abonné
Avatar de tazvldtazvld- 25/05/20 à 09:47:29

Techniquement, le réseau (ici on n'a besoin que du générateur) affiche ce qui est le plus probable à afficher sachant :

  • l'input

  • l'image précédente

  • une mémoire interne (si besoin)

  • une valeur aléatoire (potentiellement ça peut servir de RNG)

    A voir si les comportement des fantômes sont respecté. Je sais qu'ils sont assez complexe (le rouge te chasse, le rose et le bleu vont essayé de se placer devant , le orange bouge aléatoirement.) Faire de pathfinding 100% avec des réseau de neurone, je suis moyen chaud (je ne dis pas que c'est impossible, mais ce n'est ni le plus efficace, ni le plus sûr).

Avatar de XXC Abonné
Avatar de XXCXXC- 25/05/20 à 10:04:32

Quand on se rappelle que Pac Man tourne sur un pauvre Z80, on réalise a quel point l'IA est un enooooooome gâchis de ressources.

Avatar de Arnaud3013 Abonné
Avatar de Arnaud3013Arnaud3013- 25/05/20 à 11:00:19

Oui et non. Ici une IA a appris à partir d'actions, à recréer le jeu/règles.
Super utile si tu transfères cette technique sur d'autres domaines.
Une IA regarde ce que tu fait au travail et en déduit des règles -> knowledge management. On pourra ainsi transférer les connaissances acquises à quelqu'un d'autre.

Avatar de Patch INpactien
Avatar de PatchPatch- 25/05/20 à 11:41:35

tazvld a écrit :

Techniquement, le réseau (ici on n'a besoin que du générateur) affiche ce qui est le plus probable à afficher sachant :

  • l'input

  • l'image précédente

  • une mémoire interne (si besoin)

  • une valeur aléatoire (potentiellement ça peut servir de RNG)

    A voir si les comportement des fantômes sont respecté. Je sais qu'ils sont assez complexe (le rouge te chasse, le rose et le bleu vont essayé de se placer devant , le orange bouge aléatoirement.) Faire de pathfinding 100% avec des réseau de neurone, je suis moyen chaud (je ne dis pas que c'est impossible, mais ce n'est ni le plus efficace, ni le plus sûr).

A ce que j'ai pu lire ailleurs, pas totalement, l'IA a du mal à assimiler les caractères de chacun.

Avatar de XXC Abonné
Avatar de XXCXXC- 25/05/20 à 11:56:52

Est-ce que la ré-implémentation des connaissances acquise tourne sur un Z80 avec 64K de RAM, j'en doute :non:
On apprends les règles, mais apprend t'on a les implémenter de façon optimale ?
Je serait curieux de connaitre l'ordre de grandeur de complexité entre la version originale et la version apprise.

Pour le transfert de connaissances, si le résultat coute plus cher en énergie/HW qu'un salaire de misère, le beancounter en restera a la méthode actuelle : l'employé surpayé expliquera a N employés sous-payés son boulot, avant de se faire virer, mème si ça ne fait gagner que 10%.

A moins que tu ne penses a une ré-implémentation d'outils métier tournant sur windows 95 dont on a perdu le source et qu'on cherche a maintenir pour éviter la faillite de l'entreprise :mdr:

Avatar de tazvld Abonné
Avatar de tazvldtazvld- 25/05/20 à 13:42:51

Si tu veux recréer un programme ex nihilo, ça sera toujours plus simple, fiable, moins coûteux et efficace de le réécrire. (ça me rappelle d'une interview de mecs qui devait porter des jeux vidéos sur d'autre console : il n'avaient pour seul matériel que la cartouche du jeu sur la console originale, il devait alors tout déduire de là, tout recréer.)

Non, ici, derrière cette démo, ça montre que l'on peut reproduire un modèle d'un phénomène avec une certaine fiabilité sans avoir à comprendre les règles qui le régisse. Le Pacman ou le Doom, c'est juste un exemple débile sans intérêt final autre que démontrer la faisabilité et explorer les limites du bousin. ce sont des phénomène que l'on comprend très bien (on a le code) qui font de bon "jouets" pour tester.

Avatar de XXC Abonné
Avatar de XXCXXC- 25/05/20 à 14:40:44

Je comprends bien que c'est un exemple débile. Mais l'original restent ridiculement simple pour une complexité énorme de la copie.

Je doute d’ailleurs que doom soit a la porté de cette AI dans une configuration similaire.
Et tout le problème est bien la : on cherche a modéliser un problème qu'on ne comprends pas et on utilise une méthode brute-force pour le reproduire.

Ici on apprends surtout, car on comprend le problème, que la solution AI est un énorme gâchis de ressource par rapport a ce qui est réellement nécessaire tout en n’étant mème pas sur d'avoir couvert tout les aspect du problème.

Bref, du marketing pour vendre, pas une solution.

Avatar de 127.0.0.1 INpactien
Avatar de 127.0.0.1127.0.0.1- 25/05/20 à 14:44:56

Quand un projet de recherche utilise "pacman" ou "doom" comme preuve, vous êtes pratiquement certain que l'objectif était de faire le buzz pour obtenir des financements et pas de faire avancer la recherche. :D

Avatar de Winderly Abonné
Avatar de WinderlyWinderly- 25/05/20 à 15:27:44

"This enables many interesting applications such as swapping different
components of the game to build new games that do not exist"
:mdr2:
Ça existe depuis longtemps.
Il suffit de voir la multitude de "fps" qui sont des clones.

Il n'est plus possible de commenter cette actualité.
Page 1 / 2