OpenAI : une intelligence artificielle entraînée avec des images de synthèses et de la VR

Bonjour, je m'appelle Skynet 5
Accès libre
image dediée
Crédits : iLexx/iStock
Nouvelle Techno
Par
le mercredi 17 mai 2017 à 14:00
Sébastien Gavois

OpenAI présente un algorithme capable de reproduire une série d'actions. Rien de bien nouveau là-dedans, si ce n'est que l'apprentissage de l'intelligence artificielle s'est fait avec des images de synthèse et une scène d'exemple filmée en réalité virtuelle.

OpenAI est une alliance ouverte est lancée il y a près d'un an et demi. Comme son nom l'indique, elle s'intéresse à la recherche sur l'intelligence artificielle – un domaine très vaste – avec l'idée de financer des travaux sur ce sujet. « Les chercheurs seront fortement encouragés à publier leurs travaux, qu’il s’agisse de comptes-rendus, de billets de blog ou de code » expliquait l'organisation lors de son lancement.

C'est aujourd'hui le cas avec un billet de blog, baptisé « Les robots qui apprennent ». La vingtaine de scientifiques qui ont participé au développement de ce projet le résument de la manière suivante : « Nous avons créé un système robotique, entièrement entrainé dans des simulations et déployé sur un robot physique, qui peut apprendre une nouvelle tâche après l'avoir vue une seule fois ».

Une intelligence artificielle de reconnaissance d'images entrainée sur des simulations

Habituellement, pour effectuer de la reconnaissance d'image il faut donner à un réseau de neurones « quelques millions ou quelques milliards mêmes d'exemples pour s'entrainer [...] et reconnaitre chaque objet prend quelques milliards d'opérations » expliquait Yann LeCun, spécialiste du sujet et patron de l'intelligence artificielle chez Facebook. Récupérer de tels jeux de données peut être relativement coûteux, surtout quand on n'est pas un réseau social sur lequel des millions d'informations s'échangent chaque jour.

Pour contourner ce problème, OpenAI propose une approche différente. Le 1er avril (et ce n'était pas un poisson), l'organisation publiait un billet de blog afin d'annoncer « la première IA au monde de détection de Spam [NDLR : une boîte de conserve avec de la viande précuite] entièrement entrainée en simulation et déployée sur un robot physique ».

Pour arriver à des résultats satisfaisants, les scientifiques expliquent qu'ils génèrent par ordinateur de très nombreux exemples d'images en changeant de manière aléatoire les couleurs, les textures, les conditions d'éclairage, les paramètres de la caméra, etc.

Quand un ordinateur apprend à un ordinateur

Un ordinateur s'occupe donc de créer de très nombreuses scènes virtuelles afin d'entrainer une intelligence artificielle, qui sera ensuite capable de détecter un objet dans la vie réelle, ce dès sa première utilisation. Nous ne sommes évidemment pas en face d'une intelligence artificielle forte, mais toujours d'une intelligence artificielle faible. La différence, étant qu'un ordinateur s'occupe de générer des images (via des algorithmes définis par les scientifiques) afin d'entrainer une IA, au lieu de se baser sur des photos.

OpenAI précise que son algorithme fonctionne également lorsque des objets qu'il n'a jamais rencontrés auparavant sont ajoutés. L'intelligence artificielle les laisse simplement de côté pour se concentrer sur sa tâche première.

Afin d'obtenir de plus amples informations, vous pouvez consulter cette publication scientifique sur arXiv.

Une démonstration en VR, que le robot reproduit dans la vie réelle

Ce « réseau de vision » constitue la première étape de l'annonce du jour d'OpenAI. Une fois les éléments identifiés, encore faut-il pouvoir reproduire une série d'actions : c'est le rôle du « réseau d'imitation ». Là encore, les scientifiques travaillent dans un monde virtuel, avant de transposer la situation à la vie réelle.

Pour s'entrainer, cette seconde intelligence artificielle étudie des dizaines de tâches différentes, avec des milliers de démonstrations pour chacune d'entre elles. Elle reçoit ensuite une et une seule observation d'une série d'actions (en rapport avec les tâches étudiées bien évidemment) réalisées en réalité virtuelle par une personne.

Grâce à son apprentissage supervisé, elle sera en mesure de « prédire quelles actions ont été prises durant cette observation » et donc de les reproduire affirme OpenAI.

OpenAI VR

Une démonstration avec des blocs et des situations initiales différentes

Dans la vidéo ci-dessous, il est par exemple question d'empiler des blocs de différentes couleurs en suivant une certaine logique. À partir d'une seule démonstration en réalité virtuelle, le bras robotisé sera capable de reproduire le résultat final, même si la situation de départ (position des blocs) est différente. Là encore, une publication scientifique est disponible pour tous les détails techniques.

Pour résumer, OpenAI présente donc une intelligence artificielle qui s'est entrainée sur des modèles virtuels et a été capable de reproduire, dans la vie réelle, une série d'actions qu'elle n'a vue qu'une seule fois (et qui étaient réalisées en VR par un humain).

Il ne s'agit pour le moment que d'empiler quelques blocs de couleurs différentes, mais nul doute que les débouchés sont certainement bien plus nombreux.


chargement
Chargement des commentaires...