Un pas décisif pour la reconnaissance logicielle des éléments d'une photo

2 girls, 1 cup 96
En bref
image dediée
Crédits : Sergey Nivens/iStock/Thinkstock
Services
Marc Rees

Si la reconnaissance faciale est désormais une réalité, un pas de plus vient d’être franchi en matière d'intelligence artificielle. Des chercheurs de l’université Stanford et de Google (Oriol Vinyals, Alexander Toshev, Samy Bengio et Dumitru Erhan) sont parvenus chacun de leur côté à mettre au point un modèle capable de détecter automatiquement le contenu d’une photo.

Prenez une photo de deux pizzas posées sur un four, et ce futur logiciel vous dira « deux pizzas posées sur le haut d’un four ». Deux chiens jouant dans un parc ? « Deux chiens jouant dans un parc avec des arbres et de l’herbe verte ». Si une image vaut mille mots, il s’agit ici de décrire textuellement ce qui peut être observé.

Les retombées sont évidemment multiples. Google pourra par exemple aiguiser la classification et l’archivage des images. L’internaute pourra par exemple rechercher l’intégralité des photos référencées comportant un chapeau, un éléphant et/ou un stylo. « Je considère les pixels d’une image ou d’une vidéo à la matière noire d’Internet » commente dans le New York Times Fei-Fei Li, le directeur du laboratoire d’Intelligence artificielle de l’Université de Stanford. « Nous allons maintenant commencer à l’éclairer. »

Google Standford reconnaissance images

Ces avancées pourraient selon d’autres scénarios également aiguiser les solutions de reconnaissance faciale sous l’angle de la sécurité. En 2012, nous rapportions qu’une équipe japonaise avait réussi à mettre au point un logiciel capable d’identifier en une seconde un visage sur 36 millions de références dans une base de données. Le New York Times estime aujourd’hui que dans quelques années, il sera possible non seulement d’identifier des visages, mais également « certains types de comportements, et peut-être même alerter automatiquement les autorités. » 

Google Standford reconnaissance images

Science-fiction ? Avec une telle solution on peut pratiquement envisager un sérieux coup de main pour les personnes souffrant de déficience visuelle. Ces fils d’Ariane accompagneront en effet ces personnes dans leur découverte du web par un logiciel décrivant ce qu’ils sont dans l’incapacité de voir. On pourra découvrir ces recherches d’intelligence artificielle sur cette page (Google) et celle-ci (Université de Standford).


chargement
Chargement des commentaires...