Après la traduction du chinois vers l'anglais en septembre, Google Traduction exploite maintenant un système de réseau neuronal pour les interactions de huit langues avec l'anglais. Le but affiché : traduire des phrases entières plutôt que des mots.
Google affirme que son avenir est dans l'intelligence artificielle, l'entreprise tente donc d'en intégrer partout où elle le peut. Le groupe de Mountain View vient d'annoncer l'usage d'un système de réseau neuronal pour la traduction de huit langues vers et depuis l'anglais dans Google Traduction, à savoir l'allemand, le chinois, le coréen, l'espagnol, le français, le japonais, le portugais et le turc. De quoi couvrir de nombreuses combinaisons, qui représenteraient 35 % des requêtes sur le service, parmi les 10 000 possibilités que propose le service.
Un réseau neuronal à entrainer
Cette annonce suit de deux mois celle d'un premier essai en production de ce système « neuronal », pour la traduction du chinois vers l'anglais, estimée difficile par Google. Ce test grandeur nature accompagnait la publication d'un article de recherche, qui décrivait une nouvelle méthode de traduction à partir de ces fameux réseaux neuronaux. Ceux-ci auraient montré une pertinence équivalente aux outils précédents, même en étant entrainés sur un corpus réduit.
L'idée principale est de ne plus fonctionner par mot ou expression, comme auparavant, mais de considérer chaque phrase comme un bloc à traduire. Pour les chercheurs, l'intérêt est bien entendu de fournir des phrases plus naturelles, avec une grammaire bien plus correcte qu'avec les systèmes classiques. L'outil passant de mot en mot pour déterminer le sens de la phrase, puis pondère le sens de chaque mot pour choisir les plus pertinents et les réorganiser, jusqu'à donner une phrase dans l'autre langue.
Lors d'une table ronde en mars dernier sur l'intelligence artificielle (voir notre compte rendu), Yann LeCun – patron de l'intelligence artificielle chez Facebook – expliquait sa vision des choses, qui est exactement la même : « on prend un texte en anglais, on le passe dans un réseau récurrent, qui extrait un long vecteur qui représente le sens de la phrase, et ensuite un autre réseau récurrent régurgite la phrase dans une autre langue, par exemple le français ».
Encore du travail pour des traductions de textes longs
Tout n'est pas encore parfait, comme le dit sans détour Google. « Google Neural Machine Translation (GNMT) est toujours capable d'erreurs importantes qu'un traducteur humain ne ferait jamais, comme oublier des mots, mal traduire des noms propres ou des mots inhabituels, ou encore traduire une phrase de manière isolée plutôt qu'en l'incluant dans le contexte du paragraphe ou de la page » reconnaissait l'entreprise en septembre.
Le GNMT est directement utilisable via les applications et le site web de Google Traduction. Il est aussi proposé via la Cloud Translation API, dont les prix ont été revus à la baisse hier. De nouvelles capacités « cloud » doivent être proposées dès l'an prochain aux entreprises, promet le groupe.
Google n'est pas le seul à se pencher sur cette solution. Yann LeCun affirmait que les réseaux de neurones proposent des performances un peu plus élevées que les systèmes actuels, mais qu'elle n'est pas encore largement utilisée, car elle demande plus de puissance de calcul et revient donc plus cher. Il ajoutait par contre qu'il était probable que cela arrive d'ici peu.