Google Traduction passe à un réseau neuronal pour 8 langues, dont le français

Google Traduction passe à un réseau neuronal pour 8 langues, dont le français

Mon IA is rich

Avatar de l'auteur
Guénaël Pépin

Publié dans

Internet

16/11/2016 3 minutes
50

Google Traduction passe à un réseau neuronal pour 8 langues, dont le français

Après la traduction du chinois vers l'anglais en septembre, Google Traduction exploite maintenant un système de réseau neuronal pour les interactions de huit langues avec l'anglais. Le but affiché : traduire des phrases entières plutôt que des mots.

Google affirme que son avenir est dans l'intelligence artificielle, l'entreprise tente donc d'en intégrer partout où elle le peut. Le groupe de Mountain View vient d'annoncer l'usage d'un système de réseau neuronal pour la traduction de huit langues vers et depuis l'anglais  dans Google Traduction, à savoir l'allemand, le chinois, le coréen, l'espagnol, le français, le japonais, le portugais et le turc. De quoi couvrir de nombreuses combinaisons, qui représenteraient 35 % des requêtes sur le service, parmi les 10 000 possibilités que propose le service.

Un réseau neuronal à entrainer

Cette annonce suit de deux mois celle d'un premier essai en production de ce système « neuronal », pour la traduction du chinois vers l'anglais, estimée difficile par Google. Ce test grandeur nature accompagnait la publication d'un article de recherche, qui décrivait une nouvelle méthode de traduction à partir de ces fameux réseaux neuronaux. Ceux-ci auraient montré une pertinence équivalente aux outils précédents, même en étant entrainés sur un corpus réduit.

L'idée principale est de ne plus fonctionner par mot ou expression, comme auparavant, mais de considérer chaque phrase comme un bloc à traduire. Pour les chercheurs, l'intérêt est bien entendu de fournir des phrases plus naturelles, avec une grammaire bien plus correcte qu'avec les systèmes classiques. L'outil passant de mot en mot pour déterminer le sens de la phrase, puis pondère le sens de chaque mot pour choisir les plus pertinents et les réorganiser, jusqu'à donner une phrase dans l'autre langue.

Lors d'une table ronde en mars dernier sur l'intelligence artificielle (voir notre compte rendu), Yann LeCun – patron de l'intelligence artificielle chez Facebook – expliquait sa vision des choses, qui est exactement la même : « on prend un texte en anglais, on le passe dans un réseau récurrent, qui extrait un long vecteur qui représente le sens de la phrase, et ensuite un autre réseau récurrent régurgite la phrase dans une autre langue, par exemple le français ».

Encore du travail pour des traductions de textes longs

Tout n'est pas encore parfait, comme le dit sans détour Google. « Google Neural Machine Translation (GNMT) est toujours capable d'erreurs importantes qu'un traducteur humain ne ferait jamais, comme oublier des mots, mal traduire des noms propres ou des mots inhabituels, ou encore traduire une phrase de manière isolée plutôt qu'en l'incluant dans le contexte du paragraphe ou de la page » reconnaissait l'entreprise en septembre.

Le GNMT est directement utilisable via les applications et le site web de Google Traduction. Il est aussi proposé via la Cloud Translation API, dont les prix ont été revus à la baisse hier. De nouvelles capacités « cloud » doivent être proposées dès l'an prochain aux entreprises, promet le groupe. 

Google n'est pas le seul à se pencher sur cette solution. Yann LeCun affirmait que les réseaux de neurones proposent des performances un peu plus élevées que les systèmes actuels, mais qu'elle n'est pas encore largement utilisée, car elle demande plus de puissance de calcul et revient donc plus cher. Il ajoutait par contre qu'il était probable que cela arrive d'ici peu.

Écrit par Guénaël Pépin

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Un réseau neuronal à entrainer

Encore du travail pour des traductions de textes longs

Fermer

Commentaires (50)


C’est déjà en place ? Parce que j’ai fait quelques tests en faisant des copier/coller et les traductions proposées étaient très bien !


“huit” langues dans Google Traduction, à savoir




  1. l’allemand,

  2. l’anglais,

  3. le

    chinois,

  4. le coréen,

  5. l’espagnol,

  6. le français,

  7. le japonais,

  8. le portugais

    et

  9. le turc.



    :)


Il y a quelques jours, il y avait à l’intérieur de l’article un anglais un “encart” particulièrement bien traduit. 

Le reste était plus chaotique. Cela m’avait marqué car je ne comprenais pas cet écart entre le reste de l’article et l’extrait cité en encart. Je pense qu’ils devaient le beta tester. 








emilrx a écrit :



“huit” langues dans Google Traduction, à savoir 

 1. l’allemand, 

 2. l’anglais, 

 3. le 

chinois, 

 4. le coréen, 

 5. l’espagnol, 

 6. le français, 

 7. le japonais, 




  1. le portugais 

     et 

     9. le turc. 



    :)



    La traduction de l’annonce de Google aurait plutôt dû être faite ainsi : 

    “pour la traduction de huit langues vers et depuis l’anglais dans Google Traduction, à savoir l’allemand, l’anglais, le chinois, le coréen, l’espagnol, le français, le japonais, le portugais et le turc.”



Ahh… ca va pouvoir aider notre président qui ne parle même pas couramment plusieurs langues… Je l’image bien avec Google Trad et le smartphone quand il est au téléphone avec Angela&nbsp;<img data-src=" />&nbsp;<img data-src=" />



Plus sérieusement, c’est une plutôt bonne nouvelle l’IA sur ce point. Parce que traduire une page entière avec Google Trad, parfois ca ne veut pas dire grand chose :)








dvr-x a écrit :



Ahh… ca va pouvoir aider notre président qui ne parle même pas couramment plusieurs langues… Je l’image bien avec Google Trad et le smartphone quand il est au téléphone avec Angela&nbsp;<img data-src=" />&nbsp;<img data-src=" />





Aïe wante ze chomagen toux stop!

Oh doux you doux Angela?



Wahou, en testant un texte issu de wikipedia version anglaise, le resultat est assez impressionnant. Difficile de détecter que le texte a été écrit par un algo !


Faites le test sur la page de l’API : il y a l’ancienne version et la nouvelle avec IA pour comparer, c’est assez bluffant



https://cloud.google.com/translate/








dvr-x a écrit :



Ahh… ca va pouvoir aider notre président qui ne parle même pas couramment plusieurs langues… Je l’image bien avec Google Trad et le smartphone quand il est au téléphone avec Angela <img data-src=" /> <img data-src=" />



Plus sérieusement, c’est une plutôt bonne nouvelle l’IA sur ce point. Parce que traduire une page entière avec Google Trad, parfois ca ne veut pas dire grand chose :)





Sont là, pour cela les fonctionnaires des affaires étrangères.

Préfère des gens professionnel sur des sujets assez important.



<img data-src=" />

<img data-src=" />


Cela fait déjà 2 semaines que la mise à jour est en place, la qualité de la traduction est clairement en hausse&nbsp;


Très intéressant comme évolution ! la prochaine étape c’est la traduction vocal <img data-src=" />








Glursh a écrit :



La&nbsp;traduction de l’annonce de Google aurait plutôt dû être faite ainsi :&nbsp;



 "pour la traduction de huit langues vers et depuis l'anglais dans Google Traduction, à savoir l'allemand, l'anglais, le chinois, le coréen, l'espagnol, le français, le japonais, le portugais et le turc."







Donc, si je comprends bien, pas de traduction français-allemand, espagnol-japonais, etc ? Sauf en passant par l’anglais mais, si c’est le cas, la qualité doit se dégrader au passage.

&nbsp;



coréen et turc ?

Mais quels sont donc leurs critères de sélection de langue ?



Ce n’est assurément pas la grandeur de la population qui emploie la langue. <img data-src=" />

Pour le coréen … avec tous les constructeurs NTIC coréens, je peux comprendre.

Mais le turc ???


Ennemi (militaire et/ou commercial)et dans certain des bases américaines.<img data-src=" />








luxian a écrit :



coréen et turc ?

Mais quels sont donc leurs critères de sélection de langue ?



Ce n’est assurément pas la grandeur de la population qui emploie la langue. <img data-src=" />

Pour le coréen … avec tous les constructeurs NTIC coréens, je peux comprendre.

Mais le turc ???





Peut-être bien les volumes de traduction actuels et les volumes de textes facilement disponibles pour alimenter l’IA









Serge Knopf a écrit :



Donc, si je comprends bien, pas de traduction français-allemand, espagnol-japonais, etc ? Sauf en passant par l’anglais mais, si c’est le cas, la qualité doit se dégrader au passage.







Je comprend la même chose. En fait çà pourrait tout de même aller si la traduction est parfaite…

Peut-être qu’une fois le réseau neural entrainé, il sera possible de se passer de l’étape de/vers anglais.



hummmm

Il n’y aurait donc aucun intérêt à fournir un outil de compréhension entre les êtres humains … mais la motivation ne serait que la communication militaire ?



… bon, alors il faut chercher l’URL cachée de google/trans qui traduira le russe <img data-src=" />


Merci. Effectivement l’article a été modifié pour bien évoquer que c’est depuis et vers l’anglais.&nbsp;<img data-src=" />


Ah je vois que l’humour ne passe plus chez NXi. Entre la modération qui devient n’importe quoi et les articles en baisse de qualité… finalement j’aurai peut-être pas du renouveler autant mon abonnement.


Si ça peut nous éviter des chefs d’oeuvre comme Jambonlaissé, c’est pas plus mal <img data-src=" />


Peut-être effet ricochet du à l’insulte à peine déguisé du 3ème commentaire.


Je sais pas je suis arrivé après la bataille sur ce coup là <img data-src=" />


C’est bien gentil l’humour, mais c’est un peu la réponse facile quand on se fait modérer (et à juste raison). Un peu plus de contrôle en amont serait salvateur. Pour ce qui est de la baisse de qualité des articles, tu peux nous envoyer un email pour nous exposer ton point de vue, parce qu’il peut en ressortir une discussion très constructive sur le sujet. Sinon c’est une attaque gratuite, et ce n’est pas l’endroit de toute manière pour en discuter.


vas y vincent, sword lui son poste ‘inutile’



<img data-src=" />



je suis avec vous, mais pas abonné&nbsp;<img data-src=" />


Wow



Je viens de tester en copiant collant des commentaires de PCI. Rien qui ne vole très haut on s’entend.



La traduction proposée m’a bluffer.


Si disons dans 10 15 ans cela traduit en direct la voix et les textes, cela risque de tuer les emplois de traducteurs et doubleurs, et certains blog journalistique.<img data-src=" /> (Espérons que l’on pourra voir directement et facilement certaines chaines étrangères)<img data-src=" /> Bon, pour le Pron, cela ne sera pas vraiment nécessaire.<img data-src=" />


Coréen : très difficile à traduire car plusieurs graphies et grammaire speciale.

Turc : langue particulière, avec un alphabet fortement latin.


Mail envoyé à la rédaction (via le formulaire) <img data-src=" />



Pour l’humour, oui c’est facile d’utiliser cet argument. mais çà ne veut pas dire qu’il n’est pas valable pour autant dans tous les cas. Sinon picatrix ne serait plus parmis nous depuis longtemps <img data-src=" />


&nbsp;il traduit “wesh gros” en “hi man” <img data-src=" />

sisi la famille quoi.








le-gros-bug a écrit :



&nbsp;il traduit “wesh gros” en “hi man” <img data-src=" />

sisi la famille quoi.





<img data-src=" />



Bientôt Google Traduction pour faire communiquer MamieDu15 avec son Jean-Kévin de petit-fils









jackjack2 a écrit :



Faites le test sur la page de l’API : il y a l’ancienne version et la nouvelle avec IA pour comparer, c’est assez bluffant



https://cloud.google.com/translate/





Le mot bluff est utilisé au poker quand un joueur cherche à tromper ou à abuser ses partenaires. Je ne suis pas certain que ce soit le terme approprié dans ce cas.

<img data-src=" />



Mais hors du contexte du poker, un sens supplémentaire est apparu au mot pour dire “Étonner, épater”

https://fr.wiktionary.org/wiki/bluffer





Envoyé à quelle heure ? je n’ai rien dans ma boîte








Mister White a écrit :



C’est déjà en place ? Parce que j’ai fait quelques tests en faisant des copier/coller et les traductions proposées étaient très bien !



Essaie avec Jeambonlaissé de Guillaume Remuepoire… Pardon, Hamlet de Sakespeare <img data-src=" />



Ah bah super, comme ça notre président va savoir dire “Au revoir” dans plusieurs langues.


“Pour beaucoup, l’automne est le début de la fin d’une autre saison d’équitation. Mais pour tout amateur de moto, l’automne est aussi le moment de l’année où l’on voit les fruits des départements R & D”





<img data-src=" /><img data-src=" /><img data-src=" />



mais sinon pour le reste c’est quasiment parfait <img data-src=" />


J’ai essayé. La vache, ça s’est carrément amélioré. Impressionnant !



Il y a juste deux ou trois petits détails à corriger sur un texte de 3 ou 4 paragraphes. C’est vraiment très bon.


Genre 10 minutes avant mon message ici :/

Honnêtement j’ai pas sauvegardé mon message… Je ne me vois pas le retaper.

Je suis passer par le formulaire de contact pourtant, et j’ai bien eu l’encart (vert il me semble) qui m’indiquait qu’il avait été transmis correctement.


J’ai testé en prenant un texte au hasard sur un site Internet américain



Hillary Clinton, in her first public speech since last week’s crushing presidential loss, admitted making the appearance “wasn’t the easiest.”

&nbsp;

But speaking at the Children’s Defense Fund’s “Beat The Odds” Gala on Wednesday night, Clinton emotionally reflected about the 2016 loss and how she wished she could tell her mother – who decades ago was abandoned as a child – that her struggles were worth it because of what her daughter had accomplished.&nbsp;

&nbsp;Traduit par :

Hillary Clinton, dans son premier discours public depuis la perte écrasante de la semaine dernière à la présidentielle, a admis faire l’apparition “n’était pas le plus facile.”



Clinton a émotionnellement réfléchi sur la perte de 2016 et comment elle aurait souhaité pouvoir dire à sa mère - qui, il ya des décennies, a été abandonnée comme un enfant - que ses luttes valaient la peine Cela à cause de ce que sa fille avait accompli.&nbsp;

&nbsp;C’est plutôt trop mal, à part :&nbsp;



 - la fin du 1er paragraphe "a admis faire l'apparition" : bof bof       

- un a collé à un y

- la fin du second paragraphe : soit on met un point avant Cela, soit on supprimer ce cela






 &nbsp;et surtout il manque tout le début du second paragraphe !       






 Pour comparaison, le même texte traduit avec Reverso       



Hillary Clinton, dans son premier discours public depuis la perte présidentielle écrasante de la semaine dernière, la fabrication admise de l’apparence “n’était pas la plus facile.”&nbsp;Mais parlant au Fonds de Défense D’enfant “Battu les Chances” de Gala dans la nuit de mercredi à jeudi, Clinton avec émotion reflété de la perte 2016 et comment elle a souhaité elle pourrait dire à sa mère - qui il y a les décennies ont été abandonnées comme un enfant - que ses luttes ont valu le coup à cause de ce que sa fille avait accompli.








heret a écrit :



Le mot bluff est utilisé au poker quand un joueur cherche à tromper ou à abuser ses partenaires. Je ne suis pas certain que ce soit le terme approprié dans ce cas.

<img data-src=" />





Le Larousse est-il en désaccord avec Capello ?

&nbsp;

Bluffant

Familier.&nbsp;Qui stupéfie, impressionne ; renversant&nbsp;:&nbsp;Une interprétation bluffante.&nbsp;Un spectacle bluffant, à la fois drôle et naturel.









Alkatrazze a écrit :



J’ai testé en prenant un texte au hasard sur un site Internet américain



Hillary Clinton, in her first public speech since last week’s crushing presidential loss, admitted making the appearance “wasn’t the easiest.”

 

But speaking at the Children’s Defense Fund’s “Beat The Odds” Gala on Wednesday night, Clinton emotionally reflected about the 2016 loss and how she wished she could tell her mother – who decades ago was abandoned as a child – that her struggles were worth it because of what her daughter had accomplished. 

 Traduit par :

Hillary Clinton, dans son premier discours public depuis la perte écrasante de la semaine dernière à la présidentielle, a admis faire l’apparition “n’était pas le plus facile.”



Clinton a émotionnellement réfléchi sur la perte de 2016 et comment elle aurait souhaité pouvoir dire à sa mère - qui, il ya des décennies, a été abandonnée comme un enfant - que ses luttes valaient la peine Cela à cause de ce que sa fille avait accompli. 

 C’est plutôt trop mal, à part : 



 - la fin du 1er paragraphe "a admis faire l'apparition" : bof bof       

- un a collé à un y

- la fin du second paragraphe : soit on met un point avant Cela, soit on supprimer ce cela






  et surtout il manque tout le début du second paragraphe !       






 Pour comparaison, le même texte traduit avec Reverso       



Hillary Clinton, dans son premier discours public depuis la perte présidentielle écrasante de la semaine dernière, la fabrication admise de l’apparence “n’était pas la plus facile.“ Mais parlant au Fonds de Défense D’enfant “Battu les Chances” de Gala dans la nuit de mercredi à jeudi, Clinton avec émotion reflété de la perte 2016 et comment elle a souhaité elle pourrait dire à sa mère - qui il y a les décennies ont été abandonnées comme un enfant - que ses luttes ont valu le coup à cause de ce que sa fille avait accompli.







Euh, t’en as oublié un paquet quand-même hein.





  • “depuis la perte écrasante”, mouais bof. Ça fait très mot-à-mot.

  • “n’était pas la plus facile”, non désolé, c’est pas correct. Enfin je veux dire, on comprend l’idée, mais ça ne se dit pas en français. C’est de l’anglais traduit mot à mot.

  • “émotionnellement réfléchi”, contresens, ce n’est pas ce que signifie “emotionally reflected”.

  • “et comment elle aurait souhaité”, traduction mot à mot.

  • “a été abandonné comme un enfant”, sérieux t’as pas vu le contresens là ? “as a child” dans le contexte ça veut dire “lorsqu’elle était enfant” (en fait on traduirait même plutôt par “quand elle était petite” pour sonner plus naturel en français). C’est pas une adulte qui a été abandonnée comme on abandonnerait un enfant hein.

  • “à cause de ce que” - non là c’est pas la bonne façon de traduire “because of”. Préférer “au vu de” ou “vu” ou “compte tenu de” ou quelque chose du genre. “à cause de” et “grâce à” sont hors de propos ici. Et “à cause de” est le pire des deux choix (on n’utilise pas “à cause” pour une cause positive).



    Il reste encore pas mal de boulot. En même temps c’est normal, c’est le début. La particularité d’un réseau neuronal, c’est pas d’être excellent dès le début : c’est de pouvoir progresser sans même que les développeurs aient à retoucher au code.









Liam a écrit :



Euh, t’en as oublié un paquet quand-même hein.





Ben ouais.