Google Traduction intègre 13 nouvelles langues, dont le corse et le luxembourgeois

Google Traduction intègre 13 nouvelles langues, dont le corse et le luxembourgeois

La guerre des (anciennes) régions est lancée !

Avatar de l'auteur
David Legrand

Publié dans

Internet

18/02/2016 3 minutes
43

Google Traduction intègre 13 nouvelles langues, dont le corse et le luxembourgeois

Google a décidé d'intégrer un peu de culture locale à l'occasion de la mise à jour de son service de traduction. Ainsi, il intègre 13 nouvelles langues, dont le corse et le luxembourgeois. De quoi donner envie à d'autres régions de se faire représenter ?

Google vient d'annoncer l'arrivée de 13 nouvelles langues au sein de son service de traduction, dont le corse et le luxembourgeois. Ce sont ainsi 103 langues qui sont actuellement disponibles. Les autres concernées par l'annonce du jour sont l’amharique, le frison, le kirghize, l’hawaïen, le kurde (kurmanji), le samoan, le gaélique écossais, le shona, le sindhi, le pachtou et le xhosa.

L'ajout d'une langue : des règles et le besoin de la communauté

Google en profite pour préciser que « pour déterminer le lancement d’une nouvelle langue, nous regardons beaucoup de critères : tout d’abord, il doit s’agir d’une langue écrite. Ensuite, il est nécessaire de trouver en ligne de nombreuses traductions dans cette nouvelle langue. À partir de là, nous utilisons une combinaison de machine learning, de contenus sous licence, et le recours à la communauté de Google Traduction ».

Le machine learning permet d'identifier simplement des modèles statistiques afin de gérer le gros de l'apprentissage de la langue, mais comme le précise le géant américain, la communauté reste un maillon essentiel pour compléter cette base de travail et pouvoir prendre en compte la richesse d'une langue. 

Il en profite pour tenter de recruter (voir par ici), alors que la journée internationale de la langue maternelle arrivant se déroule le 21 février prochain. « À ce jour, plus de 3 millions de personnes ont contribué à l’amélioration d’environ 200 millions de mots traduits. Là, nous vous invitons d’ailleurs à profiter de cette opportunité pour rejoindre notre communauté Google Traduction » précise le communiqué.

Après le corse, quelles autres langues régionales ?

Ce dernier est signé Anne-Gabrielle Dauba-Pantanacce (Directrice de la Communication & Relations Presse de Google France), qui indique au passage que « mes racines étant aussi du côté de l’Ile de Beauté, j’ai été naturellement très sensible à l’ajout du corse que j’ai bien sûr soutenu activement. Les technologies du numérique représentent un formidable outil pour préserver et valoriser les cultures locales. Dans un monde globalisé, Internet favorise le sentiment d’appartenance à une communauté et nous sommes heureux d’y contribuer en ajoutant le corse à Google Traduction ».

Reste à voir si d'autres seront concernées, car Alsaciens, Bretons et autres Lorrains (pour ne citer que ces cas-là) pourraient décider de se mobiliser pour voir une telle reconnaissance régionale intégrée au service. Espérons qu'ils auront aussi des employés bien placés chez Google pour les représenter.

Écrit par David Legrand

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

L'ajout d'une langue : des règles et le besoin de la communauté

Après le corse, quelles autres langues régionales ?

Fermer

Commentaires (43)


et toujours pas de klingon <img data-src=" />


le Corse.. yeah :)


le lorrain du sur du nord de l’est de l’ouest puis avec tous nos mots “local” ça va pas être évident <img data-src=" />


ouèche gros :(&nbsp;


Ce serait bien si leur traducteur pouvait proposer plus de choix pour un mot. Très souvent un seul choix est proposé et je suis obligé d’aller sur Larousse, Pons ou Reverso pour connaître les autres sens possibles du mot.

Pour le moment, je préfère encore mon outil de traduction fait maison à la solution de google (mais c’est chiant de le lancer alors que google est toujours en ligne).


Est-ce que les mots raciste, molotov et banditisme sont traduits en corse ?


&nbsp;crìmine, razzista è Molotov <img data-src=" />


Le gaélique écossais est hilarant :)








CUlater a écrit :



Le gaélique écossais est hilarant :)





Le français parisien aussi.



Pas entendu ni&nbsp;pratiqué depuis longtemps. Parait que c’est lourd, chiant et hautain <img data-src=" />


Non mais t’sais mec, la discrimination, c’est, genre, mal, quoi.








Berri-UQAM a écrit :



Non mais t’sais mec, la discrimination, c’est, genre, mal, quoi.





Ah, ok, désolé, mon vieux. <img data-src=" />





Qu’est-ce que je raconte? Je ne suis pas un puritain antidiscrimination.<img data-src=" />



enfin vu la qualité de certaines traduction anglais(allemand) -&gt; français par exemple ça n’aura que du corse(ou autre choisir la langue) que le nom … ;)


Le merdogan turc risque de bombarder google avec cet ajout de la langue kurde !


Pas grave. Le plus gros risque était l’ajout du turc, à cause de Poutine.


Enfin le Luxembourgeois… qui est tout de même l’une des langues officielles de Lululand! <img data-src=" />


@ David Legrand:

vous pouvez citer aussi le basque qui a été intégré depuis plusieurs années!!

Milesker!!

Bon, c’est vrai, pour nous, le basque n’est pas une langue régionale, mais nationale


je sais pas, mais le mot”con(ne)” n’existe qu’en français, bizarre, non?


“Con” (“avec”) existe en espagnol! <img data-src=" />


c’est vrai, t’as raison<img data-src=" />, mais pas le même sens <img data-src=" />


J’ai l’extension Im Translator sur Firefox pour vérifier la qualité de mes écrits en espagnol et en anglais (et notamment le sens ou la place d’un mot). Google n’est pas le meilleur du lot. En fait je me suis rendue que le traducteur de Microsoft entre les 4 proposés par l’extension est souvent celui qui rend le mieux le sens voire la syntaxe.


Pareil en anglais :



« He is very con. » https://fr.wiktionary.org/wiki/con#en




Reste à voir si d’autres seront concernées, car Alsaciens, Bretons et autres Lorrains (pour ne citer que ces cas-là) pourraient décider de se mobiliser pour voir une telle reconnaissance régionale intégrée au service. Espérons qu’ils auront aussi des employés bien placés chez Google pour les représenter.



Si je ne m’abuse leur traducteur est basé sur une approche statistique, donc il faut un très large corpus de traductions pour entraîner le logiciel (disons quelques millions de lignes contemporaines pour recenser suffisamment de paires et triplets de mots). Il ne va pas être facile de trouver beaucoup de textes en lorrain, et encore moins des traductions. Surtout si l’orthographe n’a pas été normalisée.



Le corse est tout de même plus vivant que les autres langues régionales.











numerid a écrit :



J’ai l’extension Im Translator sur Firefox pour vérifier la qualité de mes écrits en espagnol et en anglais (et notamment le sens ou la place d’un mot). Google n’est pas le meilleur du lot. En fait je me suis rendue que le traducteur de Microsoft entre les 4 proposés par l’extension est souvent celui qui rend le mieux le sens voire la syntaxe.





Pour le franco-anglais, tant celui de Google que celui de MS donnent des résultats décents. Pour le sino-anglais les deux sont complètement à l’ouest.



Je ne comprends pas le ST?








frikakwa a écrit :



Enfin le Luxembourgeois… qui est tout de même l’une des langues officielles de Lululand! <img data-src=" />







C’est pas une langue, c’est un patois



Bai Xamari eta euskara hitkuntz ofiziala da hegoa Euskal Herrian !



Oui Xamari et l’Euskara est une langue officielle en Pays Basque Sud (=Pays Basque “espagnol”)!


Et le gascon, c’est pour quand, bordel ?



L’Occitanie, ça existe, faudrait leur dire chez Google !








gokudomatic a écrit :



Pas grave. Le plus gros risque était l’ajout du turc, à cause de Poutine.





Je suppose que pour toi le génocide kurde n’a donc pas existé, tout comme celui des juifs.









Exception a écrit :



Je suppose que pour toi le génocide kurde n’a donc pas existé, tout comme celui des juifs.





Pourquoi dis-tu ça? Accuser quelqu’un de ce genre de chose est grave, tu sais.



Je savais même pas que le luxembourgeois avait une langue propre à vrai dire.

&nbsp;

Mais bon je m’étais jamais posé la question non plus <img data-src=" />


Non c’est une langue depuis le milieu des années 1980, maintenant le truc c’est que la grammaire est partiellement dépendante de la prononciation ce qui est normalement pas possible pour une Langue mais est acceptable pour un dialecte. En France, les dialectes ont étés supprimés &nbsp;(parfois en utilisant la manière forte) au profit du français. Mais dans beaucoup de pays européens les dialectes sont encore très présent, voir regagne en importance comme par exemple en Flandre un flamand d’Ostende ne parle pas le meme flamand qu’un flamand d’Anvers…








Reznor26 a écrit :



Je savais même pas que le luxembourgeois avait une langue propre à vrai dire.

&nbsp;

Mais bon je m’étais jamais posé la question non plus <img data-src=" />





Bof, le luxembourgeois, l’alsacien… Tout ça c’est de l’allemand avec un accent. <img data-src=" />









frikakwa a écrit :



Enfin le Luxembourgeois… qui est tout de même l’une des langues officielles de Lululand! <img data-src=" />





Endlech!! :)









Loucheux a écrit :



Bof, le luxembourgeois, l’alsacien… Tout ça c’est de l’allemand avec un accent. <img data-src=" />







C’est vrai… C’est bien pour ça que les allemands non frontalier me demande de parler en Luxembourgeois car ils comprennent rien.



D’ailleurs toutes les langues sont juste des accents de langues préhistoriques..



Peut-être a-t-il confondu avec le génocide arménien ?








Berri-UQAM a écrit :



Pareil en anglais :



« He is very con. » https://fr.wiktionary.org/wiki/con#en



“He’s a con man” est plus juste.



S’ils commencent à mettre tout les Suisse-allemand et haut-valaisan <img data-src=" />



Sinon je trouve drôle d’un coté il y a irlandais et de l’autre il y a gaélique (écossais)


Tiens, il n’y à plus de kurde et juifs sur Terre!<img data-src=" /> Là vache. C’est à cause d’enlèvement aliens?<img data-src=" />








Ami-Kuns a écrit :



Tiens, il n’y à plus de kurde et juifs sur Terre!<img data-src=" /> Là vache. C’est à cause d’enlèvement aliens?<img data-src=" />







Manquerait plus que les Belges soient dans le coup, mais ils ont un alibi : la technologie n’était pas au point quand Jacques Brel a fait son dernier concert à l’Olympia, en 1968…



<img data-src=" /><img data-src=" /><img data-src=" /><img data-src=" /><img data-src=" />



De tout façon, de tout temps, les massacres ont existé depuis le début de l’existence humaine, et j’ai l’impression qu’on n’en verra pas la fin avant la fin de l’humanité.<img data-src=" />


Ouais, enfin…le latin est présent aussi… Je n’ai rien contre, au contraire, mais comme langue parlée, hein…









sigisbert a écrit :



Ouais, enfin…le latin est présent aussi… Je n’ai rien contre, au contraire, mais comme langue parlée, hein…







Pour les juristes, les botanistes et les zoologistes, c’est pas inutile…



Avant d’ajouter des langues vivantes de tradition écrite, que google revoit d’abord sa copie quant aux langues mortes.

Faites donc l’expérience de demander à google comment on dit “oui” en latin.

Vous allez être surpris …