Google traduit Wikipédia dans les langues manquant d'articles

S'ils ont besoin d'articles, en voila : le, la, les, un, une, des... 32
Wikipédia logoGoogle est décidément bien en train de faire son deuil de Knol, l'encyclopédie rémunérant ses contributeurs qu'elle avait lancé en 2008. Elle semble aujourd'hui se tourner entièrement vers Wikipédia.

En effet, en plus d'offrir 2 millions de dollars à la fondation Wikimédia en début d'année, le géant de la recherche explique cette semaine travailler « avec des bénévoles, des traducteurs et des Wikipédiens à travers l'Inde, le Moyen-Orient et l'Afrique pour traduire plus de 16 millions de mots pour les Wikipédia en arabe, goujrâti, hindi, kannada, swahili, tamoul et telugu ». Ce sont donc les langues indiennes, africaines et l'arabe qui sont à l'honneur. En particulier l'hindi, parlé par des dizaines de millions d'internautes mais ne bénéficiant au début de ce projet que de 21 000 articles (pour 3,4 millions de mots), et qui a bénéficié de leur attention en premier lieu.

Aider les humains avec la machine

Pour aider à ces traductions, Google a commencé par utiliser ses énormes bases de données pour sélectionner les articles Wikipédia qui ont le plus de visites, et qui sont populaires dans la durée. Ils ont ensuite utilisé leur service Translator Toolkit, qui permet d'utiliser Google Translation pour établir une base, puis de coordonner les équipes de volontaires pour achever la traduction. De cette manière ils ont traduit les articles de leur liste qui n'étaient pas encore dans la version hindi : en bref, ce sont 100 articles importants, pour 600 000 mots, qui ont été traduit, augmentant donc la taille de la section hindi de l'encyclopédie de près de 20 %.

Selon Google, ils ont depuis répété l'opération pour 16 langues différentes, arrivant à un total de 16 millions de mots traduits. Mais il reste encore du travail, comme le montre ce graphique :

Wikipedia google translation


Il représente le nombre d'articles Wikipédia (sans inclure ceux au contenu presque inexistant) par nombre d'internautes, avec la version anglaise en base 1. Les internautes francophones ont donc 2,2 fois plus d'articles par personnes que leurs amis anglophones, bien que le nombre total d'articles en français soit moins élevé. Ceci s'explique par le fait qu'il y a désormais beaucoup moins de francophones dans le monde que de pratiquants de la langue de Mark Twain. Mais ça montre aussi que les internautes parlant allemand et français sont de bien plus grands contributeurs que ceux parlant coréen, chinois ou arabe.

En plus des efforts directs des équipes de Google Translation, les salariés de Mountain View croient savoir que les volontaires de l'encyclopédie ont utilisé leurs outils pour traduire 100 millions d'autres mots. Voilà qui a dû faire plaisir à ces supporteurs de la traduction qui déclarent : « Nous pensons que la traduction est la clé de notre mission pour rendre l'information utile à tous ».
Par Jeff Publiée le 16/07/2010 à 16:22 - Source : Google Translate Blog
Publicité