La NSA peut transcrire à la volée des conversations dans de nombreuses langues

Mais qui s'en étonnera encore ?

La NSA et son équivalent anglais, le GCHQ, ont investi durant des années dans la recherche sur la reconnaissance vocale. Les agences de renseignement seraient en capacité d’écouter des conversations dans de nombreuses langues pour les convertir automatiquement en texte anglais. Les documents seraient alors stockés dans une base de données interrogeable par les analystes.

Transcrire à la volée et en anglais des conversations enregistrées

Les documents dérobés à la NSA par Edward Snowden ont montré à de très nombreuses reprises l’étendue des capacités de l’agence américaine de renseignement, mais pas seulement. Ils ont mis en évidence des réseaux de relations entre les pays, notamment une alliance formée par les États-Unis et le Royaume-Uni, et plus globalement avec le Canada, la Nouvelle-Zélande et l’Australie : les fameux Five Eyes.

The Intercept a pu plonger dans d’autres documents, qui abordent cette fois la reconnaissance vocale. On y apprend comment la NSA et le GCHQ ont utilisé le logiciel Dragon Dictate et l’ont modifié durant des années pour arriver au résultat attendu. Avec un tel outil, les agences sont capables de passer à la moulinette l’ensemble des conversations vocales enregistrées pour les traduire automatiquement sous forme de texte.

Les analystes ont donc accès à une base de données particulièrement riche contenant ces transcriptions ainsi que les fichiers audio d’origine. Divers algorithmes travaillent sur les versions textes pour repérer automatiquement certains mots-clés et marquer des conversations comme « intéressantes ».

Au moins un million de transcriptions par jour

La première utilisation du logiciel, nommé RHINEHART, remonterait à 2004 et se serait montré si efficace que les propres analystes de la NSA l’auraient surnommé « Google For Voice ». Il aurait été remplacé plusieurs années après par VoiceRT, plus performant et utilisé pour la première fois à Bagdad. En 2013, nouveau remplacement avec SPITFIRE, à son tour nettement plus rapide. Les documents donnent d’ailleurs un ordre d’idée des capacités mises en mouvement, puisque VoiceRT pouvait analyser, transcrire et repérer les termes intéressants au rythme d’un million de fichiers audio par jour.

Les documents vus par The Intercept ne permettent cependant pas de connaître l’étendue de l’utilisation de ces solutions aujourd’hui ou même durant la dernière décennie. Il est certain qu’elles ont été utilisées à l’étranger puisque le but premier est de traduire automatiquement en anglais, mais rien ne dit que l’une ou l’autre n’ait pas été employée directement sur le sol national.

La collecte des métadonnées remise en cause aux États-Unis

L’avenir des données téléphoniques aux États-Unis pourrait d’ailleurs changer dans les mois qui viennent. L’ACLU (American Civil Liberties Union) avait en effet déposé plainte contre le gouvernement pour avoir dépassé les permissions du Patriot Act sur la collecte à très large échelle des métadonnées téléphoniques. Or, une cour fédérale d’appel vient de donner raison à l’association, en indiquant que si le Congrès souhaitait autoriser une pareille collecte, il pouvait légiférer en ce sens, mais que la loi actuelle ne l’autorisait pas.

L’affaire a donc été renvoyée devant un autre tribunal. La chronologie pourrait mal tomber pour la NSA car l’autorisation doit être renouvelée périodiquement, le mandat actuel expirant le 1er juin. L’ACLU se félicite de cette victoire et estime désormais que la situation dépend entièrement du Congrès.

Android 15 : la bêta 1.1 corrige plusieurs soucis, dont le NFC

09:01 0

Selon Jean-Noël Barrot, la France et l’Europe sont « pilonnés par la propagande de la Russie »

07:57 44

C’est la fin pour la marque Roccat, Turtle Beach prend le relai

07:43 6

Intelligence artificielle : Apple rachète la société française Datakalab

07:30 11

Proton Mail ajoute la surveillance du dark web à la recherche de fuites de données

07:05 2

La lutte contre les centres d’appels, une « priorité » de la cyberpolice ukrainienne

00:01 5

Commentaires (85)

CryoGen

Le 08/05/2015 à 10h 05

Çà ne m’étonne absolument pas, et en fait je pensais même que çà se savait " />

fred131

Le 08/05/2015 à 10h 10

Une société français participe aux logiciels de traductions“systran”, cocorico ….. ou pas " />

SpiritNico

Le 08/05/2015 à 10h 19

Quand je pense que pour les personnes sourdes et malentendantes c’est encore la croix et la bannière pour comprendre le français oral. Je ne parle même pas des autres langues…

A quand un petit appareil (ou appli SmartPhone) efficace et performante pour traduire en live ou simplement “sous-titrer” en live ?

Jossy

Le 08/05/2015 à 10h 20

Bientôt plus besoin avec Skype !  Le boulot sera fait par microsoft !

Baldurien Abonné

Le 08/05/2015 à 10h 35

fred131 a écrit :

Une société français participe aux logiciels de traductions“systran”, cocorico ….. ou pas " />

Ben … développer ce genre de logiciel, c’est très intéressant…

Après, l’utilisation éthique… c’est une autre histoire…

Ami-Kuns Abonné

Le 08/05/2015 à 10h 45

Je penser que les américains n’aimè pas le sous-titré." />

linkin623 Abonné

Le 08/05/2015 à 10h 51

Baldurien a écrit :

Ben … développer ce genre de logiciel, c’est très intéressant…

Après, l’utilisation éthique… c’est une autre histoire…

La quoi? " />

Ami-Kuns a écrit :

Je penser que les américains n’aimè pas le sous-titré." />

" />

9 mots, 2 verbes, 2 fautes ; pas mal… Astuce

Vekin

Le 08/05/2015 à 11h 06

Bon et quand est-ce qu’ils nous font profiter de leur formidable outil ? " />

DahoodG4

Le 08/05/2015 à 11h 14

Tu plaisantes ? Controler la planete est bien plus INtéressant !

Cara62

Le 08/05/2015 à 11h 22

#10

Pourquoi plusieurs langues ? Seul l’arabe suffit non ?

" /> " /> " />

Le 08/05/2015 à 11h 23

#11

linkin623 a écrit :

La quoi? " />

et tique ? :)

fwak

Le 08/05/2015 à 11h 31

#12

Je verrais plutôt un traducteur “immigré-anglais”, en fait " />

moggbomber

#13

avec cortana qui va generaliser l’os qui ecoute en permanence ca fait une bonne combo " />

Le 08/05/2015 à 11h 39

#14

Par définition Cortana transcrit un son en code informatique utilisable par une machine. Donc le truc de la NSA ne sert à rien, vu que MS le fait déjà pour te renvoyer le résultat " />

dodo021

Le 08/05/2015 à 11h 40

#15

Google Now me fait plus peur que Cortana pour le moment.

Clapitti

Le 08/05/2015 à 11h 43

#16

C’est un hommage à l’actu je pense :

“Les analystes ont donc axé à une base de données” " />

Le 08/05/2015 à 11h 46

#17

" /> Whoupitin j’ai même pas fait gaffe " />

svoboda

Le 08/05/2015 à 11h 48

#18

Ca va engendrer une renaissance des patois, dialectes et autres langues tribales, comme la langue navajo pendant la II ème guerre

Le 08/05/2015 à 11h 55

#19

moggbomber a écrit :

avec cortana qui va generaliser l’os qui ecoute en permanence ca fait une bonne combo " />

Il y a de la reconnaissance vocale depuis Vista…

Nikodym

Le 08/05/2015 à 11h 56

#20

Cara62 a écrit :

Pourquoi plusieurs langues ? Seul l’arabe suffit non ?

" /> " /> " />

" />

Le 08/05/2015 à 11h 58

#21

Rater voulait faire 911. " />

Le 08/05/2015 à 12h 01

#22

Quand un des GAFA aura acheter la NSA.

wawadou

Le 08/05/2015 à 12h 03

#23

" />

" /> " />

Le 08/05/2015 à 12h 08

#24

ce que je voulais dire c’est que grâce a cortana, votre ordi vous ecoute en permanence pour capter le “hey cortana” (marche aussi pour google, siri and co)

 

bon ok “gadget” pour le moment peu utile. mais si cela devient intégré de plus en plus a l’os au point d’en devenir nécessaire et donc devenir permanent et répandu.

ce flux audio capté en permanence pourra donc etre capté par la nsa et retranscrit en texte (plus facile a traiter par la suite je pense)

on a donc les tel portables, les tel fixes (même pas décrochés, voir citizenfour avec Snowden), les télé connectées, les consoles new gen, les ordi portables, les tablettes. il manque les desktop qui n’ont pas de perph connecté en permanence comme les casque ou webcam.

cela devrait donc évoluer sur les destop oem pour justement pouvoir utiliser cortana. donc hop micros répandus encore plus " /> (notamment entreprises)

 

bon je dis pas pas super sérieusement, mais une fois qu’on a lu les diff déclarations et documents  Snowden on sait maintenant que c’est possible." />

attention je parle d’ordi ciblés hein. pas d’écoute trop généralisées a la metadonnées

v1nce

Le 08/05/2015 à 12h 12

#25

Même le WeshGrosBienouBien ?

Himurai

Le 08/05/2015 à 12h 14

#26

Vekin a écrit :

Bon et quand est-ce qu’ils nous font profiter de leur formidable outil ? " />

Ca s’appelle la traduction instantanée de Skype et c’est bientôt disponible :p

marshall39

Le 08/05/2015 à 12h 44

#27

Bof , je suis allé passer quelques jours a Amsterdam , et si Google Now m’a fait peur c’est plus par son efficacité , que ca soit pour retrouver le chemin jusqu’à la location , les horaires des bus et tramways , les trucs sympa a voir aux alentours….

Le truc qui m’a soufflé , dans un restaurant au moment de payer je me souvenais plus comment on disait “addition” en anglais , j’ouvre Google Now m’apprêtant a taper ma demande et dans les suggestion de traduction avant meme de taper quoi que ce soit je vois “l’addition s’il vous plait = Bill please” Là je fais wouarf ils savent même qu’on vient de manger " />

manbu

Le 08/05/2015 à 12h 51

#28

  Vincent Hermann a écrit :

Les analystes ont donc “axé”  à une base de données particulièrement riche

contenant ces transcriptions ainsi que les fichiers audio d’origine

 Au secours ! Ça m’a fait un gros trou dans l’oeil droit.

Dori66

Le 08/05/2015 à 13h 12

#29

Les analystes ont donc axé à une base de données

 

Seriously? ^^

matroska

Le 08/05/2015 à 13h 23

#30

Ça fonctionne pour les conversations hot ou pas ?

Remarque, transcrire “oh oui, oh oui” en “oh yes, oh yes”, ça n’a guère d’intérêt…

" />

" />

OlivierJ Abonné

Le 08/05/2015 à 13h 28

#31

Vekin a écrit :

Bon et quand est-ce qu’ils nous font profiter de leur formidable outil ? " />

Sur mon Galaxy S5 mini, la reconnaissance vocale marche assez bien, mais il faut quand même que je parle nettement plus lentement que mon débit naturel pour que ça marche. Je me demande si le logiciel mis au point par la NSA arrive à transcrire une de mes conversations à débit normal (je parle vite donc).

Nerkazoid

Le 08/05/2015 à 13h 38

#32

Je n’y connais rien mais peut-être qu’ils peuvent ralentir l’enregistrement pour mieux l’analyser . Ce qui occasionne un petit délai par rapport à de la traduction à la volée mais qui est peut-être acceptable pour eux " />

DUNplus Abonné

Le 08/05/2015 à 13h 48

#33

C’est pour quand les sou-titre sur tout les video de toutube?

kade

Le 08/05/2015 à 13h 53

#34

linkin623 a écrit :

" />

9 mots, 2 verbes, 2 fautes ; pas mal… Astuce

Je venais de lire le commentaire. Je ne savais plus quoi penser…

Pui j’aî tombai surle tient.

Rien à ajouter.

Merci " />

Le 08/05/2015 à 13h 54

#35

DotNerk a écrit :

Je n’y connais rien mais peut-être qu’ils peuvent ralentir l’enregistrement pour mieux l’analyser .

Oui, ils utilisent le système “bullet-time” inventé je crois, par Monsieur Matrix.

Le 08/05/2015 à 14h 01

#36

OlivierJ a écrit :

Sur mon Galaxy S5 mini, la reconnaissance vocale marche assez bien, mais il faut quand même que je parle nettement plus lentement que mon débit naturel pour que ça marche. Je me demande si le logiciel mis au point par la NSA arrive à transcrire une de mes conversations à débit normal (je parle vite donc).

Mon petit doigt me dit que les systèmes de la NSA doivent être légèrement plus performants qu’un téléphone. Mais je n’avance imprudemment sans aucune source à présenter.

Le 08/05/2015 à 14h 03

#37

DotNerk a écrit :

Je n’y connais rien mais peut-être qu’ils peuvent ralentir l’enregistrement pour mieux l’analyser . Ce qui occasionne un petit délai par rapport à de la traduction à la volée mais qui est peut-être acceptable pour eux " />

Ralentir l’enregistrement, ça ne veut pas dire grand chose, ils partent d’un enregistrement et des données, qu’ils analysent comme n’importe quelles autres données, il n’y a pas vraiment de notion de vitesse. En principe en parlant vite et en articulant, un logiciel devrait arriver à reconnaître les syllabes, mais il a moins de signal pour ça je suppose.

Le 08/05/2015 à 14h 05

#38

kade a écrit :

Mon petit doigt me dit que les systèmes de la NSA doivent être légèrement plus performants qu’un téléphone. Mais je n’avance imprudemment sans aucune source à présenter.

Vu que sur un mobile, l’analyse doit être assez rapide pour être utile, certes pour la NSA le logiciel peut prendre plus son temps. D’un autre côté, la puissance des ordinateurs ayant bien augmenté au cours des années, et vu les moyens de Google (derrière Android), je suppose qu’ils utilisent un logiciel aussi performant que possible sur leur téléphone. Note que le logiciel de reconnaissance ne dépend pas la puissance du mobile vu qu’il faut être connecté pour que la reconnaissance fonctionne.

john san Abonné

Le 08/05/2015 à 14h 14

#39

Le Big Data a de beaux jours devant lui :)

Le 08/05/2015 à 14h 26

#40

OlivierJ a écrit :

Note que le logiciel de reconnaissance ne dépend pas la puissance du mobile vu qu’il faut être connecté pour que la reconnaissance fonctionne.

Ouais, dans un téléphone…

Mais quand tu es connecté en local par fibre aux BDD, c’est une autre histoire " />

Le 08/05/2015 à 14h 29

#41

john san a écrit :

Le Big Data a de beaux jours devant lui :)

Il est utilisé par des infrastructures bien plus petites que Facebook, Google et les autres.

Le NOSQL entre autre, est disponible sur pas mal de BDD en natif maintenant.

Puis le traitement en mode colonne, tout ça… ça devient incontournable pour des traitements “batch” aussi.

cendrev3

Le 08/05/2015 à 14h 51

#42

wesh bn kourag pr capter se kon dis mddrr, il a intéré a etre chanmé leure bordel ptdr

darth21

Le 08/05/2015 à 14h 54

#43

Tu peux bien écrire n’importe comment, ça retranscrit la voix, pas l’écrit. " />

elezoic

Le 08/05/2015 à 15h 58

#44

Pour plus de confort bientôt un capteur d’odeur intégré au téléphone, et plus tard on apprendra que la NSA traque l’odeur de la poudre.

SebGF Abonné

Le 08/05/2015 à 16h 52

#45

elezoic a écrit :

Pour plus de confort bientôt un capteur d’odeur intégré au téléphone, et plus tard on apprendra que la NSA traque l’odeur de la poudre.

Et ben, avec toutes les caisses que je lâche je serai vite classé terroriste alors car je vais en tuer plus d’un " />

Amis de la poésie, bonsoir.

PS : avec un petit combo maroilles / Tartiflette tiens " />

127.0.0.1

Le 08/05/2015 à 17h 55

#46

pour calculer de la kaille bien zdeg, faut qu’il charbonne mortel.

Marco07

Le 08/05/2015 à 19h 18

#47

Toutes manières, si vous n’avez rien à cacher, je ne vois pas en quoi ça serait dérangeant que les Américains (la NSA) ait accès à tout ce qui passe par du réseau…

Après tout, ils ne le font que probablement pour chasser du barbu, certainement pas pour des secrets indus ou autre, z’ont beaucoup trop de morale pour s’abaisser à ce genre de méthodes.

Liam

Le 08/05/2015 à 20h 54

#48

On parle de transcription (conversion de paroles orales en texte écrit) ou de traduction (conversion d’une langue à l’autre) ?

fred131 a écrit :

Une société français participe aux logiciels de traductions“systran”, cocorico ….. ou pas " />

Si vraiment ils utilisent les technologies de Systran pour traduire automatiquement d’une langue à l’autre… je serais vous je m’en ferais pas trop pour ma vie privée. Ces trucs là ne marchent à peu près pas. " />

Bon j’imagine que ça peut servir pour extraire quelques mots clés, et ainsi filtrer les messages qui ensuite ont besoin d’être traduits par un humain par rapport à ceux dont on s’en fout. Mais faut pas croire qu’on peut vraiment travailler avec des textes traduits par Systran.

Voici une traduction par Systran du premier commentaire du premier post de la page d’accueil de Reddit :

Systran a écrit :

Il y a un APP. Presque tous les (dans pas encore le tout) dépôts à la maison ont WiFi gratuit. L’APP vous indique dans quel bas-côté, sur lequel baie (support) et combien sont en stock. Il fournit également le nombre d’évaluation et d’article.

Voilà, essayez de reconstituer l’original maintenant…

psn00ps

Le 08/05/2015 à 21h 08

#49

Vendredi, trop visible " />

Marco07 a écrit :

Toutes manières, si vous n’avez rien à cacher, je ne vois pas en quoi ça serait dérangeant que les Américains (la NSA) ait accès à tout ce qui passe par du réseau…

Après tout, ils ne le font que probablement pour chasser du barbu, certainement pas pour des secrets indus ou autre, z’ont beaucoup trop de morale pour s’abaisser à ce genre de méthodes.

Sinon pour ceux qui n’ont rien à cacher, instruisez vous :

http://jenairienacacher.fr/

Céd

Le 08/05/2015 à 21h 21

#50

Ouais mais bon, on s’entend que Cortana détecte le Hey Cortana en local, hein… En plus, toute observation passant par ce genre de technique serait très facilement visible au niveau de la connection internet qui en prendrait un coup.

Ler van keeg

Le 08/05/2015 à 23h 08

#51

marshall39 a écrit :

Bof , je suis allé passer quelques jours a Amsterdam , et si Google Now m’a fait peur c’est plus par son efficacité , que ca soit pour retrouver le chemin jusqu’à la location , les horaires des bus et tramways , les trucs sympa a voir aux alentours….

Le truc qui m’a soufflé , dans un restaurant au moment de payer je me souvenais plus comment on disait “addition” en anglais , j’ouvre Google Now m’apprêtant a taper ma demande et dans les suggestion de traduction avant meme de taper quoi que ce soit je vois “l’addition s’il vous plait = Bill please” Là je fais wouarf ils savent même qu’on vient de manger " />

Pareil, mais avec les outils Nokia sur Windows Phone.

Restaurants aux alentours, métro à prendre avec les horaires kivonbien, gps à pied pour pas se perdre…

On devient dépendants en fait…

Le 08/05/2015 à 23h 09

#52

kade a écrit :

Oui, ils utilisent le système “bullet-time” inventé je crois, par Monsieur Matrix.

Aaah ce fameux Don ??

panda09

Le 08/05/2015 à 23h 30

#53

Cara62 a écrit :

Pourquoi plusieurs langues ? Seul l’arabe suffit non ?

" /> " /> " />

Avec l’autre taré de Matignon et pas mal d’autres de la classe politique, ce serait plutôt l’hébreu, non ? " />

popolski

Le 09/05/2015 à 05h 56

#54

SpiritNico a écrit :

Quand je pense que pour les personnes sourdes et malentendantes c’est encore la croix et la bannière pour comprendre le français oral. Je ne parle même pas des autres langues…

A quand un petit appareil (ou appli SmartPhone) efficace et performante pour traduire en live ou simplement “sous-titrer” en live ?

dragon naturally speacking 8

balabolka :  lit du texte et traduit en voix

Le 09/05/2015 à 05h 57

#55

Le 09/05/2015 à 06h 01

#56

dodo021 a écrit :

Google Now me fait plus peur que Cortana pour le moment.

Google …….." />

Le 09/05/2015 à 06h 03

#57

svoboda a écrit :

Ca va engendrer une renaissance des patois, dialectes et autres langues tribales, comme la langue navajo pendant la II ème guerre

toujours en patois au téléphone avec les amis

Le 09/05/2015 à 06h 08

#58

matroska a écrit :

Ça fonctionne pour les conversations hot ou pas ?

Remarque, transcrire “oh oui, oh oui” en “oh yes, oh yes”, ça n’a guère d’intérêt…

" />

" />

oh my gode " />

Goldoark Abonné

Le 09/05/2015 à 07h 06

#59

Dès que tu parles de CIA et de NSA, on te traite toujours de parano… Les gens sont navrants de naïveté.

zempa Abonné

Le 09/05/2015 à 08h 29

#60

Mais qui s’en étonnera encore ?

En lisant de sous-titre j’ai ri (jaune)… et puis je me suis rendu compte de ma non indignation.

En effet, beaucoup affirme aisément que cela ne les surprend pas et/ou qu’ils le savaient déjà.

Pour finir sur un “bof”.

Bof ?!?

Bof d’avoir (enfin!) les preuves d’un système de surveillance généralisé et massif des populations par des gouvernements de dites “démocraties” ?!?

Bof de voir que la majorité des surveillances ne concerne en rien le terrorisme ou plus généralement la sécurité (cf la surveillance de la France par l’Allemagne au profit de la NSA) ?!?

Et pourtant ceux qui finissent avec ce “bof” ( dont je fais parti) sont les mêmes qui se sont insurgés contre la HADOPI, l’ACTA, LA LOPPSI, etc.

A croire que ce qui n’est pas palpable est plus facilement accepté.

Il semble malheureusement que le coup des pédos-nazis-terroristes fonctionnent toujours.

Ce sous-titre démontre finalement l’acceptation de ce système à la Big Brother par les populations.

 

Et le plus drôle est de voir les réactions quand on ose affirmer qu’on n’est pas dans une véritable Démocratie…

Comme si le moins pire était la seule alternative… " />

Wosgien Abonné

#61

Je me demande toujours, connaissant le baratin habituel des commerciaux en logiciels, à quel point ces annonces sont réalistes d’un point de vue réelle.

S’il y a des logiciels qui m’étonnent sur leurs capacités, je vois aussi beaucoup de déconvenues. Les capacités réelles d’un logiciel quand on le met en place sont souvent loin de ce que l’on s’imagine en lisant les brochures.

Exemple dans la reconnaissance vocale: incapacité chronique à comprendre une longue phrase dite à vitesse normale. Incapacité chronique à comprendre une phrase dans laquelle on ne marque pas correctement la ponctuation par des pauses.

Bien sûr, la NSA peut avoir mieux, mais certainement en se basant (comme nous même) sur une réinterprétation des sons à partir de ce que l’on connais comme tournure de phrase courante (globalement et de la part de notre interlocuteur). Tout cela pour dire que moi-même j’ai souvent du mal à comprendre ce que disent les gens au téléphone avec le réseau actuel, j’ai dû mal à croire qu’un ordinateur puisse retranscrire correctement sans faire de “wild guess”.

Mr.Nox Abonné

Le 09/05/2015 à 09h 52

#62

Max Payne.

lateo

Le 09/05/2015 à 10h 23

#63

Donc si je comprends bien, ils ont un outil pour retranscrire « en live » une source audio sous une forme numérique quelconque (ce qui peut vouloir dire plein de choses, à priori ce n’est pas impressionnant du tout), puis ils donnent le résultat à manger à un outil capable de définir la langue source (ça me semble compliqué, à tort?) et traduire le merdier en anglais (probablement sous tout un tas de conditions)…

Le 09/05/2015 à 10h 55

#64

brice.wernet a écrit :

Bien sûr, la NSA peut avoir mieux, mais certainement en se basant (comme nous même) sur une réinterprétation des sons à partir de ce que l’on connais comme tournure de phrase courante (globalement et de la part de notre interlocuteur). Tout cela pour dire que moi-même j’ai souvent du mal à comprendre ce que disent les gens au téléphone avec le réseau actuel, j’ai dû mal à croire qu’un ordinateur puisse retranscrire correctement sans faire de “wild guess”.

Je pense surtout que la NSA n’a pas besoin d’une transcription parfaite : c’est plutôt une première approche pour extraire des mots-clés intéressants et savoir ce qui mérite leur attention ou pas : une fois que c’est fait, ils peuvent faire appel à un humain pour la transcription et la traduction. Mais s’ils devaient tout faire retranscrire et traduire par des humains, sans procéder à un premier filtrage, il leur faudrait embaucher la moitié des Etats-Unis.

lateo a écrit :

Donc si je comprends bien, ils ont un outil pour retranscrire « en live » une source audio sous une forme numérique quelconque (ce qui peut vouloir dire plein de choses, à priori ce n’est pas impressionnant du tout), puis ils donnent le résultat à manger à un outil capable de définir la langue source (ça me semble compliqué, à tort?) et traduire le merdier en anglais (probablement sous tout un tas de conditions)…

La transcription d’audio veut dire un truc bien précis : la conversion en texte.

Définir la langue source à partir d’un texte ensuite, c’est super simple, rien que Google Translate le fait plutôt bien.

Enfin, reste la traduction vers l’anglais… s’ils utilisent les technologies de Systran, le texte est grosso-modo inutilisable pour un usage réel, mais c’est sans doute suffisant pour extraire des mots-clés et savoir si la conversation parle de ton week-end chez mamie ou de ton intention de poser une bombe sale sur le Pentagone en criant Allahu Akhbar.

Le 09/05/2015 à 11h 18

#65

Liam a écrit :

La transcription d’audio veut dire un truc bien précis : la conversion en texte.

Définir la langue source à partir d’un texte ensuite, c’est super simple, rien que Google Translate le fait plutôt bien.

Enfin, reste la traduction vers l’anglais… s’ils utilisent les technologies de Systran, le texte est grosso-modo inutilisable pour un usage réel, mais c’est sans doute suffisant pour extraire des mots-clés et savoir si la conversation parle de ton week-end chez mamie ou de ton intention de poser une bombe sale sur le Pentagone en criant Allahu Akhbar.

Clarification : ce qui me semble compliqué c’est de «nourrir» le traducteur ou le détecteur de langue avec ce qui est pondu par le transcripteur.

Le résultat du transcripteur étant nécessairement assez éloigné de la forme écrite correcte dans la langue d’origine (forme correcte que les outils grand public savent plus ou moins traduire correctement).

Haemy

Le 09/05/2015 à 13h 05

#66

zempa a écrit :

Mais qui s’en étonnera encore ?

En lisant de sous-titre j’ai ri (jaune)… et puis je me suis rendu compte de ma non indignation.

En effet, beaucoup affirme aisément que cela ne les surprend pas et/ou qu’ils le savaient déjà.

Pour finir sur un “bof”.

Bof ?!?

Bof d’avoir (enfin!) les preuves d’un système de surveillance généralisé et massif des populations par des gouvernements de dites “démocraties” ?!?

Bof de voir que la majorité des surveillances ne concerne en rien le terrorisme ou plus généralement la sécurité (cf la surveillance de la France par l’Allemagne au profit de la NSA) ?!?

Et pourtant ceux qui finissent avec ce “bof” ( dont je fais parti) sont les mêmes qui se sont insurgés contre la HADOPI, l’ACTA, LA LOPPSI, etc.

A croire que ce qui n’est pas palpable est plus facilement accepté.

Il semble malheureusement que le coup des pédos-nazis-terroristes fonctionnent toujours.

Ce sous-titre démontre finalement l’acceptation de ce système à la Big Brother par les populations.

 

Et le plus drôle est de voir les réactions quand on ose affirmer qu’on n’est pas dans une véritable Démocratie…

Comme si le moins pire était la seule alternative… " />

Que veux tu que l’individu lambda fasse ? 

Le 09/05/2015 à 13h 06

#67

Mr.Nox a écrit :

Max Payne.

" />

C’est vrai, j’y ai joué il y à fort fort longtemps, et je me souviens de cette fonction " />

Par contre, niveau chronologie : Matrix ou Max Payne ?

nigol

Le 09/05/2015 à 14h 42

#68

il a de la transcription quasi temp-reel dans les systèmes de sous-titres des chaines TV.

Il suffit d’activer les sous-titres mal-entendants pour s’en rendre compte.

Quand les matchs sportifs sont diffusés dans les bars tres bruyants, vous avez jamais remarqué que le barman affichait la retranscription automatique des commentaires sportifs?

Le 09/05/2015 à 15h 39

#69

tu n’as même pas une petite idée ???

Le 09/05/2015 à 15h 47

#70

svoboda a écrit :

Ca va engendrer une renaissance des patois, dialectes et autres langues tribales, comme la langue navajo pendant la II ème guerre

Windtalkers, excellent film avec Nicolas Cage (eh c’est arrivé oui).

Sinon je te rassure, la NSA et autre ont les personnes pour comprendre les “patois” ou autres “dialectes locaux”, suffit de voir les offres d’emplois…

Et puis de toute façon c’est pas la langue qui les gênent, le plus compliqué est d’avoir le code.

Comme dans Windtalkers, c’est le mot “tortue” qui désigne les tanks. Donc même en comprenant le navajo, faut pouvoir faire le lien…

Le 09/05/2015 à 22h 12

#71

nigol a écrit :

il a de la transcription quasi temp-reel dans les systèmes de sous-titres des chaines TV.

Il suffit d’activer les sous-titres mal-entendants pour s’en rendre compte.

Ceux la sont préenregistrés.

 

Le 09/05/2015 à 22h 16

#72

kade a écrit :

" />

C’est vrai, j’y ai joué il y à fort fort longtemps, et je me souviens de cette fonction " />

Par contre, niveau chronologie : Matrix ou Max Payne ?

Matrix d’abord, en suite Max Payne (un des truands en parle carrément dans le jeu)

 mais…

aucun des deux n’est l’inventeur de la technique " />

Le 09/05/2015 à 23h 21

#73

psn00ps a écrit :

Matrix d’abord, en suite Max Payne (un des truands en parle carrément dans le jeu)

mais…

aucun des deux n’est l’inventeur de la technique " />

" />

J’avais donc raison !

Bon, sous réserves du Wiki (que je m’étais interdit de consulter depuis le début).

Ouf ! " />

divide

Le 10/05/2015 à 07h 42

#74

Non, il ne parle pas des films, mais des lives et des reportages qui n’ont pas de piste sous-titre à priori. Il s’agit donc bien de transcription temps réel. Aprés comme il n’y a qu’un seul flux à gérer par chaine, c’est peut-être assuré par un humain…

Le 10/05/2015 à 08h 07

#75

divide a écrit :

Non, il ne parle pas des films, mais des lives et des reportages qui n’ont pas de piste sous-titre à priori. Il s’agit donc bien de transcription temps réel. Aprés comme il n’y a qu’un seul flux à gérer par chaine, c’est peut-être assuré par un humain…

Même si le direct à la TV a toujours un léger différé d’une minute ou deux (pour censurer quelque chose d’horrible et qui provoquerait la perte de l’humanité, genre un bout de néné), je doute sincèrement qu’il y ait intervention humaine sur une transcription d’un live. Peut-être relecture oui, mais écriture faut une sacré dextérité pour ne faire aucune faute de frappe et erreur de langue en si peu de temps avec un tel flux tendu.

A titre d’exemple, Youtube fait depuis quelques temps la traduction/transcription automatique des paroles d’une vidéo. C’est plus ou moins efficace.

Mihashi Abonné

Le 10/05/2015 à 09h 46

#76

SebGF a écrit :

A titre d’exemple, Youtube fait depuis quelques temps la traduction/transcription automatique des paroles d’une vidéo. C’est plus ou moins totalement pas efficace.

" />

Parce que bon, quand même…

Le 10/05/2015 à 09h 55

#77

zempa a écrit :

tu n’as même pas une petite idée ???

Non.

JoePike

Le 10/05/2015 à 11h 19

#78

psn00ps a écrit :

Ceux la sont préenregistrés.

Non Non c’est en Live

J’utilise ça ici ( Catalogne) pendant les news en catalan parce que j’y pige quedalle .

donc les phrases ne sont pas complètes mais certains mots clés ressortent ce qui fait que tu perçois vaguement de quoi on cause.

Le 10/05/2015 à 12h 49

#79

Je pensais vraiment que Max Payne était antérieur à Matrix !

JohnDeuf

Le 10/05/2015 à 18h 33

#80

C’est triste mais ça ne me choque même plus.

Ca ne me choque plus qu’ils bafouent tant de droits et de valeurs - Y compris celles portées par leur propre pays. Et ça ne me choque plus qu’ils disposent d’une technologie qui pourraient servir à tant de choses…

Ca veut dire que je suis habitué ? " />

zefling Abonné

Le 10/05/2015 à 19h 30

#81

Bon, il va falloir que j’apprenne le Klingon ou elfique, jusqu’à ce que la NSA décode aussi ça. " />

Le 10/05/2015 à 19h 51

#82

" />

Le 11/05/2015 à 00h 23

#83

nigol a écrit :

il a de la transcription quasi temp-reel dans les systèmes de sous-titres des chaines TV.

Il suffit d’activer les sous-titres mal-entendants pour s’en rendre compte.

Quand les matchs sportifs sont diffusés dans les bars tres bruyants, vous avez jamais remarqué que le barman affichait la retranscription automatique des commentaires sportifs?

SebGF a écrit :

Même si le direct à la TV a toujours un léger différé d’une minute ou deux (pour censurer quelque chose d’horrible et qui provoquerait la perte de l’humanité, genre un bout de néné), je doute sincèrement qu’il y ait intervention humaine sur une transcription d’un live. Peut-être relecture oui, mais écriture faut une sacré dextérité pour ne faire aucune faute de frappe et erreur de langue en si peu de temps avec un tel flux tendu.

A titre d’exemple, Youtube fait depuis quelques temps la traduction/transcription automatique des paroles d’une vidéo. C’est plus ou moins efficace.

C’est bien du direct, mais ça ne marche pas du tout comme Youtube : il y a en fait un humain (que l’on surnomme dans le milieu un “perroquet”) qui répète tout ce qui se dit dans un micro mais plus clairement, distinctement, en faisant les bonnes pauses et en énnonçant les virgules et ce genre de truc, pour que le système de reconnaissance vocale ne fasse pas trop d’erreur.

En général, il y a aussi en bout de chaîne un correcteur qui reprend les erreurs les plus grossières du système de reconnaissance vocale (en général, les chaînes qui ont renoncé au correcteur, “charmés” par les promesses d’un commercial qui jurait que son logiciel de reconnaissance avait 99% d’exactitude, sont revenu en arrière sous les protestations de leur public malentendant, les sous-titres devenant quasi-illisibles).

Le système utilisé par la NSA doit être plus proche du système de Youtube (mais peut-être un peu + avancé) en se passant totalement d’humains. Ça marche potablement quand une personne parle seule, clairement, sans divers bruits de fond derrière, sans plusieurs voix qui s’entrecoupent, sans hurler ou chanter etc.

Il faut reconnaître qu’erreurs de transcription automatique + erreurs de traduction automatique doit donner des textes marrants, mais assez éloigné de l’original. Maintenant, si le but est de repérer quand un mec parle de “bombarder le pentagone” au téléphone, ça doit faire l’affaire.

Le 11/05/2015 à 11h 59

#84

Merci pour la précision, je ne savais pas qu’il y avait cette pratique d’avoir un “perroquet”.

Au final il joue un peu le rôle d’un interprète qui traduit juste en langage clair les propos tenus par un animateur qui peuvent être animés par l’émotion ou le jeu. Ca reste du flux tendu et à mon avis on a pas beaucoup le droit à l’erreur !!

Néanmoins les outils de reconnaissance vocal s’améliorent quand même pas mal. Je vois sur mon Lumia la miss Cortana est pas trop mauvaise. Après c’est du traitement assisté par serveurs distants qui apprennent avec les milliers d’utilisateurs qui s’en servent, là où les solutions dont tu parles ne doivent pas avoir cet avantage.

fullero

Le 12/05/2015 à 08h 13

#85

L’ article n’ est pas très correct vis à vis de Snowden.

Pire.

Mensonger.

Ou il y a un problème de journalisme.

Ou un problème de moralité.

Parce que Snowden n’ a jamais eu besoin de voler aucun document à quiconque vu que pour voler quelque chose à quelqu’ un il faut y être étranger.

Or Snowden était non seulement un employé de la NSA  mais surtout un des admins de son système d’ information.

Cela m’ arrive de dire que je me suis volé moi même quand je ne retrouve pas mes propres affaires.

Mais dans ce cas, Snowden les détenait déjà.

Tout ce qu’ on peut lui reprocher, c’ est une entorse à son contrat de travail en ce qui concerne la confiden,tialité & nullement d’ être un voleur.

Quelques soient nos contrats de travail, nous vivoons dans des pays qui se disent démocratiques.

C’ est à dire censés respecter notre liberté de conscience.

Ce qui par conséquent pour motif de conscience, le droit à cette liberté étant une primauté des droits de l’ homme & de la démocratie il me semble, revient à l’ absoudre de tout péché.

Je n’ ai hamais été le toutou d’ aucun patron.

Et s’ il me vient l’ envie de lui claquer la “gle parce qu’il fait des trucs pas corrects, crois moi !!

Je vais pas me gêner !!

Et toi ?

 

La NSA peut transcrire à la volée des conversations dans de nombreuses langues

Mais qui s'en étonnera encore ?

Transcrire à la volée et en anglais des conversations enregistrées

Au moins un million de transcriptions par jour

La collecte des métadonnées remise en cause aux États-Unis

Tiens, en parlant de ça :

Sur GitHub et GitLab, des commentaires détournés pour stocker des malwares

Ayez confianssssssssssssssse 🐍

[FAQ] Notre antisèche sur l’informatique quantique

Restez assis, ça va bien se passer

TikTok sous pression, l’Europe menace de suspendre sa version Lite

Des tics et des tocs

Sommaire de l'article

Introduction

Transcrire à la volée et en anglais des conversations enregistrées

Au moins un million de transcriptions par jour

La collecte des métadonnées remise en cause aux États-Unis

Sur GitHub et GitLab, des commentaires détournés pour stocker des malwares

[FAQ] Notre antisèche sur l’informatique quantique

TikTok sous pression, l’Europe menace de suspendre sa version Lite

L’Université d’Oxford ferme le Future of Humanity Institute dirigé par Nick Bostrom

#LeBrief : Apple rachète le français Datakalab (IA), propagande de la Russie, fin de partie pour Roccat, Proton Mail vs dark web

Europol milite pour un chiffrement de bout en bout « flexible »

Inclusion dans la tech : critiqué, le CEO de Qovery menace une internaute de poursuites

L’extension des prestataires américains devant collaborer avec la NSA fait polémique

#LeBrief : fuite chez Speedy, Rust pour Thunderbird, Saint Exupéry et PhiFire AI pour le satellite Φsat-2

Des institutions internationales s’engagent pour l’ouverture des données sur la recherche

#Flock craque le slip et explose les quotas

[Édito] Au pays des VPN menteurs…

Les clients LastPass victimes d’une attaque par phishing orchestrée grâce à un kit clé en main

Les recommandations de la NSA pour « déployer des systèmes d’IA en toute sécurité »

#LeBrief : Windows Store amélioré, 28 licenciements chez Google, sécurité des données des français, compétition 404CTF

EUCS : la certification cloud européenne sous le feu des critiques en France

L’Institut des normes de télécommunication de l’UE (ETSI) défie la Commission européenne

Le « payer ou accepter » de Meta incompatible avec le RGPD pour le CEPD

Le CERN libère les données de la découverte du boson de Higgs

Le ministère de l’Intérieur mise sur l’américain TRM Labs pour traquer les flux illégaux de cryptos

#LeBrief : spectre du gamergate, TikTok Lite sous pression, Freebox Ultra vs Deus Ex Silicium, Pegasus en Pologne

Le Slip français se fait trouer : 1,5 million d’emails et des données de 696 144 clients dérobés ?

Après l’affaire XZ Utils, la sécurité des projets open source en question

Samsung dépasse les 10 Gb/s avec sa mémoire LPDDR5X

Élections européennes : Meta échoue à modérer des publicités de propagande pro-russe

#LeBrief : fuite chez le Slip Français, YouTube et les antipubs, Firefox 125, délit pour les deepfakes, trou noir « dormant »

Android 15 : la bêta 1.1 corrige plusieurs soucis, dont le NFC

Selon Jean-Noël Barrot, la France et l’Europe sont « pilonnés par la propagande de la Russie »

C’est la fin pour la marque Roccat, Turtle Beach prend le relai

Intelligence artificielle : Apple rachète la société française Datakalab

Proton Mail ajoute la surveillance du dark web à la recherche de fuites de données

La lutte contre les centres d’appels, une « priorité » de la cyberpolice ukrainienne

Commentaires (85)