La NSA et son équivalent anglais, le GCHQ, ont investi durant des années dans la recherche sur la reconnaissance vocale. Les agences de renseignement seraient en capacité d’écouter des conversations dans de nombreuses langues pour les convertir automatiquement en texte anglais. Les documents seraient alors stockés dans une base de données interrogeable par les analystes.
Transcrire à la volée et en anglais des conversations enregistrées
Les documents dérobés à la NSA par Edward Snowden ont montré à de très nombreuses reprises l’étendue des capacités de l’agence américaine de renseignement, mais pas seulement. Ils ont mis en évidence des réseaux de relations entre les pays, notamment une alliance formée par les États-Unis et le Royaume-Uni, et plus globalement avec le Canada, la Nouvelle-Zélande et l’Australie : les fameux Five Eyes.
The Intercept a pu plonger dans d’autres documents, qui abordent cette fois la reconnaissance vocale. On y apprend comment la NSA et le GCHQ ont utilisé le logiciel Dragon Dictate et l’ont modifié durant des années pour arriver au résultat attendu. Avec un tel outil, les agences sont capables de passer à la moulinette l’ensemble des conversations vocales enregistrées pour les traduire automatiquement sous forme de texte.
Les analystes ont donc accès à une base de données particulièrement riche contenant ces transcriptions ainsi que les fichiers audio d’origine. Divers algorithmes travaillent sur les versions textes pour repérer automatiquement certains mots-clés et marquer des conversations comme « intéressantes ».
Au moins un million de transcriptions par jour
La première utilisation du logiciel, nommé RHINEHART, remonterait à 2004 et se serait montré si efficace que les propres analystes de la NSA l’auraient surnommé « Google For Voice ». Il aurait été remplacé plusieurs années après par VoiceRT, plus performant et utilisé pour la première fois à Bagdad. En 2013, nouveau remplacement avec SPITFIRE, à son tour nettement plus rapide. Les documents donnent d’ailleurs un ordre d’idée des capacités mises en mouvement, puisque VoiceRT pouvait analyser, transcrire et repérer les termes intéressants au rythme d’un million de fichiers audio par jour.
Les documents vus par The Intercept ne permettent cependant pas de connaître l’étendue de l’utilisation de ces solutions aujourd’hui ou même durant la dernière décennie. Il est certain qu’elles ont été utilisées à l’étranger puisque le but premier est de traduire automatiquement en anglais, mais rien ne dit que l’une ou l’autre n’ait pas été employée directement sur le sol national.
La collecte des métadonnées remise en cause aux États-Unis
L’avenir des données téléphoniques aux États-Unis pourrait d’ailleurs changer dans les mois qui viennent. L’ACLU (American Civil Liberties Union) avait en effet déposé plainte contre le gouvernement pour avoir dépassé les permissions du Patriot Act sur la collecte à très large échelle des métadonnées téléphoniques. Or, une cour fédérale d’appel vient de donner raison à l’association, en indiquant que si le Congrès souhaitait autoriser une pareille collecte, il pouvait légiférer en ce sens, mais que la loi actuelle ne l’autorisait pas.
L’affaire a donc été renvoyée devant un autre tribunal. La chronologie pourrait mal tomber pour la NSA car l’autorisation doit être renouvelée périodiquement, le mandat actuel expirant le 1er juin. L’ACLU se félicite de cette victoire et estime désormais que la situation dépend entièrement du Congrès.
Commentaires (85)
#1
Çà ne m’étonne absolument pas, et en fait je pensais même que çà se savait " />
#2
Une société français participe aux logiciels de traductions“systran”, cocorico ….. ou pas " />
#3
Quand je pense que pour les personnes sourdes et malentendantes c’est encore la croix et la bannière pour comprendre le français oral. Je ne parle même pas des autres langues…
A quand un petit appareil (ou appli SmartPhone) efficace et performante pour traduire en live ou simplement “sous-titrer” en live ?
#4
Bientôt plus besoin avec Skype ! Le boulot sera fait par microsoft !
#5
#6
Je penser que les américains n’aimè pas le sous-titré." />
#7
#8
Bon et quand est-ce qu’ils nous font profiter de leur formidable outil ? " />
#9
Tu plaisantes ? Controler la planete est bien plus INtéressant !
#10
Pourquoi plusieurs langues ? Seul l’arabe suffit non ?
" /> " /> " />
#11
#12
Je verrais plutôt un traducteur “immigré-anglais”, en fait " />
#13
avec cortana qui va generaliser l’os qui ecoute en permanence ca fait une bonne combo " />
#14
Par définition Cortana transcrit un son en code informatique utilisable par une machine. Donc le truc de la NSA ne sert à rien, vu que MS le fait déjà pour te renvoyer le résultat " />
#15
Google Now me fait plus peur que Cortana pour le moment.
#16
C’est un hommage à l’actu je pense :
“Les analystes ont donc axé à une base de données” " />
#17
" /> Whoupitin j’ai même pas fait gaffe " />
#18
Ca va engendrer une renaissance des patois, dialectes et autres langues tribales, comme la langue navajo pendant la II ème guerre
#19
#20
#21
Rater voulait faire 911. " />
#22
Quand un des GAFA aura acheter la NSA.
#23
" />
" /> " />
#24
ce que je voulais dire c’est que grâce a cortana, votre ordi vous ecoute en permanence pour capter le “hey cortana” (marche aussi pour google, siri and co)
bon ok “gadget” pour le moment peu utile. mais si cela devient intégré de plus en plus a l’os au point d’en devenir nécessaire et donc devenir permanent et répandu.
ce flux audio capté en permanence pourra donc etre capté par la nsa et retranscrit en texte (plus facile a traiter par la suite je pense)
on a donc les tel portables, les tel fixes (même pas décrochés, voir citizenfour avec Snowden), les télé connectées, les consoles new gen, les ordi portables, les tablettes. il manque les desktop qui n’ont pas de perph connecté en permanence comme les casque ou webcam.
cela devrait donc évoluer sur les destop oem pour justement pouvoir utiliser cortana. donc hop micros répandus encore plus " /> (notamment entreprises)
bon je dis pas pas super sérieusement, mais une fois qu’on a lu les diff déclarations et documents Snowden on sait maintenant que c’est possible." />
attention je parle d’ordi ciblés hein. pas d’écoute trop généralisées a la metadonnées
#25
Même le WeshGrosBienouBien ?
#26
#27
Bof , je suis allé passer quelques jours a Amsterdam , et si Google Now m’a fait peur c’est plus par son efficacité , que ca soit pour retrouver le chemin jusqu’à la location , les horaires des bus et tramways , les trucs sympa a voir aux alentours….
Le truc qui m’a soufflé , dans un restaurant au moment de payer je me souvenais plus comment on disait “addition” en anglais , j’ouvre Google Now m’apprêtant a taper ma demande et dans les suggestion de traduction avant meme de taper quoi que ce soit je vois “l’addition s’il vous plait = Bill please” Là je fais wouarf ils savent même qu’on vient de manger " />
#28
#29
Les analystes ont donc axé à une base de données
Seriously? ^^
#30
Ça fonctionne pour les conversations hot ou pas ?
Remarque, transcrire “oh oui, oh oui” en “oh yes, oh yes”, ça n’a guère d’intérêt…
" />
" />
#31
#32
Je n’y connais rien mais peut-être qu’ils peuvent ralentir l’enregistrement pour mieux l’analyser . Ce qui occasionne un petit délai par rapport à de la traduction à la volée mais qui est peut-être acceptable pour eux " />
#33
C’est pour quand les sou-titre sur tout les video de toutube?
#34
#35
#36
#37
#38
#39
Le Big Data a de beaux jours devant lui :)
#40
#41
#42
wesh bn kourag pr capter se kon dis mddrr, il a intéré a etre chanmé leure bordel ptdr
#43
Tu peux bien écrire n’importe comment, ça retranscrit la voix, pas l’écrit. " />
#44
Pour plus de confort bientôt un capteur d’odeur intégré au téléphone, et plus tard on apprendra que la NSA traque l’odeur de la poudre.
#45
#46
pour calculer de la kaille bien zdeg, faut qu’il charbonne mortel.
#47
Toutes manières, si vous n’avez rien à cacher, je ne vois pas en quoi ça serait dérangeant que les Américains (la NSA) ait accès à tout ce qui passe par du réseau…
Après tout, ils ne le font que probablement pour chasser du barbu, certainement pas pour des secrets indus ou autre, z’ont beaucoup trop de morale pour s’abaisser à ce genre de méthodes.
#48
On parle de transcription (conversion de paroles orales en texte écrit) ou de traduction (conversion d’une langue à l’autre) ?
#49
Vendredi, trop visible " />
#50
Ouais mais bon, on s’entend que Cortana détecte le Hey Cortana en local, hein… En plus, toute observation passant par ce genre de technique serait très facilement visible au niveau de la connection internet qui en prendrait un coup.
#51
#52
#53
#54
#55
#56
#57
#58
#59
Dès que tu parles de CIA et de NSA, on te traite toujours de parano… Les gens sont navrants de naïveté.
#60
Mais qui s’en étonnera encore ?
En lisant de sous-titre j’ai ri (jaune)… et puis je me suis rendu compte de ma non indignation.
En effet, beaucoup affirme aisément que cela ne les surprend pas et/ou qu’ils le savaient déjà.
Pour finir sur un “bof”.
Bof ?!?
Bof d’avoir (enfin!) les preuves d’un système de surveillance généralisé et massif des populations par des gouvernements de dites “démocraties” ?!?
Bof de voir que la majorité des surveillances ne concerne en rien le terrorisme ou plus généralement la sécurité (cf la surveillance de la France par l’Allemagne au profit de la NSA) ?!?
Et pourtant ceux qui finissent avec ce “bof” ( dont je fais parti) sont les mêmes qui se sont insurgés contre la HADOPI, l’ACTA, LA LOPPSI, etc.
A croire que ce qui n’est pas palpable est plus facilement accepté.
Il semble malheureusement que le coup des pédos-nazis-terroristes fonctionnent toujours.
Ce sous-titre démontre finalement l’acceptation de ce système à la Big Brother par les populations.
Et le plus drôle est de voir les réactions quand on ose affirmer qu’on n’est pas dans une véritable Démocratie…
Comme si le moins pire était la seule alternative… " />
#61
Je me demande toujours, connaissant le baratin habituel des commerciaux en logiciels, à quel point ces annonces sont réalistes d’un point de vue réelle.
S’il y a des logiciels qui m’étonnent sur leurs capacités, je vois aussi beaucoup de déconvenues. Les capacités réelles d’un logiciel quand on le met en place sont souvent loin de ce que l’on s’imagine en lisant les brochures.
Exemple dans la reconnaissance vocale: incapacité chronique à comprendre une longue phrase dite à vitesse normale. Incapacité chronique à comprendre une phrase dans laquelle on ne marque pas correctement la ponctuation par des pauses.
Bien sûr, la NSA peut avoir mieux, mais certainement en se basant (comme nous même) sur une réinterprétation des sons à partir de ce que l’on connais comme tournure de phrase courante (globalement et de la part de notre interlocuteur). Tout cela pour dire que moi-même j’ai souvent du mal à comprendre ce que disent les gens au téléphone avec le réseau actuel, j’ai dû mal à croire qu’un ordinateur puisse retranscrire correctement sans faire de “wild guess”.
#62
Max Payne.
#63
Donc si je comprends bien, ils ont un outil pour retranscrire « en live » une source audio sous une forme numérique quelconque (ce qui peut vouloir dire plein de choses, à priori ce n’est pas impressionnant du tout), puis ils donnent le résultat à manger à un outil capable de définir la langue source (ça me semble compliqué, à tort?) et traduire le merdier en anglais (probablement sous tout un tas de conditions)…
#64
#65
#66
#67
#68
il a de la transcription quasi temp-reel dans les systèmes de sous-titres des chaines TV.
Il suffit d’activer les sous-titres mal-entendants pour s’en rendre compte.
Quand les matchs sportifs sont diffusés dans les bars tres bruyants, vous avez jamais remarqué que le barman affichait la retranscription automatique des commentaires sportifs?
#69
tu n’as même pas une petite idée ???
#70
#71
#72
#73
#74
Non, il ne parle pas des films, mais des lives et des reportages qui n’ont pas de piste sous-titre à priori. Il s’agit donc bien de transcription temps réel. Aprés comme il n’y a qu’un seul flux à gérer par chaine, c’est peut-être assuré par un humain…
#75
#76
#77
#78
#79
Je pensais vraiment que Max Payne était antérieur à Matrix !
#80
C’est triste mais ça ne me choque même plus.
Ca ne me choque plus qu’ils bafouent tant de droits et de valeurs - Y compris celles portées par leur propre pays. Et ça ne me choque plus qu’ils disposent d’une technologie qui pourraient servir à tant de choses…
Ca veut dire que je suis habitué ? " />
#81
Bon, il va falloir que j’apprenne le Klingon ou elfique, jusqu’à ce que la NSA décode aussi ça. " />
#82
" />
#83
#84
Merci pour la précision, je ne savais pas qu’il y avait cette pratique d’avoir un “perroquet”.
Au final il joue un peu le rôle d’un interprète qui traduit juste en langage clair les propos tenus par un animateur qui peuvent être animés par l’émotion ou le jeu. Ca reste du flux tendu et à mon avis on a pas beaucoup le droit à l’erreur !!
Néanmoins les outils de reconnaissance vocal s’améliorent quand même pas mal. Je vois sur mon Lumia la miss Cortana est pas trop mauvaise. Après c’est du traitement assisté par serveurs distants qui apprennent avec les milliers d’utilisateurs qui s’en servent, là où les solutions dont tu parles ne doivent pas avoir cet avantage.
#85
L’ article n’ est pas très correct vis à vis de Snowden.
Pire.
Mensonger.
Ou il y a un problème de journalisme.
Ou un problème de moralité.
Parce que Snowden n’ a jamais eu besoin de voler aucun document à quiconque vu que pour voler quelque chose à quelqu’ un il faut y être étranger.
Or Snowden était non seulement un employé de la NSA mais surtout un des admins de son système d’ information.
Cela m’ arrive de dire que je me suis volé moi même quand je ne retrouve pas mes propres affaires.
Mais dans ce cas, Snowden les détenait déjà.
Tout ce qu’ on peut lui reprocher, c’ est une entorse à son contrat de travail en ce qui concerne la confiden,tialité & nullement d’ être un voleur.
Quelques soient nos contrats de travail, nous vivoons dans des pays qui se disent démocratiques.
C’ est à dire censés respecter notre liberté de conscience.
Ce qui par conséquent pour motif de conscience, le droit à cette liberté étant une primauté des droits de l’ homme & de la démocratie il me semble, revient à l’ absoudre de tout péché.
Je n’ ai hamais été le toutou d’ aucun patron.
Et s’ il me vient l’ envie de lui claquer la “gle parce qu’il fait des trucs pas corrects, crois moi !!
Je vais pas me gêner !!
Et toi ?