TV en ligne : les vidéos de France 24 transcrites automatiquement !

La TV 2.0 ? 52
Marc Rees
France24 vient de mettre en ligne une nouvelle fonctionnalité sur son lecteur vidéo HD Player : la retranscription automatique des mots prononcés dans son flux vidéo, sans intervention humaine. « Depuis les commentaires des présentateurs, les récits de reportages jusqu’aux interviews de tous les invités », tout y passe, explique la chaîne. Un ratissage large puisque les 24 dernières heures d’antenne sont traitées à la volée.

france24 retranscription texte vidéo script sourds

Un texte fidèle au flux audio-vidéo

L’algorithme a été imaginé entre le LAB, pôle Recherche & Développement de FRANCE 24, en partenariat avec Yacast Media, Exalead et Vecsys. « L’algorithme de transcription permet dans la majorité des cas de générer un texte fidèle au discours prononcé à l'antenne » décrit encore la chaîne. Selon nos constats, la méthode est en effet généralement d'une efficacité redoutable, les propos étant particulièrement conformes aux paroles prononcées. (voir dans le passé l'exemple de YouTube).

Malentendants, référencement ou apprentissage des langues

Ce passage de l’oral à l’écrit laisse entrevoir de nouveaux développements. Selon Michel Lévy-Provençal, Directeur du Studio Multimédia de FRANCE 24 « cette capacité que nous avons désormais à retranscrire le flux en léger différé (quelques minutes), ouvre des possibilités considérables. Certes les textes obtenus contiennent parfois des erreurs, mais demain, l'ensemble des contenus pourraient être découpés automatiquement, enrichis en métadonnées, sous-titrés, et éventuellement traduits automatiquement ». La chaîne a également les yeux rivés sur les moteurs et l’expérience utilisateur : « à court terme, cette technologie peut grandement améliorer le référencement de nos contenus. Elle offre un meilleur confort de lecture quand l'audio pose des difficultés et en particulier pour les malentendants. Enfin, elle peut être une aide potentielle dans le cadre de l'apprentissage des langues ».

Côté Exalead, on fait valoir que « la transcription offre la possibilité d'indexation plein texte de la vidéo, aussi paradoxale que cela paraisse... et par conséquence autorise la recherche à l'intérieur même des contenus vidéos. Imaginez une télé dont le flux serait indexé en temps réel... » (un exemple exploité avec la requête Charente-Maritime)

L’internaute peut noter ou isoler l’URL d’un passage, la partager, copier le texte pour l’envoyer à des proches, etc. Tous les ingrédients sont réunis pour décloisonner la vidéo et permettre son partage. Le système utilise Silverlight, de Microsoft.

Cette fonction a été ajoutée au « lecteur HD » (Haut Débit) de la chaîne, disponible depuis décembre 2009. Avec ce lecteur l’internaute peut prendre la main sur le direct et balayer les 24 dernières heures de programmes. Il suffit de déplacer le curseur sous l’image.