du 30 novembre 2017
Date

Choisir une autre édition

Reconnaissance vocale : Mozilla veut aider, avec modèle et données

L'éditeur souhaite fournir les outils nécessaires à tous les intéressés par la reconnaissance vocale. Il propose donc un modèle de traitement et surtout une base de données.

Mozilla a pu récupérer environ 400 000 échantillons vocaux, via les participations volontaires de 20 000 personnes (projet Common Voice). L'éditeur met cette base à disposition, pour compenser le manque habituel de données, pénalisant souvent les entreprises.

Mozilla fournit également un modèle de reconnaissance autant qu'un moteur speech-to-text : Project DeepSpeech, lui-même reprenant les bases des recherches Deep Speech menées par Baidu. Les travaux de Mozilla se servent de TensorFlow (Google) et ont été publiées sur GitHub sous licence open source (MPL 2.0).

Mozilla veut encourager les développeurs à proposer des fonctions de reconnaissance vocale sans passer par les quelques gros ténors du secteur (Siri, Assistant, Alexa…). Notez cependant que la base fournie ne propose pour l'instant que des extraits en anglais. L'éditeur compte élargir cette collection à d'autres langages durant le premier semestre 2018.

chargement Chargement des commentaires...