Fin 2017, Mozilla lançait son projet visant à aider les développeurs dans le domaine de la reconnaissance vocale.
Un modèle de traitement et surtout une base de données comprenant environ 400 000 échantillons vocaux étaient mis à disposition, permettant ainsi à chacun d'entraîner une intelligence artificielle par exemple.
Début 2019, elle évoluait pour atteindre 1 400 heures d'enregistrement dans 22 langues. Fin juillet, NVIDIA annonçait s’associer à l'initiative évoquant désormais 13 905 heures de voix dans 76 langues. Les plus représentées sont : anglais (2 630 heures), kinyarwanda (2 260), allemand (1 040), catalan (920) et espéranto (840).