du 01 mars 2019
Date

Choisir une autre édition

Mozilla Common Voice devient la plus grande base d'échantillons de voix en accès libre

Fin 2017, Mozilla initiait un projet baptisé Common Voice. Sur la base de 20 000 participations volontaires initialement, l’éditeur avait bâti un modèle de traitement et une vaste base de données, le tout sous licence MPL 2.0.

La collection a évolué pour inclure aujourd’hui 1 400 heures d’enregistrement de 42 000 contributeurs. Il s’agit toujours en bonne partie de volontaires, mais les échantillons incluent maintenant des participations de professionnels et linguistes travaillant sur les technologies liées à la voix.

La base de données est désormais disponible en 22 langues, dont le néerlandais, le haka chin, l'espéranto, le farsi, le basque, l’espagnol, le français, l’allemand, le mandarin, le chinois traditionnel, le gallois et le kabyle.

Le projet a finalement accouché de la plus grande base d’échantillons vocaux en libre accès. L’objectif n’a pas changé, à savoir aider l'entraînement des modèles de machine learning à la reconnaissance vocale.

Actuellement, Mozilla affirme être capable de convertir à la volée des paroles en texte grâce à DeepSpeech, son moteur open source Speech-to-Text. Le moteur est d’ailleurs déjà utilisé dans certains produits comme Mycroft (assistant vocal open source), Leon (assistant personnel) et FusionPBX pour la transcription des messages.

Même si Common Voice vient de franchir une étape majeure, le projet va continuer à s’enrichir. Mozilla annonce vouloir « tester différentes approches pour accroître la qualité et la quantité des données » que l’éditeur pourra collecter, aussi bien grâce à la communauté que des partenariats.

Le site Common Voices permet de télécharger n’importe quel lot de données, en fonction de la langue choisie. Attention, tous les lots ne sont pas équivalents. Un regard sur les versions anglaise et française le montre bien, la première pesant 22 Go, la seconde 2 Go.

chargement Chargement des commentaires...

À découvrir dans #LeBrief
Copié dans le presse-papier !

Les bonnes nouvelles s'enchaînent pour la société qui souhaite proposer une couverture Internet globale à Internet via une constellation de plusieurs centaines de satellites.

Après avoir envoyé ses six premiers engins en orbite fin février, elle vient de boucler une levée de fonds de 1,25 milliard de dollars, comme l'indique la société. Depuis le lancement du projet en 2015, elle a ainsi collecté pas moins de 3,4 milliards de dollars.

SoftBank répond de nouveau présent à ce tour de table, en expliquant que « OneWeb a l'avantage du premier entrant et est en passe de devenir le plus grand réseau de communications réellement mondial ». Pour rappel, d'autres sont également sur les rangs pour déployer ce genre de service, notamment SpaceX.

Les Mexicains de Grupo Salinas, Qualcomm Technologies et le gouvernement du Rwanda sont parmi les investisseurs. La mise en service du réseau est prévue pour 2021. Une vingtaine de nouveaux lancements seront effectués d'ici fin 2020 pour arriver à une constellation de 650 satellites.

Copié dans le presse-papier !

La société explique que ce nouveau tour de table a été réalisé auprès du fonds d’investissement General Atlantic, des investisseurs historiques (dont Bpifrance, Eurazeo, Kernel et Accel), de médecins et entrepreneurs allemands. Elle dépasse le milliard d'euros de valorisation, devenant ainsi une licorne.

Doctolib souhaite « accélérer la transformation numérique du système de santé », en commençant par l'Allemagne et la France. La société ne cache pas son ambition d'aller plus loin. Elle veut en effet « s’implanter dans de nouveaux pays », mais sans préciser lesquels.

« Nous investissons en priorité dans l’équipe. Nous allons doubler de taille dans les trois prochaines années et allons continuer à investir pour garantir le développement personnel de nos salariés. Nous sommes aujourd’hui 750 Doctolibers », explique Stanislas Niox-Chateau, cofondateur et président de Doctolib.

Copié dans le presse-papier !

Après des mois de rebondissements et d'une lutte aux enchères avec Comcast, c'est finalement Disney qui avait remporté la bataille.

Depuis, les autorités ont donné leurs feu vert et il ne restait donc plus qu'à finaliser l'opération. C'est désormais chose faite depuis aujourd'hui. Certaines chaînes comme Fox News, Business, Sports et des actifs ont été transférées à Fox Corporation avant la conclusion de cette opération.

Pour rappel, Disney hérite au passage de 30 % de Hulu, qui viennent s'ajouter aux 30 % dont la société disposait déjà. Disney voudrait aussi croquer les 10 % que détient AT&T (Warner Media). Les 30 % restants sont dans les mains de… Comcast.

« Disney aimerait racheter nos parts. Je ne pense pas que cela arrivera à court terme », affirmait récemment le directeur général de NBCUniversal.

Copié dans le presse-papier !

Comme on pouvait s'en douter, malgré un premier communiqué vigoureux, la filiale du groupe de Patrick Drahi, propriétaire de Molotov et SFR, n'a pas coupé l'accès à ses chaînes de la TNT à son concurrent cette nuit.

Hier en fin d'après-midi, il a plutôt fait savoir que « les chaînes BFM/RMC acceptent la médiation proposée par le CSA ». Un CSA qui va devoir également se pencher sur le message affiché aux spectateurs de ces chaînes les alertant de son conflit avec Free.

Altice justifie son changement de position par le fait que « Free ne rejette plus le principe d’un accord global portant sur la distribution de ses chaînes en clair et de leurs services associés contre versement d’une rémunération, de même nature que ceux conclus avec les groupes TF1 et M6 ».

On attend désormais de voir la suite qui sera donnée à cette affaire.

Copié dans le presse-papier !

En septembre dernier, Google avait annoncé la fin d'Inbox pour se consacrer à Gmail. La société se justifiait en indiquant que sa messagerie historique avait déjà récupéré les améliorations et fonctionnalités d'Inbox au fils des mois. Aucun chiffre n'était par contre donné concernant l'utilisation de son autre service.

Le géant du Net ajoutait alors qu'il ne proposerait « plus d'assistance pour Inbox à partir de 2019 » et qu'Inbox by Gmail « fermerait à la fin du mois de mars 2019 ». Finalement un très court sursis aura été accordé puisque la fermeture est programmée pour le 2 avril, en même temps que Google+, comme l'indique 9To5Google.