Dans son journal, le CNRS revient sur le projet Covid-nma. Le but est de se servir des outils informatiques pour agréger « des milliers de publications, la bibliographie sur les traitements ».

« Alors que nous n’avons encore que peu de connaissances sur la maladie, médecins et responsables prennent tous les jours des décisions aux conséquences importantes sur la santé publique. Devant l’urgence de la situation, nous voulons aider à la planification des études cliniques et donner accès aux informations nécessaires », explique Isabelle Boutro du Centre de recherche en épidémiologie et statistiques (Cress).

Les études sont disponibles, mais nécessitent un traitement automatisé face à la quantité de données. Les chercheurs ont fait face à diverses difficultés : « Dans le contexte clinique, l’abréviation “mg” peut aussi bien désigner un milligramme que du magnésium. Lever cette ambiguïté demande de tenir compte du contexte dans lequel le terme est employé », indique Pierre Zweigenbaum, directeur de recherche CNRS.

Une fois les données nettoyées, il faut encore les rendre facilement accessibles : « Dans le cas du Covid-19, nous avons déployé des programmes de visualisation et de nettoyage des données, afin de déterminer leur qualité et de régler, en collaboration avec les experts du Cress, les anomalies et les erreurs, déclare-t-il. Nous avons identifié 80 % des problèmes lors d’une première phase, puis amélioré nos outils », détaille Romain Vuillemot, maître de conférences au Laboratoire d’informatique en image et systèmes d’information.