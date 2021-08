Le Turing Institute, centre national britannique pour la science des données et l'IA, a récemment rendu public un rapport issu d'une série d'ateliers organisés fin 2020. En se basant sur les contributions de la communauté britannique, la centaine d'experts en science des données pointait du doigt « l'importance – et parfois le manque – de données solides et opportunes », ils estiment en effet que « de meilleures données permettraient une meilleure réponse ».

En outre, « des problèmes d'inégalité et d'exclusion liés à la science des données et à l'IA sont apparus pendant la pandémie. Ceux-ci comprenaient des préoccupations concernant la représentation inadéquate de groupes minoritaires dans les données et le faible engagement avec ces groupes, ce qui pourrait biaiser la recherche et les décisions politiques. »

En se basant sur ce rapport, le rédacteur en chef de la section intelligence artificielle (IA) de la Technology Review du MIT, Will Douglas Heaven, affirme que les chercheurs seraient arrivés à un « consensus clair » : « les outils d'IA n'avaient que peu, voire aucun, impact dans la lutte contre la covid-19 ». Il dresse un inventaire à la Prévert des ratés les plus notables identifiés dans deux nouvelles études qu'il qualifie de « majeures » :

des IA, entraînées à reconnaître les signes d'absence de Covid-19 sur un ensemble de données comportant des scanners thoraciques d'enfants, ont appris à identifier les enfants, et non l'absence de Covid-19 ;

une IA, dont le modèle reposait sur des données contenant un mélange d'analyses prises lorsque les patients étaient allongés et debout, a appris à tort à prédire un risque de Covid-19 grave à partir de la position d'une personne, parce que les patients scannés en position couchée étaient plus susceptibles d'être gravement malades ;

d'autres IA se sont focalisées sur les polices de caractère utilisées pour étiqueter les scans, et conclu que les polices utilisées par des hôpitaux avec des charges de travail plus importantes étaient prédictrices de risques de Covid-19.

Un rappel que derrière le terme galvaudé d'« intelligence artificielle », il n'y a pour le moment pas d'intelligence (ni de magie). Et que la pertinence des résultats obtenus par un modèle entraîné sur la base d'un jeu de données dépend de nombreux facteurs, dont la qualité de ces données, les critères et méthode d'entraînement, etc.

Garbage In, Garbage Out