Intelligence artificielle : décortiquons les 235 pages du rapport de Cédric Villani

Même pas un seul dessin ! 34
Accès libre
image dediée
Crédits : Henrik5000/iStock
Nouvelle Techno DOSSIER
Sébastien Gavois

La mission de Cédric Villani sur la stratégie nationale et européenne en matière d'intelligence artificielle touche à sa fin. L'épais rapport fait pas moins de 235 pages, que nous avons analysées dans ce dossier en trois parties. La question des données, carburant indispensable des IA actuelles, occupe une place de choix.

L'intelligence artificielle est un sujet porteur, autant par les craintes (lire notre dossier) que les espoirs qu'il suscite. La France occupe une place de choix dans le monde de la recherche, avec plusieurs scientifiques à la tête de groupes d'envergure mondiale. L'un des plus médiatiques est certainement Yann LeCun, patron de l'IA chez Facebook, épaulé depuis peu par un autre français : Jérôme Pesenti.

En janvier 2017, Thierry Mandon, alors secrétaire d'État à l'Enseignement, s'en offusquait. Il évoquait un secteur de la recherche « en grand danger » en France, avec des centres « pillés » : « Les chercheurs sont débauchés par des sociétés qui ne sont pas françaises et qui ont le bon goût de ne pas payer d'impôt en France » affirmait-il lors de la conférence #FranceIA (lire notre compte rendu).

Des missions sur l'IA comme s'il en pleuvait 

À l'image des voitures autonomes, la question de l'intelligence artificielle prend du retard dans l'Hexagone, malgré la multiplication des rapports sur le sujet. S'ils sont nécessaires pour poser les bases, il n'est pas utile de les multiplier comme les petits pains. Début septembre, le gouvernement confiait une mission sur l'intelligence artificielle à Cédric Villani : mathématicien, lauréat de la Médaille Fields en 2010, et député LREM de l'Essonne.

Un de plus après ceux des derniers mois/années ? Pour rappel, FranceIA, l'Office parlementaire d'évaluation des choix scientifiques et technologiquesle Comité économique et social européen et la CNIL se sont déjà penchés en détail sur la question de l'intelligence artificielle. 

Cédric Villani veut proposer des actions, du concret... 

Cédric Villani avait déjà annoncé que son rapport n'était « ni une prédiction sur ce qui va se passer [...] ni une liste de projets à soutenir [...] ni une liste de recommandations générales ». Son but est de proposer des actions : « Comment organise-t-on des filières, lesquelles et qui s’en charge ? Faut-il en passer par la loi ? ».

Lors d'un passage au Sénat en octobre dernier (lire notre compte rendu), Mounir Mahjoubi abondait dans ce sens : il s'agissait de « présenter des orientations pratiques sur les débats qu'il est urgent de mener, mais aussi sur les enjeux d'investissements industriels qu'il aura considérés, à la suite de ses auditions, comme étant majeurs ». Selon Mahjoubi, mettre en œuvre les propositions précédentes serait trop coûteux ; il faut donc procéder à des « décisions stratégiques à hauteur de nos capacités stratégiques et d'investissement ».

Maintenant qu'un site dédié baptisé AI for Humanity a été mis en ligne et que le rapport est disponible (une conférence sera  diffusée en direct demain matin), les promesses sont-elles tenues ?

Notre dossier sur le rapport de Cédric Villani sur l'intelligence artificielle :

Un rapport de 235 pages, comprenant « 10 messages clés »

Avant d'entrer dans le détail du rapport, plantons le décor. Cette mission est composée de sept personnes (dont une seule femme), comprenant notamment le directeur de recherche INRIA Marc Schoenauer, le secrétaire général du Conseil national du numérique Yann Bonnet et l'ingénieur en armement de la DGA Bertrand Rondepierre.

Ils ont procédé à près de 420 auditions d'experts provenant d'horizons variés : santé, justice, transports, éthique, industrie, éducation, emploi et formation, etc. Une consultation publique a également été mise en place avec 2 000 contributions de 1 639 participants. Enfin, dans le cadre de cette mission, « une étude comparative (benchmark) des politiques mises en place dans quinze pays ».

Comme toujours, ce énième rapport commence par une définition maison de l'intelligence artificielle, se rapprochant de toutes les autres : « L'intelligence artificielle désigne plutôt un programme qui a une ambition : reproduire les performances des processus cognitifs de l'être humain – puis les dépasser, en rapidité et en complexité, bénéficiant de l'augmentation de la puissance de calcul disponible ».

En guise de résumé, l'équipe de Cédric Villani donne « 10 messages clés », que nous allons détailler :

  • Favoriser l’émergence d’un écosystème européen de la donnée
  • Créer un réseau de recherche d’excellence en IA
  • Concentrer les efforts sur quatre domaines prioritaires : santé, transport-mobilité, écologie et défense-sécurité
  • Structurer le soutien à l’innovation sur de grands défis et expérimenter
  • Créer un Lab public de la transformation du travail 
  • Expérimenter un dialogue social au niveau de la chaîne de valeur pour financer la formation professionnelle
  • Tripler le nombre de personnes formées à l’IA d’ici 2020
  • Se donner les moyens de transformer les services publics grâce à l’IA 
  • Intégrer les considérations éthiques à tous les niveaux, de la conception jusqu’à leur impact dans la société
  • Porter une politique audacieuse de féminisation du secteur de l’IA

Les données : le nerf de la guerre dans l'IA

Les jeux de données sont très importants pour l'intelligence artificielle moderne : il s'agit en effet de la matière première du machine learning. « On peut comparer le fonctionnement d’un algorithme de machine learning au développement cognitif de l’enfant : celui-ci apprend en observant le monde, en analysant la manière dont les individus interagissent, en reproduisant les règles sans pour autant qu’on lui expose explicitement » explique le rapport.

Si l’apprentissage par les données n’est pas l'unique méthode pour créer de l’intelligence artificielle, « c’est aujourd’hui la méthode la plus utilisée, celle qui se développe le plus vite et celle qui fait l’objet de la compétition internationale la plus vive ».

Des données seules sont déjà utiles, mais leur valeur est décuplée lorsqu’elles sont structurées et annotées. Sur ce point, les géants du Net américains et asiatiques (Amazon, Facebook, Baidu, Alibaba, Tencent, etc.) disposent d'un avantage certain. De plus, en France, « près de 80 % des visites vers les 25 sites les plus populaires sur un mois sont captés par les grandes plateformes américaines ». Sur ce point, L’Europe fait figure d’exception : la Russie et la Chine parviennent à capter l’essentiel des données de leurs utilisateurs.

RGPD : 20 ans trop tard, mais le droit à la portabilité ouvre des perspectives

Alors que le RGPD entrera en vigueur le 25 mai (lire notre analyse ligne par ligne), le rapport regrette que ces dispositions n'arrivent que maintenant : si elles avaient existé il y a 20 ans, « il est probable que Facebook, Amazon ou Google n’auraient pas pénétré le marché européen aussi facilement et que la concurrence aurait pu démarrer sur des bases plus saines ».

Le droit à la portabilité du RGPD pourrait néanmoins déboucher sur des actions citoyennes : « on peut envisager, à moyen terme, que des citoyens décident de récupérer leurs données auprès de différents services pour les mettre à disposition d’un acteur public ou de la recherche scientifique au profit de missions d’intérêt général [...] Sur le modèle de l’appel au don du sang, il est possible d’imaginer des campagnes d’ampleur, au niveau municipal, régional ou national, visant à constituer des bases de données nécessaires au développement d’intelligences artificielles orientées sur des missions de service public ».

Il ne faut pas uniquement miser sur la récupération de données existantes indique le rapport, mais aussi penser à de nouveaux moyens d'en collecter. Bref, « il faut brasser au plus large pour espérer créer un effet "boule de neige" ».

Le rapport ne veut pas forcément d'un « Google européen »

« Ce n’est pas forcément grâce à un « Google européen » que la France et l’Europe pourront se faire une place » tempère le rapport. En effet, « la puissance publique doit pour cela amorcer de nouveaux modes de production, de collaboration et de gouvernance sur les données, par la constitution de "communs de la donnée" ».

Cédric Villani veut mettre en place une « incitation » au partage et à la mutualisation, l’État pouvant jouer « un rôle de tiers de confiance ». De l'aveu même du rapport, ce n'est pas gagné : en 2017, une étude de l'Union européenne indiquait que 90 % des entreprises ne partageaient pas leurs données (les fuites n'étaient pas prises en comptes).

Si ce n'est pas suffisant, le député évoque également la possibilité d'« imposer l'ouverture » pour des données d'intérêt général. Le rapport précise tout de même que Laurent Cytermann avait en 2015 émis des réserves sur ce sujet. Dans tous les cas, il souhaite que les données publiques (météo, agricoles, transports, énergie, déchets, cadastre, diagnostic de performance énergétique, etc.) soient mises à disposition des chercheurs dès l'année prochaine. Dans quel but ?

« Cette libération pourrait servir à encourager les innovations qui ouvrent la voie à des actions rapides : rénovation mutualisée de l’habitat, valorisation des énergies renouvelables, efficacité énergétique, facilitation des circuits courts, valorisation des déchets des particuliers et des industriels, permis de construire, permis de démolir, etc. Mais également des recherches pour des innovations plus structurées : météo prédictive sans équations différentielles, amélioration du trafic prédictif, prévision des pollutions, crue, etc. »

Autre source pour les précieuses données : « la réforme actuelle du droit d’auteur devrait – enfin ! – permettre d’autoriser les pratiques de fouille de texte et de données (text and data mining) dans un objectif de compétitivité de notre recherche publique ».

Mettre en avant les pépites nationales

Le rapport souhaiterait également une valorisation de certaines initiatives françaises. Quelques exemples sont cités : la place de marché des données Dawex, la plateforme d'échange Catalogue de Transdev et l'offre de mise en relation d'acteurs proposée par La Fabrique des Mobilités.

Autre point sur lequel la France est en retrait : « la visibilité des entreprises faisant de l'intelligence artificielle : les grandes entreprises préfèrent parfois céder aux sirènes des géants mondiaux de la discipline plutôt que de faire confiance à nos pépites nationales, soit parce qu’elles en ignorent l’existence, soit par excès de prudence ». La mission souhaite donc fédérer les acteurs nationaux et les pousser vers le devant de la scène.

Le rapport préconise la mise en place un label rattaché à la French Tech, ainsi que des prix d’innovation. Le but serait ensuite de l'utiliser comme socle pour organiser des événements autour de la recherche et de l’innovation en intelligence artificielle.

Guichet unique et allègement de la réglementation

Elle évoque également l'idée de créer un guichet unique d’information, dans la même veine que French Tech Central. Il favoriserait le dialogue avec les différentes institutions. Afin d'éviter des délais à rallonge, une contrainte de réponse dans les trois mois pourrait être instaurée. 

La commande publique est un autre levier de croissance pour l'intelligence artificielle : actuellement, le seuil de l’ordonnance sur les marchés publics est de 25 000 euros HT en France, contre 144 000 à 443 000 euros HT en Europe. Selon le rapport, ramener les seuils au niveau européen permettrait de « fluidifier l’exercice de l’achat public dans le domaine de l’IA ».

Afin d'être efficace, le rapport préconise d'éviter « les logiques de saupoudrage et de concentrer l’effort sur quatre secteurs prioritaires : santé, environnement, transports-mobilités et défense-sécurité ». Pourquoi seulement ces quatre-là et pas la banque ou l'assurance ? Car leur développement nécessite des initiatives publiques, contrairement aux autres où le privé s'en occupe déjà. 

Pour que l'intelligence artificielle puisse se développer dans de bonnes conditions, le rapport souhaite mettre en place des terrains d’expérimentation en conditions réelles et des « bacs à sable d’innovation », articulés autour de trois aspects :

  • un allègement, temporaire, de certaines contraintes réglementaires pour laisser le champ libre à l’innovation
  • un accompagnement des acteurs dans la prise en compte de leurs obligations
  • des moyens d’expérimentation en situation réelle.

DINSIC, ANSSI... : la transformation de l'État

Du côté de l'Etat, il reste encore beaucoup de travail pour prendre à pleine main cette transformation explique le rapport, d'autant qu'il se doit d'en être un des moteurs. Cédric Villani souhaite donc notamment mettre en place un coordinateur interministériel et créer au sein de la DINSIC un pôle de compétences mutualisées en IA.

L’Agence Nationale pour la Sécurité des Systèmes d’information (ANSSI) pourrait voir son rôle étendu et se doter d'une mission « de veille, de prospective et d’étude sur la question de la sécurité de l’IA », dans le but d'éviter l'apparition de menaces. Il est en effet possible de fausser arbitrairement les résultats d'un algorithme, de manipuler les données injectées et de créer de nouvelles attaques en se basant sur les faiblesses des techniques d'IA actuelles.


chargement
Chargement des commentaires...