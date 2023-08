L’intelligence artificielle, le machine learning, la blockchain… le paysage numérique est riche en « solutions » consommatrices de ressources, bien que cela dépende des usages. Le LINC de la CNIL détaille cette problématique et propose quelques pistes de réflexion, notamment autour de la sobriété et de la frugalité.

Dans son 9e cahier IP (Innovation et Prospective), le Laboratoire d’innovation numérique de la CNIL (alias LINC) revient sur un sujet d’actualité, avec « une exploration des intersections entre protection des données, des libertés, et de l’environnement ». Dans un premier article, nous sommes revenus sur les paradoxes et controverses de la consommation bien réelle d’un monde virtuel. Ce n’était qu’une partie du cahier de 70 pages (pdf).

Intelligence artificielle : docteur Jekyll et M. Hyde

Dans ce même cahier, il est aussi question d’intelligence artificielle, avec un constat : « Ces systèmes et outils présentent de grands enjeux en termes de protection des données. S’ils présentent d’ores et déjà des succès notables, ils sont encore sujets à des défaillances, des attaques, et peuvent avoir dans certains cas des impacts insoupçonnés sur les individus et la société ».

Pour ne citer qu’un exemple, certains ont tendance à renforcer les biais humains, justement, car ils sont entrainés sur des données provenant d’humains. En cas d’attaque, la paralysie des systèmes vitaux dans les hôpitaux, la fuite de données personnelles (y compris médicales) ou la perte de fichiers clients peuvent avoir des conséquences catastrophiques.

Ce n’est pas la seule fois où l’intelligence artificielle a un double visage : « Les IA, comme tout système informatique, pouvant être vues à la fois comme un moyen d’améliorer ou optimiser des consommations, et comme une source de consommation importante, sans que l’on soit toujours en capacité d’en mesurer réellement la balance ».

La CNIL donne quelques exemples : l’entrainement de BERT (Google) « a nécessité l’apprentissage de quelque 340 millions de paramètres pour un coût en électricité équivalent à la consommation d’un ménage américain pendant 50 jours ». Du côté de GPT-3 (OpenAI, utilisé pour ChatGPT), on compte 175 milliards de paramètres, et même jusqu’à 540 milliards de paramètres Pathways (Google). Reste qu’il est bien difficile pour les chercheurs de mesurer les effets indirects du développement et de l’utilisation des IA.

Le Laboratoire reprend une étude sur les émissions carbone de l’entrainement des algorithmes : « des régions à faible émission comme la France ou la Norvège pourraient permettre d’économiser 70 % des émissions par rapport à des régions comme le centre des États-Unis et l’Allemagne. L’heure de la journée à laquelle les calculs sont effectués à également un impact significatif ».

Parfois (souvent ?), il est difficile d’obtenir des données fiables et comparables, sans compter les contraintes locales en matière de gestion des données privées, avec le RGPD en Europe par exemple.

La question de l’usage est primordiale

Le cahier revient aussi sur le choix des priorités : « la recherche d’avancées dans la détection de la mort subite du nourrisson semble par exemple plus prioritaire que la production de nouveaux filtres pour des images postées sur les réseaux sociaux ».

C’est l’occasion d’évoquer un autre sujet, tout aussi déterminant : l’usage des algorithmes. Le machine learning peut ainsi servir à optimiser la performance énergétique des centres de données (et d’autres infrastructures) – et donc « être considérés directement utiles à la lutte contre le réchauffement » –, à l’inverse par exemple de l’optimisation de la publicité. Pour résumer, « l’impact environnemental de l’IA dépendra largement de son usage ».

La publicité « a un poids bien réel »