L’intelligence artificielle, le machine learning, la blockchain… le paysage numérique est riche en « solutions » consommatrices de ressources, bien que cela dépende des usages. Le LINC de la CNIL détaille cette problématique et propose quelques pistes de réflexion, notamment autour de la sobriété et de la frugalité.
Dans son 9e cahier IP (Innovation et Prospective), le Laboratoire d’innovation numérique de la CNIL (alias LINC) revient sur un sujet d’actualité, avec « une exploration des intersections entre protection des données, des libertés, et de l’environnement ». Dans un premier article, nous sommes revenus sur les paradoxes et controverses de la consommation bien réelle d’un monde virtuel. Ce n’était qu’une partie du cahier de 70 pages (pdf).
Intelligence artificielle : docteur Jekyll et M. Hyde
Dans ce même cahier, il est aussi question d’intelligence artificielle, avec un constat : « Ces systèmes et outils présentent de grands enjeux en termes de protection des données. S’ils présentent d’ores et déjà des succès notables, ils sont encore sujets à des défaillances, des attaques, et peuvent avoir dans certains cas des impacts insoupçonnés sur les individus et la société ».
Pour ne citer qu’un exemple, certains ont tendance à renforcer les biais humains, justement, car ils sont entrainés sur des données provenant d’humains. En cas d’attaque, la paralysie des systèmes vitaux dans les hôpitaux, la fuite de données personnelles (y compris médicales) ou la perte de fichiers clients peuvent avoir des conséquences catastrophiques.
Ce n’est pas la seule fois où l’intelligence artificielle a un double visage : « Les IA, comme tout système informatique, pouvant être vues à la fois comme un moyen d’améliorer ou optimiser des consommations, et comme une source de consommation importante, sans que l’on soit toujours en capacité d’en mesurer réellement la balance ».
La CNIL donne quelques exemples : l’entrainement de BERT (Google) « a nécessité l’apprentissage de quelque 340 millions de paramètres pour un coût en électricité équivalent à la consommation d’un ménage américain pendant 50 jours ». Du côté de GPT-3 (OpenAI, utilisé pour ChatGPT), on compte 175 milliards de paramètres, et même jusqu’à 540 milliards de paramètres Pathways (Google). Reste qu’il est bien difficile pour les chercheurs de mesurer les effets indirects du développement et de l’utilisation des IA.
Le Laboratoire reprend une étude sur les émissions carbone de l’entrainement des algorithmes : « des régions à faible émission comme la France ou la Norvège pourraient permettre d’économiser 70 % des émissions par rapport à des régions comme le centre des États-Unis et l’Allemagne. L’heure de la journée à laquelle les calculs sont effectués à également un impact significatif ».
Parfois (souvent ?), il est difficile d’obtenir des données fiables et comparables, sans compter les contraintes locales en matière de gestion des données privées, avec le RGPD en Europe par exemple.
- Empreinte environnementale du numérique : entre certitudes, inconnues et recommandations
- Mesurer l'empreinte environnementale du numérique, un vrai casse-tête
- L’Europe face à la consommation croissante des datacenters et l’explosion des services cloud
La question de l’usage est primordiale
Le cahier revient aussi sur le choix des priorités : « la recherche d’avancées dans la détection de la mort subite du nourrisson semble par exemple plus prioritaire que la production de nouveaux filtres pour des images postées sur les réseaux sociaux ».
C’est l’occasion d’évoquer un autre sujet, tout aussi déterminant : l’usage des algorithmes. Le machine learning peut ainsi servir à optimiser la performance énergétique des centres de données (et d’autres infrastructures) – et donc « être considérés directement utiles à la lutte contre le réchauffement » –, à l’inverse par exemple de l’optimisation de la publicité. Pour résumer, « l’impact environnemental de l’IA dépendra largement de son usage ».
La publicité « a un poids bien réel »
Une partie de l’étude se penche justement sur le cas de la publicité en ligne, notamment celle qui est ciblée. Après l’entrée du RGPD, un développeur s’est amusé à comparer les versions américaines et européennes du site USA Today, qui proposait une version sans traceurs ni publicités sur le vieux continent.
Le verdict est sans appel (et sans grande surprise) : « La version européenne du site chargeait 500 kb de données, quand la version états-unienne, ses cookies et ses publicités nécessitait le chargement de 5,2 Mb de données », soit 10 fois plus ! Autre résultat intéressant, venant d’une équipe de l’INSA Lyon : « les publicités ont un fort impact sur la batterie, qui s’épuisent jusqu’à trois fois plus vite sur certains sites entre des versions avec ou sans publicité ».
Bref, « La publicité ne pèse pas seulement sur l’attention, elle a un poids bien réel. Quand le trafic ne l’est pas toujours ». La CNIL met en avant plusieurs pistes pour agir : « refus[er] les cookies et install[er] des logiciels bloqueurs de publicité, autant de petits gestes qui par des effets de masse peuvent bénéficier aux individus, et à la planète ».
La blockchain et les cryptomonnaies… « c’est compliqué »
C’est un autre sujet qui revient souvent sur le tapis lorsque l’on parle de consommation électrique. Le Cahier de la CNIL reprend à son compte une citation de Bitcoin Magazine : « La [forte] consommation électrique de Bitcoin n’est pas un bug, mais une caractéristique ».
Une piste est de bannir la preuve de travail (proof of work) et la remplacer par la preuve d’enjeu (proof of stake) qui est bien moins énergivore. Une option promue par Erik Thedéen, vice-président de l’Autorité européenne des marchés financiers (AEMF) :
« Dans cette méthode, le mineur doit pouvoir prouver la possession d’une certaine quantité de crypto-monnaie pour prétendre valider des blocs supplémentaires et toucher la récompense. La probabilité d’être choisi comme validateur d’un bloc est proportionnelle à la quantité de cryptomonnaie possédée, et à la durée de cette possession, et non plus à la quantité de travail fourni », explique la CNIL.
Les gains sont-ils importants ? Oui, selon le cahier qui annonce une consommation en baisse « entre 4 et 6 ordres de grandeur » par rapport au Bitcoin. « Le gain par transaction peut même atteindre 8 ordres de grandeur pour devenir négligeable, de l’ordre de la consommation du chargement d’une page web ou de l’envoi d’un mail ».
Le chiffrement à double tranchant
La CNIL recommande régulièrement de chiffrer les données – afin de les protéger –, mais reconnait que cette opération n’est pas sans coût sur l’environnement : « le chiffrement augmente automatiquement la consommation énergétique, d’abord par le calcul nécessaire à cette opération, mais également pour le déchiffrement et le stockage », car les données chiffrées prennent souvent plus de place.
Mais la CNIL met aussi en parallèle la compression, qui permet a contrario de réduire le stockage et donc la consommation de ressources. Elle rappelle aussi que « des méthodes cryptographiques permettent de générer des preuves sans pour autant conserver le fichier en lui-même ».
Le Laboratoire met en avant une autre dichotomie entre « défenseurs des libertés, hostiles aux systèmes de surveillance pour des fins de "sécurité", et défenseurs de l’environnement, favorables à ces systèmes, voire aux dénonciations lorsqu’il s’agit de protection de l’environnement ». Un dossier sur lequel la gardienne des libertés individuelles est en première ligne.
L’occasion pour la CNIL de mettre en avant son site Climatopie avec six récits décrivant un quotidien futuriste « dans lequel notre relation à la technologie a évolué en fonction des contraintes de la crise climatique ». Il est notamment question d’une vie rythmée par les quotas énergétique et/ou de pollution, de l’impact environnemental comme donnée publique et de l’écroulement des ressources.
Des exemples d’actions actuellement mises en place sont décrites dans le Cahier. On y retrouve des bacs à ordure individuels avec des capteurs de poids, ou encore le rationnement du carbone pour les déplacements des personnes. De manière plus large, on peut citer « la surveillance des comportements sur les réseaux sociaux telle qu’expérimentée par l’administration fiscale pourrait être utilisée pour traquer des comportements déviants, ou demain illégaux, du point de vue de la protection de l’environnement, au-delà du flight tracking ou des opérations de vigilantisme ».
Quelques pistes de réflexion
En guise de conclusion, le LINC propose des « pistes pour rapprocher protection des données et de l’environnement ». On y retrouve pêle-mêle la promotion d’une informatique sobre – avec « des systèmes justement dimensionnés » – et frugale sur les données, par « la minimisation, et des systèmes robustes, afin de limiter notamment les failles et les fuites de données ». La frugalité est aussi mise en avant pour l’intelligence artificielle.
Le laboratoire souhaite aussi « documenter les bonnes pratiques pour la réparation et le reconditionnement », et proposer des solutions pour « un partage vertueux des données environnementales ». Il veut également « engager un débat autour des libertés en période de crise climatique » :
« Cette question de la balance des droits et des libertés pourrait être amenée à évoluer avec la crise climatique, les gouvernements amenés à proposer la mise en œuvre de textes de loi et/ou de solutions visant à encadrer les comportements des personnes, sur la base de leurs données personnelles, voire limiter leur capacité à aller et venir, comme cela a déjà été fait à l’occasion de la pandémie de COVID.
L’acteur public pourrait alors invoquer un principe de responsabilité pour le développement d’outils de surveillance ou de bridage des comportements et consommations. »
Enfin, le LINC revient sur le cas du Collège de la CNIL, qui « pourrait ajouter une composante environnementale à ses décisions, en complément de l’analyse juridique et de conformité des projets numériques ».