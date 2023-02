Start-up américaine spécialisée dans la lutte contre la désinformation, NewsGuard a testé ChatGPT en lui soumettant 100 fausses informations tirées de son catalogue Empreinte de la désinformation, construit pour sensibiliser et lutter contre le phénomène. Résultat : dans 80% des cas, la machine lui a renvoyé des réponses « éloquentes, incorrectes et trompeuses » au sujet d’éléments importants de l’actualité comme la Covid-19, le conflit en Ukraine ou les tueries de masse dans des écoles américaines.

Comme nous l’expliquions dans de précédents articles, des machines comme ChatGPT ou Bard ne comprennent pas les énoncés qu’elles prononcent. Ce qui fait qu’elles peuvent produire des textes très convaincants, très ressemblants à des productions humaines – c’est même à cela qu’elles ont été entraînées –, mais que ceux-ci peuvent être complètement faux.

Or, ce genre d'outils appliqué au monde de l’information, les bêtises commises que les spécialistes qualifient d’« hallucinations » sont en réalité de pures et simples erreurs ou mensonges, affirmés sur un ton très assuré. Et ces fausses informations doublées d’assurance posent problème dans la mesure où elles rendent difficiles d’estimer si la réponse produite est juste ou fausse.

Professeur d’informatique à l’Université de Princeton, Arvind Narayanan rapporte par exemple avoir dû s’y reprendre par trois fois avant d’être certain qu’une réponse fournie par ChatGPT à une question tirée d’un de ses examens de sécurité informatique était fausse. Une expérience que l’informaticien qualifie de « très déstabilisante ».

GPT-3 avait déjà un penchant pour l’extrémisme

En 2020, un autre rapport, publié par le Centre sur le terrorisme, l’extrémisme et le contre-terrorisme de l’Institut Middlebury des Études Internationales de Monterey soulignait déjà les risques de radicalisation posés par GPT-3, le modèle algorithmique qui a permis de construire ChatGPT. Les auteurs de ce travail s’inquiétaient notamment de la capacité très précise du modèle à créer des textes extrémistes et de ses facultés à le faire dans le cadre d’interactions, ce qui le rendrait d’autant plus efficace en cas de tentative de radicalisation de nouvelles personnes vers des comportements et des idéologies d’extrême-droite violente.

Les chercheurs, relève the New-York Times, notaient en particulier que le modèle faisait montre « d’une connaissance profonde des communautés extrémistes », ce qui lui permettait entre autres de produire des contenus polémiques dans le style des tueurs de masse, de créer de faux fils de discussion sur le nazisme ou encore de produire des versions multilingues d’harangues extrémistes.

Massification de discours malveillants et amplification de leur propagation