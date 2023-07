« Pour faire face aux niveaux extrêmes de récupération de données et de manipulation du système », a expliqué ce samedi Elon Musk, Twitter a limité à 6 000 le nombre de tweets lisibles par jour pour les abonnés à l'offre payante Blue qu'il a qualifié de « vérifiés », 600 pour les utilisateurs « non vérifiés », et 300 pour les nouveaux comptes non vérifiés.

Une heure et demi plus tard, il augmentait les quotas à respectivement 8 000, 800 et 400 et, trois heures plus tard, à 10 000, 1 000 et 500. L'agence Reuters rapporte qu'il s'agirait, pour Twitter, de « limiter l’utilisation massive de données du réseau social par des tiers qui les utilisent pour alimenter des modèles d’intelligence artificielle » génératives et les « entraîner » à partir des conversations Twitter :

« Quasiment toutes les boîtes qui font de l’IA, des start-up aux plus grands groupes du monde, ramassaient de grandes quantités de données, a insisté Elon Musk. C’est un peu frustrant de devoir ajouter, en urgence, un nombre important de serveurs pour le seul fait de justifier la valorisation indécente de certaines start-up de l’IA. »

La veille, Musk avait en outre annoncé qu'il ne serait plus possible de lire des messages sur le réseau sans se connecter et donc s'inscrire à Twitter, interdisant donc aussi de passer par Nitter pour lire Twitter. Ces limitations seraient temporaires, a-t-il depuis précisé, sans que l'on sache quand elles seraient relevées.

« Des centaines d’organisations (peut-être plus) glanaient des données sur Twitter de façon très agressive, au point que cela perturbait l’utilisation ordinaire », affirme le milliardaire, déplorant le fait que ce « pillage » de données par des tiers dégraderait l'accès aux services de Twitter par ses utilisateurs réguliers. Qui, pour le coup, se voient eux aussi renvoyés à un service dégradé.

Les rumeurs indiquant qu'il s'agirait d'une conséquence de factures impayées à Google Cloud seraient érronées, mais d'aucuns pointent du doigt un voire plusieurs bugs internes entrainant Twitter à « s'auto-DDoSser ».

D'autres avancent qu'il s'agirait aussi d'une réponse de Musk à ChatGPT, le chercheur Pierre-Carl Langlais relevant de son côté que « Twitter n’est aujourd’hui *quasiment pas* utilisé pour entraîner des LLMs » (larges modèles de langage, ndlr) :

« Et ça se comprend : le format typique de Twitter, c’est des textes courts, pas très bien formatés, avec des erreurs de typos et beaucoup de méta-textes (mentions, liens, hashtags) qui sont une source massive d’hallucination. Vraiment pas idéal pour entraîner un bon LLM. »