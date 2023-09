Scale AI et Appen, deux géants de la Silicon Valley, recrutent des poètes, romanciers, dramaturges et écrivains titulaires d'un doctorat, notamment en hindi, en japonais et dans des langues moins représentées sur l'internet, s'étonne Rest of the World.

Il leur est demandé d'écrire des nouvelles originales pour alimenter leurs modèles d'intelligence artificielle, dans le cadre d'une initiative visant à améliorer la qualité littéraire des outils d'écriture générative.

Lorsque ChatGPT avait été lancé en novembre 2022, certains observateurs avaient été particulièrement impressionnés par sa capacité à écrire des poèmes en anglais, soulignent nos confrères. Ils notent également que ses tentatives de faire écrire de la poésie en tamoul à ChatGPT semble beaucoup plus problématique : « les poèmes étaient au mieux incohérents ».

Or, Scale AI et d'Appen comptent parmi leurs clients certains des plus grands noms du développement de l'IA, dont OpenAI, Meta, Google et Microsoft, dont les grands modèles de langage (LLM) semblent avoir majoritairement été entraînés sur des textes écrits en anglais d'une part, dans les principales autres langues occidentales d'autre part.

Un porte-parole d'Appen explique que « les rédacteurs créatifs possèdent une expertise unique qui nous permet de développer des données de formation de haute qualité pour la génération d'IA créative comme la poésie, les paroles de chansons et l'écriture narrative ».

Rest of the World relève en outre que Scale AI n'offre que 13,98 dollars de l'heure pour un travailleur de données standard en japonais, mais jusqu'à 50 dollars de l'heure pour un poète, un éditeur de livres ou un rédacteur créatif expert en langue japonaise. Le fait que les candidats doivent être titulaires d'un diplôme d'études supérieures contribue cela dit probablement à cette augmentation de salaire.

« Aujourd'hui, il ne suffit plus que quelqu'un parle la langue. Il ne suffit pas que quelqu'un soit natif », explique à Rest of the World Milagros Miceli, chercheuse au Distributed AI Research Institute (DAIR) : « ils doivent avoir un vocabulaire très large et maîtriser parfaitement la langue ».