Les grands modèles de langage ont été popularisés par leur utilisation dans des outils comme chatGPT, mais ils peuvent aussi être utilisés pour la compression sans perte. Et ils sont très efficaces, battant même les algorithmes de compression utilisés pour les formats PNG et FLAC.

Une récente étude (mise en ligne sur le serveur de preprint arXiv et pas encore publiée dans une revue scientifique), montre que le modèle de langage Chinchilla 70B (publié en mars 2022 par Deepmind) est plus efficace que les algorithmes de compression de PNG et FLAC. Elle a été réalisée par des chercheurs de DeepMind (la filiale Intelligence artificielle de Google) en collaboration avec un doctorant d'Inria et de Meta.

Les grands modèles de langage permettent de créer des générateurs de baratin particulièrement bluffants tout en soulevant un bon nombre de problèmes.

Mais les chercheurs ont rapidement compris qu'ils pouvaient aussi être utilisés comme de redoutables outils de compression sans perte comme le format d'image PNG, et contrairement au format JPEG qui compresse les images en perdant des informations au passage.

Théorie de l'information