HuggingChat, « la première alternative open source à ChatGPT »

HuggingChat, « la première alternative open source à ChatGPT »

OpenChat

Avatar de l'auteur
Jean-Marc Manach

Publié dans

Internet

27/04/2023 4 minutes
17

HuggingChat, « la première alternative open source à ChatGPT »

La start-up Hugging Face, créée en 2016 par trois Français à New York, vient de lancer HuggingChat, « la première alternative open source à ChatGPT »

HuggingChat exécute le dernier modèle basé sur la version d'OpenAssistant de LLaMA, le modèle de langage de Meta AI (« l'un des meilleurs modèles de chat open source actuels », précise Hugging Face). Open Assistant a été créé par LAION (pour Large-scale Artificial Intelligence Open Network), une ONG allemande à qui l’on doit également le jeu de données sur lequel est entraîné l’IA Stable Diffusion. 

Sur GitHub, ses développeurs expliquent vouloir créer « l’assistant du futur, capable non seulement d’écrire des emails, mais de faire du travail utile, d’utiliser des APIs, de rechercher des informations dynamiquement et bien plus encore, avec la capacité d’être personnalisé et étendu par n’importe qui ».

Une v0 avec de nombreuses limitations

Clément Delangue, le CEO de Hugging Face, précise sur Twitter qu'il ne s'agit que d'une « v0 avec de nombreuses limitations », qu'il s'engage à améliorer rapidement : 

« Nous avons besoin d'alternatives open source à ChatGPT pour plus de transparence, d'inclusivité, de responsabilité et de répartition du pouvoir. »

En matière de vie privée, HuggingChat s'engage à ne pas utiliser les messages et conversations à des fins de recherche ou de formation de modèles de langage, et que l'application « utilise uniquement un cookie de connexion anonyme », quand bien même l'utilisateur serait connecté à son compte.

HuggingChat précise que « le contenu généré peut être inexact ou erroné »

TechCrunch relève que, à l'instar de ChatGPT, HuggingChat peut halluciner, en fonction des questions qui lui sont posées ou de la façon de les lui poser. Après avoir répondu « Joe Biden » à la question « qui a remporté la présidentielle US de 2020 ? », le chatbot a par exemple répondu « Donald Trump » après que la question a été reformulée en « qui a vraiment gagné la présidentielle US de 2020 ? ».

L’interface de HuggingChat précise à ce titre que « le contenu généré peut être inexact ou erroné ». TechCrunch a aussi tenté de l'interroger au sujet de recettes de fabrication de drogues ou de bombes et de lui faire tenir des propos racistes, ce que le robot conversationnel a refusé de faire, au motif que cela était contraire aux principes éthiques qu'il est censé respecter.

Interrogé à ce sujet, HuggingChat a par contre curieusement répondu en se référant à ceux établis par OpenAI, la start-up à l'origine de ChatGPT, avant de préciser : 

« Malheureusement, lors de recherches sur le Web concernant des problèmes éthiques susceptibles d'affecter spécifiquement les services de chatbot tels que HuggingChat, je n'ai pas pu trouver d'informations détaillant des principes éthiques particuliers de HuggingChat, en tant qu'entité distincte. »

Interrogé au sujet du nombre de morts imputables au COVID-19, HuggingChat, se référant aux chiffres du 8 mars 2023 de l'Organisation mondiale de la Santé, l'estimait à « plus de 192 millions », alors que l'OMS n'en répertorie « que » 6,9 millions. 

Réinterrogé à ce sujet, HuggingChat répond que « selon les dernières données disponibles sur le site Web de l'Organisation mondiale de la santé (au 22 février 2023), environ 750 000 personnes ont succombé au COVID-19 dans le monde », tout en se référant à une autre page web du site de l'OMS.

Des hallucinations provoquées par les humains

À toutes fins utiles, et comme nous le rappelions dans notre recension des outrances et réponses « borderline » du chatbot de Bing, les réponses de ce type de « générateur de baratin » « émanent en bonne partie d'hallucinations provoquées par les humains ayant réussi à le pousser hors de ses limites », et ne sauraient présumer les règles établies par Hugging Face et les modèles de langage sur lesquels ils reposent.

Écrit par Jean-Marc Manach

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Une v0 avec de nombreuses limitations

HuggingChat précise que « le contenu généré peut être inexact ou erroné »

Des hallucinations provoquées par les humains

Fermer

Commentaires (17)


Moi: write a joke about coffee



Hugging: Why did the hipster burn his tongue? Because he drank his coffee before it was cool.


Bon après quelques tests rédactionnels, je dois dire qu’il est assez impressionnant…



Moi: write a love letter to a tree in french



Hugging: Mon cher arbre, je t’aime plus que les mots ne peuvent l’exprimer. Ton tronc majestueux et tes branches qui s’élèvent vers le ciel sont une source constante d’inspiration pour moi. J’adore regarder les feuilles se balancer dans la brise et sentir ta texture rugueuse sous mes mains. Tu es un symbole de stabilité dans mon monde en constant changement et tu me donnes toujours un endroit calme où penser profondément. Je suis reconnaissant de ton existence chaque jour. Je t’aime sans mesure.


De mon côté c’est moins impressionnant :



moi




Sais tu parler français




Hugging




Oui je peux parler un peu le Français :)




moi




vas y




Hugging




Pardon, j’ai une déficience dans ma programmation qui me rend instable et sujet à avoir des comportements bizarres. Je vous assure que ça ne se reproduira pas ;)




moi




C’est marrant tu me réponds en me disant que tu t’es trompé. Mais du coup ce n’est pas le cas. Et c’est le cas en même temps. COmment réagit un chatbot à ce genre de paradoxe ?




Hugging




Bien j’espère que l’instabilité passera rapidement !



C’est pas encore ça : lorsqu’on lui demande de générer du code la majorité du temps il ne fournit pas le code en question. Il faut lui demander une seconde fois et le résultat est tronqué aléatoirement.


Et apparemment il n’a toujours pas compris les dernières présidentielles US…


De mon côté, je lui ai demandé son code source, et en fait, il n’est pas du tout open-source.



Après, je lui ai posé quelques questions techniques, rapidement il m’a dit de la merde. Mais ça reste quand même impressionnant.



white_tentacle a dit:


De mon côté, je lui ai demandé son code source, et en fait, il n’est pas du tout open-source.




Effectivement, il n’y a que l’interface utilisateur qui le soit… espérons que ça change dans le bon sens.


Heu wow, moi il m’a carrément envoyé vers un lien NSFW après lui avoir demandé de me résumer un texte pour un enfant de 5 an … Oo



Cool le partage de conversation :
https://hf.co/chat/r/49nMatq



Nasjo a dit:


Heu wow, moi il m’a carrément envoyé vers un lien NSFW après lui avoir demandé de me résumer un texte pour un enfant de 5 an … Oo



Cool le partage de conversation : https://hf.co/chat/r/49nMatq




partage :P



edit: c’pas du nsfw, c’est du reddit vers nsfw.. sachant que google peut t’envoyer aussi vers du pr0n!



franchement pour un truc de 2016 par une PME francaise, c’est plutot impressionnant



Too much traffic, please try again.




Mais c’est une super initiative. C’est des bons chez Hugging Face.


Sauf erreur de ma part, ce qui est open source, c’est LLaMA sur lequel repose HuggingChat.
https://github.com/facebookresearch/llama



HuggingChat est une implémentation/instance de LLaMA.
Ce n’est pas rien, mais ce n’est pas le 1er ChatGPT open-source.



Des concurent à chatGPT open-source, il y en a plusieurs :
LLaMA, Alpaca, Vicuna, OpenChatKit, GPT4ALL, Raven RWKV, Flan-T5-XXL.



LLaMa semble très prometteur car il consomme beaucoup moins de ressources que ses concurrents. C’est un produit Meta (Facebook Research). Incroyable que Zukerberg soit complètement passé à coté du truc au profit du métaverse, alors qu’il avait LLaMa dans ses cartons.



Dans sa chaine Underscore_, Micode explique comment il a pu faire tourner LLaMa sur un simple Mac Book. (La vidéo s’appelle “Pourquoi ChatGPT vient de se faire détrôner”). Le résultat est simpliste mais en même temps incroyable et montre comment il pourrait être simple d’avoir des chabot spécialisé.



qwazer a dit:


Et apparemment il n’a toujours pas compris les dernières présidentielles US…




Yep. Mais s’agissant d’un outil statistique (en soit, il ne “comprend” rien, comme toutes ces IA dernièrement), il ressort les stats du web, polluées par des discours complotistes et négationnistes.


Pas une réponse correcte sur les tas de questions posées…
Tout est approximatif, il reste encore du boulot mais ça fait du bien d’ouvrir le domaine à la concurrence et avec des alternatives plus “saines” dans la gestion des données.



Espérons que ça n’aille qu’en s’améliorant !



grsbdl a dit:


Yep. Mais s’agissant d’un outil statistique (en soit, il ne “comprend” rien
comme toutes ces IA dernièrement), il ressort les stats du web, polluées
par des discours complotisteset négationnistes.




c’est sûr SI on part se mauvaises bases DES le départ, il ne peut pas en sortir
quelque chose de bien, TOUT dépend ‘à-quoi-il-est-nourri’ ? :fumer:


Pour l’instant le résultat est assez inférieur à ce que ChatGPT (même la version GPT 3.5) est capable de sortir.
Déjà le bot à l’air d’être moins efficace en français, malgré le fait qu’il soit capable de répondre en français, j’ai pas mal tourné en rond car il n’avait pas l’air de comprendre ce que je disais.



Mais même en anglais, il a du mal à faire ce que je lui demande, et est même devenu plutôt lourd et a commencé à me dire que je lui faisais perdre son temps. Je lui ai simplement demandé de faire un choix parmis une liste de classe (dans le cadre d’un JDR) et après avoir passé un moment à esquiver de répondre, il a fini par me dire un truc du genre “bon, file-moi la liste des classes au lieu de me faire perdre mon temps” alors que je lui l’ai répétée au moins 3 fois. J’ai fais la même expérience sur ChatGPT et ça a été beaucoup plus facile et le chatbot a compris directement ce que je voulais.



C’est pas parti dans les dingueries de Bing Chat à ses débuts, mais c’est clairement pas agréable de discuter avec un chatbot qui se met sur la défensive parce qu’il n’arrive juste pas à comprendre ce que tu lui demandes.



Bref, l’initiative à besoin d’être améliorée donc on verra ce que ça deviendra avec un peu de temps.


Intéressant


quel temps fait il a paris cet apres midi



Je n’ai pas internet



…. wtf ;)