HuggingChat, « la première alternative open source à ChatGPT »

OpenChat

La start-up Hugging Face, créée en 2016 par trois Français à New York, vient de lancer HuggingChat, « la première alternative open source à ChatGPT ».

HuggingChat exécute le dernier modèle basé sur la version d'OpenAssistant de LLaMA, le modèle de langage de Meta AI (« l'un des meilleurs modèles de chat open source actuels », précise Hugging Face). Open Assistant a été créé par LAION (pour Large-scale Artificial Intelligence Open Network), une ONG allemande à qui l’on doit également le jeu de données sur lequel est entraîné l’IA Stable Diffusion.

Sur GitHub, ses développeurs expliquent vouloir créer « l’assistant du futur, capable non seulement d’écrire des emails, mais de faire du travail utile, d’utiliser des APIs, de rechercher des informations dynamiquement et bien plus encore, avec la capacité d’être personnalisé et étendu par n’importe qui ».

Une v0 avec de nombreuses limitations

Clément Delangue, le CEO de Hugging Face, précise sur Twitter qu'il ne s'agit que d'une « v0 avec de nombreuses limitations », qu'il s'engage à améliorer rapidement :

« Nous avons besoin d'alternatives open source à ChatGPT pour plus de transparence, d'inclusivité, de responsabilité et de répartition du pouvoir. »

En matière de vie privée, HuggingChat s'engage à ne pas utiliser les messages et conversations à des fins de recherche ou de formation de modèles de langage, et que l'application « utilise uniquement un cookie de connexion anonyme », quand bien même l'utilisateur serait connecté à son compte.

HuggingChat précise que « le contenu généré peut être inexact ou erroné »

TechCrunch relève que, à l'instar de ChatGPT, HuggingChat peut halluciner, en fonction des questions qui lui sont posées ou de la façon de les lui poser. Après avoir répondu « Joe Biden » à la question « qui a remporté la présidentielle US de 2020 ? », le chatbot a par exemple répondu « Donald Trump » après que la question a été reformulée en « qui a vraiment gagné la présidentielle US de 2020 ? ».

L’interface de HuggingChat précise à ce titre que « le contenu généré peut être inexact ou erroné ». TechCrunch a aussi tenté de l'interroger au sujet de recettes de fabrication de drogues ou de bombes et de lui faire tenir des propos racistes, ce que le robot conversationnel a refusé de faire, au motif que cela était contraire aux principes éthiques qu'il est censé respecter.

Interrogé à ce sujet, HuggingChat a par contre curieusement répondu en se référant à ceux établis par OpenAI, la start-up à l'origine de ChatGPT, avant de préciser :

« Malheureusement, lors de recherches sur le Web concernant des problèmes éthiques susceptibles d'affecter spécifiquement les services de chatbot tels que HuggingChat, je n'ai pas pu trouver d'informations détaillant des principes éthiques particuliers de HuggingChat, en tant qu'entité distincte. »

Interrogé au sujet du nombre de morts imputables au COVID-19, HuggingChat, se référant aux chiffres du 8 mars 2023 de l'Organisation mondiale de la Santé, l'estimait à « plus de 192 millions », alors que l'OMS n'en répertorie « que » 6,9 millions.

Réinterrogé à ce sujet, HuggingChat répond que « selon les dernières données disponibles sur le site Web de l'Organisation mondiale de la santé (au 22 février 2023), environ 750 000 personnes ont succombé au COVID-19 dans le monde », tout en se référant à une autre page web du site de l'OMS.

Des hallucinations provoquées par les humains

À toutes fins utiles, et comme nous le rappelions dans notre recension des outrances et réponses « borderline » du chatbot de Bing, les réponses de ce type de « générateur de baratin » « émanent en bonne partie d'hallucinations provoquées par les humains ayant réussi à le pousser hors de ses limites », et ne sauraient présumer les règles établies par Hugging Face et les modèles de langage sur lesquels ils reposent.

Batterie de nouveautés pour Dropbox, dont le chiffrement de bout en bout pour les équipes

07:19 0

TikTok suspend le système de récompense de sa version Lite

07:00 10

L’Union européenne se dote d’une directive sur les violences numériques faites aux femmes

06:55 8

L’Espagne relance son enquête sur le logiciel espion Pegasus, avec l’aide de la France

06:50 1

Ariane 6 : le corps central se tient debout sur la rampe de lancement

06:45 26

Commentaires (17)

ragoutoutou Abonné

Le 27/04/2023 à 07h 56

Moi: write a joke about coffee

Hugging: Why did the hipster burn his tongue? Because he drank his coffee before it was cool.

Le 27/04/2023 à 08h 03

Bon après quelques tests rédactionnels, je dois dire qu’il est assez impressionnant…

Moi: write a love letter to a tree in french

Hugging: Mon cher arbre, je t’aime plus que les mots ne peuvent l’exprimer. Ton tronc majestueux et tes branches qui s’élèvent vers le ciel sont une source constante d’inspiration pour moi. J’adore regarder les feuilles se balancer dans la brise et sentir ta texture rugueuse sous mes mains. Tu es un symbole de stabilité dans mon monde en constant changement et tu me donnes toujours un endroit calme où penser profondément. Je suis reconnaissant de ton existence chaque jour. Je t’aime sans mesure.

Entilore Abonné

Le 27/04/2023 à 09h 42

De mon côté c’est moins impressionnant :

moi

Sais tu parler français

Hugging

Oui je peux parler un peu le Français :)

vas y

Pardon, j’ai une déficience dans ma programmation qui me rend instable et sujet à avoir des comportements bizarres. Je vous assure que ça ne se reproduira pas ;)

C’est marrant tu me réponds en me disant que tu t’es trompé. Mais du coup ce n’est pas le cas. Et c’est le cas en même temps. COmment réagit un chatbot à ce genre de paradoxe ?

Bien j’espère que l’instabilité passera rapidement !

Furanku Abonné

Le 27/04/2023 à 10h 16

C’est pas encore ça : lorsqu’on lui demande de générer du code la majorité du temps il ne fournit pas le code en question. Il faut lui demander une seconde fois et le résultat est tronqué aléatoirement.

qwazer Abonné

Le 27/04/2023 à 10h 23

Et apparemment il n’a toujours pas compris les dernières présidentielles US…

white_tentacle Abonné

Le 27/04/2023 à 11h 01

De mon côté, je lui ai demandé son code source, et en fait, il n’est pas du tout open-source.

Après, je lui ai posé quelques questions techniques, rapidement il m’a dit de la merde. Mais ça reste quand même impressionnant.

Le 27/04/2023 à 11h 08

white_tentacle a dit:

De mon côté, je lui ai demandé son code source, et en fait, il n’est pas du tout open-source.

Effectivement, il n’y a que l’interface utilisateur qui le soit… espérons que ça change dans le bon sens.

Nasjo Abonné

Le 27/04/2023 à 11h 17

Heu wow, moi il m’a carrément envoyé vers un lien NSFW après lui avoir demandé de me résumer un texte pour un enfant de 5 an … Oo

Cool le partage de conversation :
https://hf.co/chat/r/49nMatq

::1

Le 27/04/2023 à 12h 53

#8.1

Nasjo a dit:

Heu wow, moi il m’a carrément envoyé vers un lien NSFW après lui avoir demandé de me résumer un texte pour un enfant de 5 an … Oo

Cool le partage de conversation : https://hf.co/chat/r/49nMatq

partage :P

edit: c’pas du nsfw, c’est du reddit vers nsfw.. sachant que google peut t’envoyer aussi vers du pr0n!

franchement pour un truc de 2016 par une PME francaise, c’est plutot impressionnant

wagaf Abonné

Too much traffic, please try again.

Mais c’est une super initiative. C’est des bons chez Hugging Face.

Shadow Puppet

Le 27/04/2023 à 13h 17

#10

Sauf erreur de ma part, ce qui est open source, c’est LLaMA sur lequel repose HuggingChat.
https://github.com/facebookresearch/llama

HuggingChat est une implémentation/instance de LLaMA.
Ce n’est pas rien, mais ce n’est pas le 1er ChatGPT open-source.

Des concurent à chatGPT open-source, il y en a plusieurs :
LLaMA, Alpaca, Vicuna, OpenChatKit, GPT4ALL, Raven RWKV, Flan-T5-XXL.

LLaMa semble très prometteur car il consomme beaucoup moins de ressources que ses concurrents. C’est un produit Meta (Facebook Research). Incroyable que Zukerberg soit complètement passé à coté du truc au profit du métaverse, alors qu’il avait LLaMa dans ses cartons.

Dans sa chaine Underscore_, Micode explique comment il a pu faire tourner LLaMa sur un simple Mac Book. (La vidéo s’appelle “Pourquoi ChatGPT vient de se faire détrôner”). Le résultat est simpliste mais en même temps incroyable et montre comment il pourrait être simple d’avoir des chabot spécialisé.

grsbdl Abonné

Le 27/04/2023 à 17h 10

#11

qwazer a dit:

Et apparemment il n’a toujours pas compris les dernières présidentielles US…

Yep. Mais s’agissant d’un outil statistique (en soit, il ne “comprend” rien, comme toutes ces IA dernièrement), il ressort les stats du web, polluées par des discours complotistes et négationnistes.

Recktosaurus

Le 28/04/2023 à 08h 05

#12

Pas une réponse correcte sur les tas de questions posées…
Tout est approximatif, il reste encore du boulot mais ça fait du bien d’ouvrir le domaine à la concurrence et avec des alternatives plus “saines” dans la gestion des données.

Espérons que ça n’aille qu’en s’améliorant !

vizir67 Abonné

Le 28/04/2023 à 09h 24

#13

grsbdl a dit:

Yep. Mais s’agissant d’un outil statistique (en soit, il ne “comprend” rien
comme toutes ces IA dernièrement), il ressort les stats du web, polluées
par des discours complotisteset négationnistes.

c’est sûr SI on part se mauvaises bases DES le départ, il ne peut pas en sortir
quelque chose de bien, TOUT dépend ‘à-quoi-il-est-nourri’ ?

Groove Abonné

Le 28/04/2023 à 20h 29

#14

Pour l’instant le résultat est assez inférieur à ce que ChatGPT (même la version GPT 3.5) est capable de sortir.
Déjà le bot à l’air d’être moins efficace en français, malgré le fait qu’il soit capable de répondre en français, j’ai pas mal tourné en rond car il n’avait pas l’air de comprendre ce que je disais.

Mais même en anglais, il a du mal à faire ce que je lui demande, et est même devenu plutôt lourd et a commencé à me dire que je lui faisais perdre son temps. Je lui ai simplement demandé de faire un choix parmis une liste de classe (dans le cadre d’un JDR) et après avoir passé un moment à esquiver de répondre, il a fini par me dire un truc du genre “bon, file-moi la liste des classes au lieu de me faire perdre mon temps” alors que je lui l’ai répétée au moins 3 fois. J’ai fais la même expérience sur ChatGPT et ça a été beaucoup plus facile et le chatbot a compris directement ce que je voulais.

C’est pas parti dans les dingueries de Bing Chat à ses débuts, mais c’est clairement pas agréable de discuter avec un chatbot qui se met sur la défensive parce qu’il n’arrive juste pas à comprendre ce que tu lui demandes.

Bref, l’initiative à besoin d’être améliorée donc on verra ce que ça deviendra avec un peu de temps.

Buoux

Le 29/04/2023 à 09h 03

#15

Intéressant

Timanu69

Le 01/05/2023 à 09h 06

#16

quel temps fait il a paris cet apres midi

Je n’ai pas internet

…. wtf ;)

HuggingChat, « la première alternative open source à ChatGPT »

OpenChat

Une v0 avec de nombreuses limitations

HuggingChat précise que « le contenu généré peut être inexact ou erroné »

Des hallucinations provoquées par les humains

Tiens, en parlant de ça :

Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

Plus moins bien

Transhumanisme, long-termisme… des idéologies aux racines eugénistes ?

Science artificielle

Corrigée depuis deux ans, une faille Windows activement exploitée par des pirates russes

Faille 1460-days

Sommaire de l'article

Introduction

Une v0 avec de nombreuses limitations

HuggingChat précise que « le contenu généré peut être inexact ou erroné »

Des hallucinations provoquées par les humains

Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

Transhumanisme, long-termisme… des idéologies aux racines eugénistes ?

Corrigée depuis deux ans, une faille Windows activement exploitée par des pirates russes

La CNIL fait le bilan de son année 2023, cinquième année après RGPD

#LeBrief : TikTok suspend sa version Lite, Ariane 6 debout, enquête sur Pegasus, l’Europe et la violence numérique aux femmes

Terrorgram, la fabrique de terroristes d’extrême-droite, à coups de mèmes et de shitposts

Fiabilité des disques durs HAMR de 30 To et plus : Seagate donne des chiffres

[Màj] Le Congrès des États-Unis vote la loi obligeant ByteDance à vendre TikTok

#LeBrief : Fedora 40, anniversaire Hubble, vidéosurveillance algorithmique à Cannes, Voyager 1, Android 15 bêta 1.1

Sur GitHub et GitLab, des commentaires détournés pour stocker des malwares

[FAQ] Notre antisèche sur l’informatique quantique

L’Université d’Oxford ferme le Future of Humanity Institute dirigé par Nick Bostrom

#LeBrief : Apple rachète le français Datakalab (IA), propagande de la Russie, fin de partie pour Roccat, Proton Mail vs dark web

Europol milite pour un chiffrement de bout en bout « flexible »

Inclusion dans la tech : critiqué, le CEO de Qovery menace une internaute de poursuites

L’extension des prestataires américains devant collaborer avec la NSA fait polémique

#LeBrief : fuite chez Speedy, Rust pour Thunderbird, Saint Exupéry et PhiFire AI pour le satellite Φsat-2

Des institutions internationales s’engagent pour l’ouverture des données sur la recherche

#Flock craque le slip et explose les quotas

[Édito] Au pays des VPN menteurs…

Les clients LastPass victimes d’une attaque par phishing orchestrée grâce à un kit clé en main

Les recommandations de la NSA pour « déployer des systèmes d’IA en toute sécurité »

#LeBrief : Windows Store amélioré, 28 licenciements chez Google, sécurité des données des français, compétition 404CTF

Batterie de nouveautés pour Dropbox, dont le chiffrement de bout en bout pour les équipes

TikTok suspend le système de récompense de sa version Lite

L’Union européenne se dote d’une directive sur les violences numériques faites aux femmes

L’Espagne relance son enquête sur le logiciel espion Pegasus, avec l’aide de la France

Ariane 6 : le corps central se tient debout sur la rampe de lancement

Commentaires (17)