La semaine dernière, Flock vous a proposé un « mini-récit technique mixte de Flock en partie propulsé par Midjourney ». Le moins que l’on puisse dire, c’est que le résultat a fait réagir, autant la rédaction que les lecteurs. Srpf résume assez bien la situation dans les commentaires : « aussi déstabilisant que magnifique ».
Mais comment notre Flock national en est-il arrivé là ? En deux temps. Pour commencer, il y a le processeur créatif, et là ChatGPT n’a qu'à bien se tenir. Flock a d’abord scénarisé et préparé les planches de sa mini-BD. Il s’est ensuite lancé sur Midjourney pour passer ses attentes/espérances à la moulinette de l’intelligence artificielle… qui n’en a parfois fait qu’à sa tête.
Midjourney se présente comme un « laboratoire de recherche indépendant » qui veut « élargir les pouvoirs imaginatifs de l’espèce humaine ». Dans la pratique, il s’agit pour le moment d’un service en bêta (ouvert à tous) accessible via Discord. On peut actuellement demander environ 25 requêtes gratuitement.
Il suffit ensuite de demander au bot de produire une image en lui donnant des indications et, éventuellement, une image de départ. Midjourney vous renvoie quelques minutes plus tard quatre propositions groupées dans une même image (des variantes sur le même thème).
On peut aussi ajouter une image qui servira de base. Cette méthode était utilisée pour les membres de la rédac’, uniquement avec des photos trouvées sur Internet. Attention, les résultats sont dans tous les cas publics : toutes les personnes sur le même serveur Discord peuvent télécharger les images.
Ce n’est pas la première intelligence artificielle à se lancer sur ce segment, nous avons déjà eu DALL·E 2 il y a quelques mois et Stable Diffusion plus récemment. Comme nous l’avions déjà expliqué en avril, cela soulève de nombreuses questions, que ce soit au niveau du droit d’auteur ou sur les données ayant servi à entrainer les intelligences artificielles.
- DALL·E 2 génère des images à partir d’un texte : un résultat bluffant, des défis juridiques
- Getty poursuit un éditeur d’algorithme en justice pour violation des droits d’auteurs
Nous n’allons pas aborder ces sujets pour le moment, mais plutôt vous proposer une visite des coulisses ayant conduit à la mini-bande dessinée de Flock samedi dernier. Vous trouverez de nombreuses images – utilisées ou non pour le résultat final – générées via Midjourney, ainsi que les mots clés utilisés
La rédac’ comme vous ne l’avez jamais vue
Flock nous explique que « la capacité de figuration des personnes semble largement corrélée à la quantité d'images disponibles de ces personnes ». Un exemple frappant : le résultat avec Bill Gates est largement au-dessus de ceux du reste de l’équipe. Autre différence notable : « j'ai eu besoin de faire référence à une image pour Tim Cook et j'ai juste eu besoin de citer Bill Gates ». Dans toutes ses requêtes, Flock n’a fait que des demandes en anglais pour éviter toute erreur de traduction.
Voici quelques exemples qui n’ont pas forcément été retenus par Flock pour sa sélection finale, avec la phrase utilisée lors de la génération. Il y a tous les membres de la rédaction comme vous ne les avez jamais vus (et ne les verrez probablement jamais), mais aussi quelques invités surprises :
Dessine moi un mouton ce qui me passe par la tête
Flock a également demandé à Midjourney de fabriquer des images sans partir d’une personne en particulier, mais pour représenter une scène qu’il avait en tête. De manière générale, il était très rare que le résultat soit satisfaisant du premier coup. Il fallait demander d’autres variations, ajouter des précisions ou refaire la requête.
Voici là encore quelques exemples avec les mots-clés utilisés pour arriver au résultat (nous avons a priori perdu Flock sur la fin) :
Comme on peut le voir, les résultats sont tout à la fois impressionnants, flippants, complétement hors de propos (comme l’exemple du taureau dans les locaux d’une salle de presse) ou au contraire parfaitement bien ciblés. On note au passage une belle mise en abyme dans l’antépénultième dessin « best funny humor drawing of all time ».
Quoi qu’il en soit, pour arriver à obtenir un résultat convenable (voire acceptable suivant les cas), Flock a dû générer des dizaines et des dizaines d’images, et parfois revoir un peu ses attentes.