« DALL·E 2, dessine-moi un astronaute à cheval se prélassant dans un complexe tropical de l'espace en pixel art ». Un clic, et cette IA génère l’image réclamée. Cette nouvelle version permet de créer des images « réalistes » ou « artistiques » à partir d’un descriptif en langage naturel. Une solution qui questionne sur le terrain de la propriété intellectuelle.
OpenAI a été lancé fin 2015, avec deux co-présidents de renom : Elon Musk (Tesla et SpaceX) ainsi que Sam Altman (Y Combinator). À l’époque, c’était tout à la fois une alliance, une initiative et une société de recherche à but non lucratif sur tout ce qui touche à l’intelligence artificielle. En mars 2019 un changement important a été annoncé : OpenAI est devenue une société à but lucratif « plafonné ».
Elle s’est déjà fait remarquer pour certaines de ses publications, notamment en 2017 quand elle avait entrainé une intelligence artificielle avec des images de synthèses et de la réalité virtuelle où, pour simplifier, un ordinateur apprenait à un ordinateur.
L’entreprise revient aujourd’hui avec DALL·E 2 : « un nouveau système d'intelligence artificielle capable de créer des images réalistes et artistiques à partir d'une description en langage naturel ». Comme son nom l'indique, cette IA repose sur la suite de DALL·E lancée en janvier 2021.
OpenAI promet « des images plus réalistes et précises, avec une résolution quatre fois supérieure ». Et le moins que l’on puisse dire, c’est que – même sans être parfait – les résultats sont impressionnants et ouvrent le champ à de multiples possibilités, non sans soulever des questions de propriété intellectuelle.
Combiner des concepts (parfois absurdes) et des styles
Le nom rend évidemment hommage au robot Wall-E de Pixar et à l’artiste Salvador Dali. C’est donc tout naturellement que la première image mise en avant dans la publication scientifique est un portrait de Salvador Dali avec une partie du visage robotisée. La demande était : « un vibrant portrait en peinture de Salvador Dalí avec la moitié du visage en robot ».
Ces images ont été générées à partir d’un texte
Non contente de créer des images à partir d’un texte, l'IA est capable de « combiner des concepts, des attributs et des styles ». Vous pouvez lui demander un « astronaute à cheval dessiné au crayon », ou encore « un astronaute se prélassant dans un complexe tropical de l'espace en pixel art », et pourquoi pas un rendu photoréaliste.
Les exemples mis en avant par les chercheurs à l’origine de DALL·E 2 sont parfois surprenants. Il est possible d’avoir une image photoréaliste d’un koala mettant un dunk ou faisant de la moto, d’un panda sur des patins à glace, d’un singe faisant de la comptabilité sur une table, de la Joconde avec une crête iroquoise, etc. La vidéo ci-dessous regorge d’exemples.
Dans certains cas, le rendu donne une image qui peut être assez étrange. Par exemple, dans la page 2 de ce PDF quand une fleur sort des mains, ou encore cette image signalée par un internaute sur Twitter. Cette image a été créée par DALL·E 2 à partir de la phrase suivante : « une photo de la devanture de magasin de fleurs pittoresque avec une façade vert pastel et blanche avec une porte ouverte et une grande fenêtre ».
Modifier des images existantes, à partir d’un texte
DALL·E 2 est aussi capable de modifier des images existantes, là encore simplement avec une demande en langage naturel. Dans ce cas, l’intelligence artificielle « peut ajouter et supprimer des éléments tout en tenant compte des ombres, des reflets et des textures ». Vous avez envie d’ajouter un corgi (une race de chien) dans une toile de maitre ou dans un décor réaliste ? Rien d'impossible.
Il en va de même pour des services plus terre à terre comme ajouter un canapé dans différents endroits d’une pièce. Des applications de ce genre en réalité augmentée existent déjà depuis longtemps chez certaines enseignes proposant du mobilier, mais il s’agit cette fois de se baser sur une demande textuelle, non plus sur des images de produits.
À parti d’une image, DALL·E 2 peut aussi créer « différentes variations inspirées de l'original ». Vous vous demandez ce que pourrait donner le portrait de La Jeune Fille à la perle de Johannes Vermeer ou Le Baiser de Klimt dans un style différent de leur auteur ? L’IA propose plusieurs variations de thèmes. Cela fonctionne également pour la photo d’une salle de bain et même pour le portrait robotisé de Dali dont nous parlions précédemment (créé à la base par DALL·E 2).
Un projet de recherche, une API privée (pour le moment ?)
Pour le moment, DALL·E 2 est présenté par OpenAI comme « un projet de recherche qui n’est pas actuellement disponible dans [son] API ». Seul un « groupe restreint d'utilisateurs » peut y accéder. Une ouverture à plus d'utilisateurs est prévue à l’avenir, sans précision sur l'agenda.
Plusieurs limitations ont été ajoutées par OpenAI afin de « limiter la capacité de DALL· E 2 à générer des images violentes, haineuses ou du contenu pour adulte » : « Nous ne générerons pas d’images si nos filtres identifient les demandes textuelles et les téléchargements d’images susceptibles d’enfreindre nos règles », ajoutent les chercheurs. Les protections résisteront-elles à une éventuelle ouverture massive de cette IA ?
Si l’on combine les résultats actuellement prometteurs de DALL·E 2 avec les techniques actuelles permettant de créer des visages humains plus vrais que nature et les deepfakes de manière générale, cela laisse entrevoir un éventail de possibilités assez impressionnant… mais tout aussi inquiétant. Partant du principe qu’une vidéo n’est qu’une succession d’images, pourrait-on imaginer la création de vidéos à partir de quelques phrases ou d'un simili scénario ?
Des questions juridiques vertigineuses
Juridiquement, les questions soulevées par cette technologie sont tout aussi vertigineuses, et pas seulement parce que ces nouveaux outils pourraient questionner sur l'utilité, dans un avenir proche, des banques d'images.
En 2018, une mission avait été lancée au Conseil supérieur de la propriété littéraire et artistique (CSPLA) pour plancher justement sur ces conséquences. « Lorsque l’IA se substitue à l’humain, se pose en effet la question de savoir si la réalisation finale peut bénéficier de la qualification d’œuvre de l’esprit », écrivait le CSPLA.
À qui appartient une image (ou une musique, etc.) créée par une IA ? Les œuvres de l'esprit sont le fruit d’une activité créatrice reflétant la personnalité de l’auteur par des choix libres.
La Cour de justice de l’UE avait rappelé récemment ces fondamentaux, en précisant que la notion « d’œuvre » concerne un objet (image, texte, vidéo, etc.) original, une création intellectuelle propre à un auteur. Et c’est seulement après vérification de ces conditions qu’un contenu est protégé par le monopole du droit d’auteur, avec l’armada d’outils prévus pour défendre son territoire.
Dans le rapport, fruit de cette mission, les professeures d’université Alexandra Bensamoun et Joëlle Farchy tempèrent : qu’ « un créateur utilise un pinceau, un burin, un appareil photo ou un instrument technologique de pointe ne modifie pas le raisonnement ».
Pour les deux enseignantes, « dès lors que l’IA reste un outil entre les mains d’un créateur-auteur, il faut convenir d’une sorte de principe de prééminence de l’humain, qui efface la machine et permet l’application classique des règles du droit d’auteur. Ainsi, dès lors qu’une personne humaine intervient de manière créative dans la création, l’outil utilisé importe peu ».
Qui est l'auteur d'une image créée par l'IA ?
Cependant, les formules sont plurielles, un contenu généré par une seule IA devrait en toute logique échapper au cadre du droit d’auteur (et même au copyright, comme l'avait décidé l’US Copyright Office en février dernier).
Certes, écrit le rapport, « on pourrait être tenté, en invoquant le modèle des œuvres plurales, d’octroyer la qualité d’auteurs du produit généré par l’IA aux différents créateurs amont. Mais cette voie est fragile, car les différents éléments ne se retrouvent pas dans la création finale ».
Si l’œuvre exige une création, laquelle se rattache à la conscience, à un créateur personne physique, cette qualité fait évidemment défaut pour des contenus sécrétés par une intelligence artificielle (ou une machinerie réelle). Le rapport sonde différentes formules qui permettraient d’identifier malgré tout un titulaire de droit.
Ce pourrait être le concepteur de l’IA. « Cette hypothèse a l’avantage d’identifier une personne humaine qui aura entretenu des liens très proches avec la machine, qui a été capable d’y inoculer ses propres biais et donc d’y laisser une certaine empreinte ».
Ce pourrait être encore l’utilisateur de l’IA, piste qui voudrait « que l’IA soit "l’auteur en fait" de l’œuvre, mais que seul l’utilisateur soit son "auteur en droit" dès lors que c’est à sa demande que l’IA a produit l’œuvre pour laquelle la protection du droit d’auteur est recherchée ».
Face aux difficultés, les deux universitaires imaginent qu’une loi pourrait intervenir pour trancher ces questions, quand pourrait être imaginé aussi un nouveau droit, calqué sur les droits voisins, au profit de la personne « qui prend le risque d'un retour sur investissement » en matière d’IA.
La SACEM ferme la porte au domaine public
La SACEM, qui est intervenue dans la mission en question, n’est pas très encline à considérer que ces contenus puissent entrer de facto dans le domaine public.
« Rien ne s’oppose [...] à ce que ces créations soient l’objet d’un droit de propriété. Elles représentent une valeur et doivent pouvoir être appropriées. La société a même intérêt à cette appropriation qui permettra la mise en valeur de la création intelligente et la désignation d’un responsable de son exploitation ». Dont les intérêts pourraient être représentés, au hasard, par un organisme de gestion collective ?