GANverse3D : NVIDIA veut modéliser des objets en 3D depuis une simple photo

Vous serez bientôt dans la matrice

En marge de ses activités, NVIDIA finance de nombreuses recherches pour préparer son avenir, mais également trouver de nouveaux débouchés à ses produits. Cela donne des résultats parfois étonnants comme lorsqu'il s'agit de recréer Pac-Man et ses règles. Aujourd'hui, l'entreprise présente son GANverse3D.

L'idée de ce projet, détaillé dans une publication scientifique, est de permettre la création d'un modèle en 3D depuis une simple photo. Un réseau de neurones antagonistes génératifs (GAN) est entrainé dans ce but et semble y réussir avec certains types d'objets. Plusieurs exemples donnés concernent des voitures, mais il est aussi question d'animaux.

On imagine bien entendu les débouchés pour la société qui travaille depuis longtemps à la modélisation d'environnements réalistes pour entrainer ses véhicules autonomes via Drive Sim. On pense aussi à son Omniverse où l'on peut travailler en équipes à la conception d'environnements virtuels. Et pourquoi pas aux jeux vidéo, lorsque l'on voit des titres comme Flight Simulator où la photogrammétrie est utilisée pour reproduire la planète entière.

NVIDIA dit avoir utilisé les images de 55 000 voitures pour l'entrainement de son IA et avoir fait face à de nombreux problèmes pour aboutir au résultat actuel. Sa solution serait capable de traiter plusieurs éléments au sein d'une même image ou une seule sélectionnée. Des démonstrations seront faites à l'occasion de prochaines conférences.

Batterie de nouveautés pour Dropbox, dont le chiffrement de bout en bout pour les équipes

07:19 0

TikTok suspend le système de récompense de sa version Lite

07:00 8

L’Union européenne se dote d’une directive sur les violences numériques faites aux femmes

06:55 6

L’Espagne relance son enquête sur le logiciel espion Pegasus, avec l’aide de la France

06:50 1

Ariane 6 : le corps central se tient debout sur la rampe de lancement

06:45 19

Commentaires (19)

SomeDudeOnTheInternet Abonné

Le 16/04/2021 à 14h 04

Ça fait très très longtemps que j’attends ce genre de programme, c’est génial que ça se concrétise enfin ^^
S’ils en sont déjà là aujourd’hui, j’ai surtout hâte de voir ce que ça donnera dans ²⁄₃ ans ;)

emmettbrown

Le 16/04/2021 à 15h 54

C’est super pour rendre la modélisation accessible à tous.
Je me demande s’il existe la même chose où on prendrait sur différents angles une photo d’un objet pour le reconstituer en 3D. Quelqu’un a déjà entendu parler de ça ?
Du coup sans entraînement d’IA avec une unique photo.

TexMex

Le 16/04/2021 à 17h 26

Ca existe bien depuis un moment. La technique diffère de celle de l’article:
https://i.materialise.com/blog/en/how-to-make-a-3d-printed-object-from-a-photo-in-5-easy-steps/

C’est à partir de beaucoup de photo et un temps de calcul proportionnel au nombre de photo et d’angle foireux (ou flou de bougé). Mais bien fait; ça marche.

Ici effectivement il n’y a qu’une seule photo , donc il faut combler les trous. Un voiture étant symétrique on peut reconstituer le deuxième coté. Je pense que cette solution aura du mal avec tout ce qui n’est pas symétrique ou pourra avoir des problèmes avec 2 symétries.

Un arbre (avec des branches biscornues et zone cachées) donnera du fil a retordre j’imagine.

patos Abonné

Le 16/04/2021 à 18h 49

Y’a de monstrueux outils concernant cette méthode, la photgrammétrie, qui fonctionnent à merveille.
https://alicevision.org/#meshroom en est un et est top

Fabimaru Abonné

Le 17/04/2021 à 08h 26

Attention aux programmes qui bouchent les trous, ça me rappelle ce programme qui agrandit les images, et qui a mis le visage de Ryan Gosling (ou quelqu’un de ressemblant) à une fenêtre.

SebGF Abonné

Le 17/04/2021 à 08h 51

Oh merci ! j’en avais cherché pendant un moment mais je ne tombais que sur des logiciels mal foutus ou bridés à cause de version payante.

Jurassi Abonné

Le 17/04/2021 à 10h 01

Oui Meshroom gagne à être connu. Il existe d’autres programme issus des universités americaines mais Meshroom est clairement le plus abouti. Ça marche assez bien avec des photos prises au drone, qui permet une bonne qualité de prises de vues avec sa mobilité dans l’espace aérien. Pour des modélisations d’objet au sol il faut faire plus d’efforts pour avoir les bonnes photos. Perso je me suis payé le logiciel russe Agisoft Metashape à 180€ je ne regrette pas ça reste simple et c’est beaucoup plus efficace que Meshroom https://www.agisoft.com/buy/online-store/
Les amateurs de logiciels open-source peuvent commencer à travailler avec Meshlab qui ressemble à un Paint du modèle 3d, mais pas si mainstream que ça. Il me semble aussi que Cloudcompare propose de bons outils utilisables dans un cadre professionnel.

Le 17/04/2021 à 10h 04

Pour le sujet de l’article je reste assez sceptique sur l’intérêt d’une modélisation 3d à partir d’une seule image. C’est comme réécrire Victor Hugo à partir d’un mot.

Le 17/04/2021 à 13h 11

Je t’avoue que je suis photographe amateur, je ne mets pas 200e dans un logiciel de photogrammétrie ;) ce n’est pas dans mes moyens.. (j’ai pu les mettre quand j’avais un travail dans du matos photo et un logiciel photo mais c’est tout).

Après, vu ce que j’ai fait avec meshroom, je trouve le résultat très convenable même si pas si simple ;)

skankhunt42

Le 17/04/2021 à 13h 42

#10

Jurassi a dit:

je reste assez sceptique sur l’intérêt d’une modélisation 3d à partir d’une seule image.

Il y à forcément des impératif du style prendre le bon angle de vue et partir du principe que l’objet est symétrique. A mon avis il y à aussi un traitement de l’exif qui permet d’extrapoler certaines info et de devenir la taille de l’objet.

Pour la faire courte avec l’ia c’est le même raisonnement que l’ont fait dans notre tête. Certains sont capable de modéliser une voiture via un simple dessin. Il y à même des techno qui permette de faire une pause dans une vidéo et tourner la caméra, recréer les matériaux avec réfraction + diffraction.

patos a dit:

Après, vu ce que j’ai fait avec meshroom, je trouve le résultat très convenable

De toute façon même avec le logiciel du monde et / ou un scanner 3D pour un objet non organique comme une voiture il est absolument impensable de l’utiliser tel quel dans un jeu. Mais c’est une très bonne bas pour la modélisation, il suffit de remplir les contours.

Le 17/04/2021 à 13h 47

#11

C’est ça que je cherchais 😉. Et là si ajoute un peu de deep learning on pourrait sans doute simplifier encore le process notamment pour la partie “nettoyage” sur autodesk.

Le 17/04/2021 à 18h 33

#12

(reply:56675:skankhunt42 )
Peut-être un intérêt pour la police

Oui 200€ c’est cher. La photo aussi c’est cher c’est une passion on pourrait dire. J’utilise encore Picasa pour trier mes photos, je ne trouve rien de gratuit aussi rapide, et payant je ne trouve rien. Tu as des conseils pour moi ?

choukky Abonné

Le 17/04/2021 à 23h 36

#13

Ça a l’air intéressant pour des pièces de décoration mais je doute qu’on puisse faire l’impasse d’un passage par un logiciel de CAO pour la “remise à l’échelle” d’une pièce à usage “mécanique”.

Le 18/04/2021 à 08h 02

#14

Pour le tri et développement de photos, il y a Darktable qui est un logiciel libre.

Sylvounet

Le 18/04/2021 à 08h 45

#15

Le logiciel que je préfère pour le tri et l’organisation des photos, c’est Shotwell.
Malheureusement, seule la version Linux est digne d’intérêt.

Le 18/04/2021 à 11h 08

#16

C’est comme réécrire Victor Hugo à partir d’un mot.

Complément d’information : Dans l’absolu une intelligence artificielle serait capable d’écrire un quart d’un livre de victor hugo rien qu’avec le titre et un synopsis d’une dizaine de lignes. Pour ça il faudrait la nourrir avec tout ce qu’il à écrit au par avant et lu aussi.

Après je pense que la véritable puissance de intelligence artificielle c’est de pouvoir reconnaitre un objet. Ensuite ce n’est qu’une question de lien. Par exemple si l’ia est capable de reconnaitre le modèle d’une voiture alors il est possible de faire une requête au constructeur et d’importer un modèle officiel.

N’oublions pas que pour tout ce qui tout “l’irl” en 3d nous passons notre temps à réinventer la roue et à l’enfermer dans un coffre. Le fait d’avoir une ouverture sur les modèles permet de gagner énormément de temps.

Le 18/04/2021 à 12h 33

#17

Perso je me sers de Digikam

Le 19/04/2021 à 08h 23

#18

(reply:56684:skankhunt42 )
Oui c’est bien dit, l’IA est là pour nous faire gagner du temps. Ce doit aussi être l’objectif du numérique au sens large j’imagine. Pour reprendre l’exemple de la photogrammétrie j’ai pu modéliser un parc à l’échelle en 2 jours de travail amateur, là où un géomètre professionnel classique aurait peut-être mis 5j.

Le 19/04/2021 à 08h 43

#19

Merci pour vos nombreuses références de logiciels de tri photo je vais regarder ça avec la plus grande attention

GANverse3D : NVIDIA veut modéliser des objets en 3D depuis une simple photo

Vous serez bientôt dans la matrice

Tiens, en parlant de ça :

Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

Plus moins bien

Transhumanisme, long-termisme… des idéologies aux racines eugénistes ?

Science artificielle

Corrigée depuis deux ans, une faille Windows activement exploitée par des pirates russes

Faille 1460-days

Sommaire de l'article

Introduction

Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

Transhumanisme, long-termisme… des idéologies aux racines eugénistes ?

Corrigée depuis deux ans, une faille Windows activement exploitée par des pirates russes

La CNIL fait le bilan de son année 2023, cinquième année après RGPD

#LeBrief : TikTok suspend sa version Lite, Ariane 6 debout, enquête sur Pegasus, l’Europe et la violence numérique aux femmes

Terrorgram, la fabrique de terroristes d’extrême-droite, à coups de mèmes et de shitposts

Fiabilité des disques durs HAMR de 30 To et plus : Seagate donne des chiffres

[Màj] Le Congrès des États-Unis vote la loi obligeant ByteDance à vendre TikTok

#LeBrief : Fedora 40, anniversaire Hubble, vidéosurveillance algorithmique à Cannes, Voyager 1, Android 15 bêta 1.1

Sur GitHub et GitLab, des commentaires détournés pour stocker des malwares

[FAQ] Notre antisèche sur l’informatique quantique

L’Université d’Oxford ferme le Future of Humanity Institute dirigé par Nick Bostrom

#LeBrief : Apple rachète le français Datakalab (IA), propagande de la Russie, fin de partie pour Roccat, Proton Mail vs dark web

Europol milite pour un chiffrement de bout en bout « flexible »

Inclusion dans la tech : critiqué, le CEO de Qovery menace une internaute de poursuites

L’extension des prestataires américains devant collaborer avec la NSA fait polémique

#LeBrief : fuite chez Speedy, Rust pour Thunderbird, Saint Exupéry et PhiFire AI pour le satellite Φsat-2

Des institutions internationales s’engagent pour l’ouverture des données sur la recherche

#Flock craque le slip et explose les quotas

[Édito] Au pays des VPN menteurs…

Les clients LastPass victimes d’une attaque par phishing orchestrée grâce à un kit clé en main

Les recommandations de la NSA pour « déployer des systèmes d’IA en toute sécurité »

#LeBrief : Windows Store amélioré, 28 licenciements chez Google, sécurité des données des français, compétition 404CTF