NVIDIA dévoile Ada Lovelace, ses GeForce RTX 4080/4090, RTX 6000 et L40 : ce qu'il faut en retenir

Il y en a pour tous les goûts (ou presque)
TechGTC 18 min
NVIDIA dévoile Ada Lovelace, ses GeForce RTX 4080/4090, RTX 6000 et L40 : ce qu'il faut en retenir

Cette année, la GTC de fin d'année de NVIDIA n'a pas été que l'occasion d'annoncer des nouveautés à destination des professionnels. Jen Hsun Huang a profité du début de sa conférence pour viser les joueurs avec une bonne nouvelle : les GeForce RTX de série 40 arrivent dès le 12 octobre. Mais...

La GPU Technology Conference de NVIDIA est un évènement organisé deux fois par an, servant à la société à mettre en lumière ses technologies telles qu'elles sont conçues et déployées par ses équipes et ses partenaires dans de nombreux secteurs, de la conception 3D au domaine médical en passant par la robotique ou la recherche.

Bref, il s'agit principalement d'un moment consacré aux « pros », où il est surtout question de frameworks, API et kits de développement, de nouvelles cartes graphiques/réseau pour stations de travail et pour serveurs, de switchs capables de traiter plusieurs dizaines de Tb/s, de métavers et autres solutions émergentes.

H100 arrive, un nouveau Jetson Nano

Lors de la précédente édition, l'architecture Hopper avait été dévoilée. Équipant la carte H100, elle est composée de pas moins de 80 milliards de transistors gravés en 4 nm par TSMC. Elle gère DPX, dispose de HBM3 et de nouveaux accélérateurs comme le Transformer Engine qui doit réduire drastiquement le temps d'entraînement de modèles IA lourds, prenant en compte des milliards de paramètres, comme BERT, GPT-3, ou Dall-E. On apprend aujourd'hui qu'elle sera proposée dans de premiers serveurs de partenaires à compter du mois prochain.

NVIDIA GTC Fall 2022NVIDIA GTC Fall 2022

Mais Jen Hsun Huang a également annoncé le module Jetson Orin Nano qui sera proposée à partir de 199 dollars en janvier 2023, peu après la mise en ligne du JetPack SDK 5.1, son OS Linux maison basé sur Ubuntu. Ce module dispose de 6 cœurs ARM Cortex-A78 (v8.2), d'une solution graphique à 512 ou 1 024 cœurs Ampere, de 4 à 8 Go de mémoire, avec un TDP compris entre 5 et 15 watts selon la configuration et les versions.

Elle pourra être utilisée au sein du même kit de développement que les Jetson Orin NGX/AGX annoncés en début d'année. Elle est, selon NVIDIA, jusqu'à 80 fois plus performante que l'actuelle Jetson Nano : 40 TOPS (IINT8).

Thor prend le pouvoir dans les voitures, IGX et services cloud

On a également eu droit à l'annonce d'une nouvelle plateforme Drive pour les véhicules autonomes de 2025 : Thor. Cette carte est équipée d'une puce de 77 milliards de transistors avec un GPU de prochaine génération et un CPU Grace. Elle sera capable de gérer différents systèmes (Android, Linux, QNX), en offrant une capacité de calcul globale de 2 000 TFLOPS (FP8). Une alternative à la multiplication des composants selon le constructeur. 

NVIDIA GTC Fall 2022
La plateforme unifiée Drive Thor arrive dans les véhicules autonomes de 2025

Une plateforme IGX a également été évoquée pour le domaine de la robotique et du médical. Il s'agit cette fois d'une carte mère avec un module équipé d’un SoC Orin intégrant un CPU + GPU de la génération actuelle (ARM + RTX Ampere), accompagnée de nombreux connecteurs, d'une gestion distante (BMC), de ports PCIe... Une preuve de plus que le constructeur cherche à remplacer les processeurs x86 sous toutes leurs formes.

Mais NVIDIA a aussi profité de cette GTC de fin 2022 pour annoncer que la société entrait elle aussi dans l'ère des services. Ainsi, après son GeForce Now commercialisé auprès des joueurs, Omniverse est proposé en SaaS dans une version « Cloud », tout en pouvant être déployé par des partenaires. Il en sera de même pour des modèles IA LLM tels que NeMO ou sa déclinaison Bio à destination des chercheurs (calculs sur protéines, ADN, etc.). D'autres devraient suivre au fil des mois et prendre une part plus importante dans le modèle économique.

Néanmoins, ce que beaucoup retiendront de cette édition de la GTC est qu'elle a été l'évènement où ont été lancées de nouvelles GeForce RTX, ainsi que l'architecture Ada Lovelace. En effet, Jen Hsun Huang a ouvert sa conférence avec ces annonces, de nombreux détails ayant été distillés depuis. Nous devrions d'ailleurs nous entretenir avec les équipes du constructeur pour répondre à nos questions d'ici la mise en vente des premières cartes. Mais nous avions assez de matière pour un premier article condensant les informations importantes.

Ada Lovelace, nouvelle architecture des GeForce

Après Grace Hopper, c'est donc bien à la mathématicienne pionnière de l'informatique Ada Lovelace que NVIDIA rend hommage à travers la dénomination de son nouveau GPU destiné à des usages grand public. Pour rappel, il s'agissait précédemment de chercheurs et scientifiques comme (Blaise) Pascal ou (Alan) Turing.

Première nouveauté, donc : on en revient à une segmentation des usages et des noms, avec des solutions différentes selon les marchés, là où la précédente architecture Ampere était déclinée selon les gammes. Il faut dire que les besoins sont de plus en plus radicalement différents, ce qui explique le besoin de séparer les conceptions, même si certains éléments peuvent être réutilisés, comme les Tensor Cores ou la gravure en 4 nm par TSMC.

  • NVIDIA Ada Lovelace
  • NVIDIA Ada Lovelace
  • NVIDIA Ada Lovelace
  • NVIDIA Ada Lovelace

Pour le moment, on sait assez peu de choses de cette architecture, Jen Hsun Huang n'en ayant livré que les grandes lignes et les points forts. Il faudra attendre le livre blanc qui devrait être publié d'ici quelques semaines pour en savoir plus et analyser les choses en profondeur. Pour le moment, on sait que la puce complète se compose de 76 milliards de transistors pour un maximum de 18 432 CUDA Cores. Elle est accompagnée de GDDR6X Micron.

Dans le détail, elle est organisée en 12 Graphics Processing Clusters (GPC) contenant chacun 72 Texture Processing Clusters (TPC) avec 144 Streaming Multiprocessors (SM). On passe de 84 à 144 RT Cores, de 336 à 576 Tensor Cores. Chaque unité ayant au passage été améliorée. La fréquence maximale de la puce complète se situe aux alentours de 2,5 GHz, contre 1,9 GHz précédemment. Côté unités de calcul FP32/INT32, on reste sur un même équilibre par rapport à Ampere, soit 2:1. Il en est de même pour l'équilibre général de la puce.

Côté puissance de calcul, on nous annonce 90 TFLOPS, contre 40 TFLOPS pour la GeForce RTX 3090 Ti lancée en mars (10 752 CUDA Cores). Les Streaming Multiprocessors ont été repensés pour être capables de réagencer les instructions à exécuter et être plus efficaces (Shader Execution Reordering), les RT Cores passent à la 3e génération (200 RT TFLOPS), les Tensor Cores à la 4e (1 400 Tensor TFLOPS). Bien plus qu'Ampere.

  • NVIDIA Ada Lovelace Architecture
  • NVIDIA Ada Lovelace Architecture
  • NVIDIA Ada Lovelace Architecture
  • NVIDIA Ada Lovelace Architecture
  • NVIDIA Ada Lovelace Architecture
  • NVIDIA Ada Lovelace Architecture
  • NVIDIA Ada Lovelace Architecture
  • NVIDIA Ada Lovelace Architecture
  • NVIDIA Ada Lovelace Architecture
  • NVIDIA Ada Lovelace Architecture
  • NVIDIA Ada Lovelace Architecture

Un gros travail aurait également été mené en lien avec les développeurs pour améliorer les performances dans le cadre des jeux et applications exploitant le ray tracing, où le rendu est repensé dans son ensemble par rapport à l'habituelle rasterisation. Outre les 20 à 44 % de gain promis par la réorganisation de l'exécution des shaders, des fonctionnalités d'optimisations ont été introduites comme les opacity micro-masks/maps, permettant de réduire la zone où sont appliqués des shaders , sans avoir à la déterminer.

Les displaced micro-meshes permettent, eux, de créer des surfaces d'apparence complexe à travers un triangle et une displacement map pour simplifier le calcul de la manière dont les rayons de lumière doivent intéragir avec lui. Des exemples sont donnés sur différents objets avec des ratios de réduction importants du stockage nécessaire et de la construction de l'arbre d'analyse pour les rayons (BVH). Il sera intéressant de voir les effets en pratique. NVIDIA et ses partenaires ont pour cela créé des outils pour que les développeurs puissent en tirer parti. 

Au final, NVIDIA annonce que son nouveau GPU est deux fois plus efficace énergétiquement que la génération précédente. Mais surtout, que la puissance de calcul d'une seule carte est bien plus importante grâce à l'ensemble des technologies et améliorations introduites par l'architecture Ada Lovelace. 

On apprend au passage qu'une version RTX de Portal est attendue pour novembre, elle sera proposée comme un DLC offert aux possesseurs du jeu. NVIDIA veut d'ailleurs favoriser de telles adaptations en fournissant un outil dédié aux fans de mods en tous genres, sous le petit nom de RTX Remix.

  • NVIDIA RTX Remix
  • Portal RTX
  • Portal RTX
  • Portal RTX
  • Portal RTX
  • Portal RTX
  • Portal RTX
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix
  • NVIDIA RTX Remix

DLSS 3 est déjà là

L'un des exemples donnés est DLSS 3. Une technologie qui semble présentée comme exclusive à la série 40 des GeForce RTX, mais nous n'avons pas encore pu échanger avec NVIDIA sur ce point. La raison ? Elles intègrent un OpenFlow Accelerator prenant en compte par cette nouvelle version de la solution d'amélioration de l'image.

Pour rappel, elle consistait précédemment à calculer le rendu d'un jeu dans une définition moindre que celle demandée puis à la repasser en taille nominale grâce à une IA spécialement entrainée pour cela, appliquée via les Tensor Cores. De quoi afficher des performances bien meilleures avec une qualité d'image assez bluffante dans les versions 2.x de DLSS, la première ayant connu quelques ratés à son lancement.

NVIDIA DLSS 3NVIDIA DLSS 3

Quelle est la nouveauté de DLSS 3 ? Elle est capable d'ajouter des images intermédiaires entièrement créées par ses soins (AI Frame Generation) et donc augmenter d'autant le nombre d'images par seconde produites et la fluidité. Notamment grâce à l'OpenFlow Accelerator, dont NVIDIA nous a indiqué qu'il était nécessaire pour exécuter cette tâche avec de bonnes performances. Ainsi, les GeForce RTX de série 20/30 ne pourront pas en profiter.

En effet, pour générer de nouvelles images intermédiaires, il faut calculer en temps réel les différences entre deux existantes et « deviner » la couleur des pixels de ces zones. Pour cela, il faut notamment une analyse fine du mouvement des différents éléments de la scène. Selon les tests de NVIDIA, cela ne peut se faire de manière fine à travers les seuls motion vectors, d'où l'introduction de son analyse « optical flow », plus fine mais très gourmande en calcul. Elle n'est d'ailleurs pas parfaite de l'aveu même de NVIDIA qui précise qu'elle est utilisée de manière complémentaire aux motions vectors, de manière à disposer d'un rendu final sans artefacts. 

Plus de 35 jeux sont d'ores et déjà prêts à utiliser DLSS 3 avec la génération d'image par l'IA, qui sera simplement désactivée sur les cartes qui ne peuvent pas en profiter. C'est notamment le cas de Flight Simulator qui est plutôt connu pour être limité par le CPU. De quoi afficher des performances de plus de 100 ips dans ce titre. Une vidéo de démonstration a même été publiée afin de montrer les écarts constatés en pratique.

  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3
  • NVIDIA DLSS 3

Soyez donc prudents avec les niveaux de performances annoncés par NVIDIA sur les GeForce RTX de série 40 pour le moment, qui sont en général le fruit de l'activation de DLSS 3 seulement sur ces cartes. La société est néanmoins confiante, expliquant que le potentiel de cette technologie reste encore a découvrir et qu'il sera croissant lorsqu'il sera pleinement pris en compte par les développeurs, les gains étant déjà très élevés avec quelques jeux à venir.

Le constructeur en profite pour évoquer un sujet qui prend de l'importance dans son discours : la manière de relever les niveaux de performances. Plus que la simple moyenne d'ips ou les niveaux mini/maxi, l'entreprise indique que la latence du système est un critère de choix pour les joueurs, ce qui lui permet au passage de vanter son initiative Reflex. Un sujet sur lequel nous aurons bientôt l'occasion de revenir plus en détails.

DLSS 3 semble également prendre plus de poids dans les arguments « Studio » visant les créateurs, puisqu'il est utilisé dans un nombre croissant d'applications et une source de gain de performances dans différentes situations : le temps de rendu 3D qui peut être très réduit ou la fluidité dans le viewport.

  • NVIDIA Ada Lovelace DLSS 3
  • NVIDIA Ada Lovelace DLSS 3
  • NVIDIA Ada Lovelace DLSS 3
  • NVIDIA Latence Performances RTX Série 40

La compression matérielle AV1 fait son entrée

Autre nouveauté attendue : après la décompression AV1 gérée par NVDEC dans la génération précédente, c'est la compression qui arrive dans le moteur NVENC de 8e génération. La matrice des fonctionnalités vidéo de NVIDIA n'est pas encore à jour, mais cela devrait être utile dans des usages de type streaming, bureau distant, etc. 

En effet, AV1 est pour rappel un codec bien plus efficace dans son rapport qualité/poids d'image, tout en étant dépourvu de royalties, ce qui permet un usage large et dans de nombreux outils, notamment open source. On note que sur les GeForce RTX annoncées deux moteurs NVENC (8e génération) sont présents, un NVDEC (5e génération).

NVIDIA dit avoir travaillé en lien avec l'écosystème pour que cette nouveauté soit prise en compte rapidement, notamment du côté d'outils très utilisés par les streamers tels qu'OBS, Discord, etc. Deux moteurs NVENC étant intégrés aux modèles annoncés aujourd'hui, le temps de compression peut être divisé par deux.

L'outil maison Brodcast, proposé sous la forme d'un SDK aux développeurs, est d'ailleurs mis à jour, intégrant des améliorations pour la gestion de l'image de fond, l'eye contact ou l'utilisation d'un avatar.

  • NVIDIA Ada Lovelace AV1 NVENC
  • NVIDIA Ada Lovelace AV1 NVENC
  • NVIDIA Ada Lovelace AV1 NVENC
  • NVIDIA Ada Lovelace AV1 NVENC
  • NVIDIA Ada Lovelace AV1 NVENC
  • NVIDIA Ada Lovelace AV1 NVENC

GeForce RTX 4090 : dès le 12 octobre, à 1 949 euros

La première carte à être disponible sera la plus chère : la GeForce RTX 4090. Elle sera mise sur le marché dans trois semaines, le 12 octobre. Pour le moment, nous n'avons pas d'information sur les quantités qui seront proposées par les revendeurs français ou par NVIDIA pour ses modèles Founders Edition. Mais le constructeur veut sans doute éviter le raté connu avec les RTX de série 30 du fait de la demande importante.

Ce modèle a été annoncé à 1 599 dollars, ce qui donne 1 949 euros TTC en France, parité euros/dollars oblige. Selon nos informations, les tests seront publiés puis les cartes disponibles, sans procédure de précommande. Cette dernière n'embarque pas un GPU complet, laissant de la marge pour d'éventuels modèles « Ti ». On a ainsi droit à 16 384 CUDA Cores cadencés entre 2,23 et 2,52 GHz. Côté mémoire il est question de 24 Go de GDDR6X avec un bus de 384 bits. Jusqu'à quatre écrans peuvent être gérés (avec HDCP 2.3) via un port HDMI 2.1 et trois DP 1.4a.

NVIDIA précise dans les petites lignes que l'on peut atteindre la « 4K 12 bits HDR à 240 Hz avec DP 1.4a + DSC. Jusqu’à 8K 12 bits HDR à 60 Hz avec DP 1.4a + DSC ou HDMI 2.1 + DSC. Avec double DP 1.4a + DSC, jusqu’à 8K HDR à 120 Hz. Rendu en 4K HDR à 120 Hz, en 8K HDR à 60 Hz et les fréquences de rafraîchissement variables, conformément à la norme HDMI 2.1a ». 

La carte occupe toujours trois emplacements PCIe mais sa consommation maximale grimpe à 450 watts, comme pour la GeForce RTX 3090 Ti. Pour rappel, la RTX 3090 était, elle, annoncée à 350 watts. Ainsi, trois connecteurs PCIe à 8 broches seront nécessaires à son alimentation, ou un connecteur PCIe 5.0 adapté. Notez au passage que le port PCIe de la carte reste, lui, à la génération 4.0. Les dimensions sont de 304 x 137 x 61 mm.

Cette carte sera proposée en version Founders, qui comporte des améliorations au niveau de son étage d'alimentation et du sytème de refroidissement par rapport à la génération précédente. 

  • NVIDIA Ada Lovelace GeForce
  • NVIDIA Ada Lovelace GeForce
  • NVIDIA Ada Lovelace GeForce
  • NVIDIA Ada Lovelace GeForce
  • NVIDIA Ada Lovelace GeForce

GeForce RTX 4080 : attention à la version 12 Go

C'est en novembre que la GeForce RTX 4080 sera mise sur le marché. Mais déjà, on peut s'attendre à ce que ce modèle fasse parler de lui. En effet, s'il existe en deux déclinaisons, 12 et 16 Go de GDDR6X, annoncés respectivement à 1 099 et 1 469 euros, la différence tarifaire s'explique par de nombreux autres « détails ».

Et si l'on retrouve les caractéristiques de la carte précédente dues à l'architecture Ada Lovelace, dont la partie vidéo, il existe des différences importantes selon les déclinaisons qui auraient pu justifier une dénomination un peu moins similaire. Car si la version 12 Go est dotée de 7 680 CUDA Cores cadencés entre 2,31 et 2,61 GHz, avec un bus mémoire de 192 bits, celle de 16 Go a droit à 9 728 CUDA Cores cadencés entre 2,21 et 2,51 GHz, avec un bus mémoire de 256 bits. Elle occupe également trois emplacements PCIe par défaut, ce qui n'est pas forcément le cas de sa petite sœur, proposée uniquement via des designs de partenaires qui peuvent varier, précise NVIDIA.

Côté consommation, l'une affiche 285 watts au compteur, contre 320 watts pour le gros modèle. La première pourra se contenter de deux câbles PCIe à 8 broches, contre trois pour sa grande sœur. Dans les deux cas, un seul câble d'alimentation PCIe 5.0 suffira, certifié 300 watts pour l'une, 450 watts pour l'autre.

Bref, il faudra voir quelles seront les différences de performance en pratique avant de juger, mais on aurait aimé que NVIDIA opte pour des dénominations plus claires étant donné les écarts qui seront constatés. 

GeForce RTX 4080 4090
Les GeForce RTX de série 40 proposées par les partenaires de NVIDIA

RTX 6000 et L40 : les versions « Pro » avec 48 Go de mémoire

C'est plus discrètement que le constructeur a évoqué ses premières cartes à destination des professionnels. En effet, deux modèles avec 48 Go de GDDR6X ont fait leur apparition sur son site : la RTX 6000 destinée aux stations de travail, et la L40 pour serveurs, équipée donc d'un simple dissipateur, sans ventilateur.

Il s'agit dans les deux cas d'une carte occupant deux slots PCIe seulement, avec une consommation maximale de 300 watts, dotée d'un connecteur PCIe 5.0 adapté, de quatre DisplayPort 1.4, intégrant par contre trois moteurs NVENC et trois NVDEC, gérant des fonctionnalités spécifiques, notamment du côté de la virtualisation. 

Leurs tarifs et dates de disponibilités n'ont pour le moment pas été détaillés.

David Legrand est responsable de l'évaluation Hardware chez Clever Cloud. Dans le cadre de la publication de ses articles dans nos colonnes, il s'est engagé à suivre notre charte d'engagements déontologiques.

Vous n'avez pas encore de notification

Page d'accueil
Options d'affichage
Abonné
Actualités
Abonné
Des thèmes sont disponibles :
Thème de baseThème de baseThème sombreThème sombreThème yinyang clairThème yinyang clairThème yinyang sombreThème yinyang sombreThème orange mécanique clairThème orange mécanique clairThème orange mécanique sombreThème orange mécanique sombreThème rose clairThème rose clairThème rose sombreThème rose sombre

Vous n'êtes pas encore INpactien ?

Inscrivez-vous !