Comme annoncé il y a trois semaines Jen Hsun Huang a présenté ce soir ses GeForce RTX de série 30 basées sur l'architecture Ampere, avec gravure 8 nm et RTX IO. Seules les grandes lignes ont été évoquées, tous les détails devant être dévoilés d'ici la mise sur le marché qui débutera mi-septembre.
Cela fait maintenant plusieurs années que l'on entend parler de la génération Ampere. Dès 2017/2018, ce nom de code désignant la nouvelle architecture de NVIDIA était évoqué ici ou là. Depuis, nous avons eu droit à toutes les rumeurs possibles et imaginables sur sa composition, sa finesse de gravure, la stratégie du constructeur.
RTX 30 Series : Ampere enfin adapté au grand public
Comme souvent, il y avait dans tout cela une part de faux, une part de vrai. NVIDIA sait en effet encore préserver (en partie) ses nouveaux produits des fuites. Mais aussi parce que le bal des rumeurs a tendance à déformer les informations au fil des reprises, sans parler des « intox » qui circulent elles aussi constamment.
Ce soir, Jen Hsun Huang a levé le voile sur la version grand public d'Ampere. Pour rappel, cette architecture existe déjà depuis quelque temps puisqu'elle a été annoncée pour la première fois au sein du SoC Orin pour voitures autonomes puis l'A100 qui n'est pas un GPU, mais un accélérateur pour serveurs.
On s'attendait donc à peu de caractéristiques partagées, à quelques détails près. C'est le cas du PCIe 4.0 ou des Tensor Cores de 3e génération qui profitent des mêmes avancées telles que les performances revues à la hausse avec les matrices creuses (sparse matrix). De quoi passer de 89 « Tensor-FLOPS » sur Turing à 238 sur Ampere.
NVIDIA renforce la performance brute, par euro et par watt
Pour la puissance de calcul pure, elle passerait de 11 à 30 TFLOPS rien que sur la RTX 3080. La RTX 3090 annonce pas moins de 36 TFLOPS. Côté RT Cores de seconde génération, ce n'est pas tout à fait doublé, on passe de 34 à 58 TLFOPS. De quoi aller bien au-delà de ce que proposeront les prochaines consoles, promet NVIDIA. Et Navi 2X ?
Dans la pratique, le rapport performances/watt devrait doubler par rapport à Turing. Le plafond de performance brute sera également en nette hausse grâce à la 3090 qui consommera jusqu'à 350 watts, contre 320 et 220 watts pour ses deux petites sœurs. Le rapport performances/prix serait aussi largement amélioré.
Les tarifs débutent à 519 euros pour la 3070 (octobre), 719 euros pour la 3080 (17 septembre) et 1 549 euros pour la 3090 (24 septembre), laissant de la place pour des modèles intermédiaires pouvant sortir un peu plus tard. Comme avec ses gammes précédentes, NVIDIA luttera contre l'inflation en proposant directement ses Founders Editions, au ventirad repensé, équipé de deux ventilateurs dont un traversant.
Il permet de dissiper 90 watts de plus sans avoir recours au watercooling. Il serait trois fois plus silencieux, 30 % plus efficace avec un airflow 55 % plus important promet le constructeur, sans plus de détails.
On attendra de le tester pour s'enthousiasmer.
GPU en 8 nm, GDDR6(X), nouveau ventilateur et... RTX IO
Contrairement à ce que disaient les dernières rumeurs, le GPU est bien gravé en 8 nm de chez Samsung, disposant de 28 milliards de transistors. Pour rappel, le TU102 de la RTX 2080 Ti comptait 18,6 milliards de transistors (12 nm) dans un die de 754 mm². Ici, la dimension de la puce n'a pas (encore) été précisée.
La GDDR6X à 19 Gb/s accompagne les RTX 3080/3090 mais pas la 3070. 24 Go seront bien présents sur la 3090 qui n'est pas une carte bi-GPU, mais une remplaçante de la Titan RTX (à 2 900 euros). Ce sera d'ailleurs la seule carte dotée d'un connecteur NVLink redesigné (vendu 79 dollars). D'une certaine manière, il s'agit tout de même d'un bi-GPU « by design » avec pas moins de 10 496 CUDA Cores intégrés, là aussi loin des dernières rumeurs en date.

L'autre grande annonce de la soirée était RTX IO, inspirée de GPUDirect Storage. On s'attendait à ce que plusieurs technologies du genre soient dévoilées mais c'est la seule. NVIDIA garderait-il quelques surprises ? Nous verrons.
Dans la pratique, il s'agit d'une solution permettant des échanges directs entre stockage et GPU, ce dernier pouvant prendre en charge des traitements de données (décompression sans perte de textures par exemple) sans avoir à passer par le CPU. Un accès direct de plus en plus courant, notamment dans le domaine des serveurs et du réseau.
Il vise ici à réduire la dépendance à un processeur haut de gamme pour l'accès aux données. Le tout passera par l'API DirectStorage de Microsoft, intégrée à DirectX. Les GeForce RTX Turing en profiteront également.
Réduire la latence via les développeurs et les écrans
Une ribambelle d'annonces a également été faite concernant la couche logicielle, comme NVIDIA Reflex pour (encore) réduire la latence d'affichage. Cela passe par une suite d'outils, comme les écrans G-Sync « e-sport » avec analyseur de latence et dalle IPS à 360 Hz (déjà annoncés). Acer, Alienware, Asus et MSI seront de la partie.
Ils disposeront d'un mode e-sport où le rétroéclairage dynamique est désactivé, avec des noirs renforcés, des niveaux gamma adaptés pour permettre au joueur de mieux distinguer ce qui se passe dans les zones sombres. Leur mode Ultra Low Motion Blur (ULMB) fonctionnera à 240 Hz, deux fois plus rapide qu'auparavant.
Mais cela va plus loin que les fonctionnalités ajoutées habituellement dans les pilotes, puisqu'un SDK permet aux développeurs (de jeux) de mesurer la latence et d'en comprendre les causes pour la réduire, notamment pour ce qui est de la queue de rendu ou de l'attente du CPU. Plus de détails sont donnés par ici.
Des gains sont annoncés sur l'ensemble des GeForce depuis la série 900 dans plusieurs titres : Apex, Destiny 2, Fortnite ou encore Valorant. La cible est en effet d'abord les freet-to-play « nerveux » et compétitifs.
Nouvelles fonctionnalités, plus de jeux RTX... dont Fortnite
De son côté, Broadcast permettra de centraliser les fonctionnalités visant les streamers : réduction du bruit (ex-RTX Voice), remplacement du fond d'écran, suivi du visage par la webcam, etc. Omniverse Machinima, pendant « gaming » de l'outil collaboratif Omniverse vise à favoriser la création de scènes et films basés sur des jeux vidéo.
Si les pilotes ne sont pas retravaillés en profondeur, l'amélioration des fonctionnalités de GeForce Now continue... en s'inspirant du très bon travail fait par AMD autour de son Overlay. Comme l'on pouvait s'y attendre, NVIDIA fera de même, avec des indicateurs de performances, température, puissance, latence, entre autres paramètres.
Tout cela doit arriver dans le courant du mois de septembre/octobre, pour accompagner le lancement des nouvelles GeForce RTX. Pas de DLSS 3.0 au programme pour le moment par contre, mais des nouveaux jeux avec ray tracing, et pas des moindres : Fortnite et Call of Duty : Black Ops - Cold War.
NVIDIA met déjà en avant le jeu 8K avec DLSS, la capture ShadowPlay HDR dans la même définition, le support d'AV1 en décompression par son nouveau moteur vidéo, du HDMI 2.1 (avec rafraichissement variable natif donc). Le constructeur a travaillé avec LG pour proposer des TV OLED G-Sync 8K.
Il n'a par contre pas été question du fameux connecteur PCIe 12 broches, évacué dans une vidéo il y a quelques jours, mais il est bien présent. Toutes les cartes peuvent gérer quatre écrans avec support du HDCP 2.3 via trois DP 1.4a et un HDMI 2.1. Exit par contre le connecteur VirtualLink sous la forme d'un connecteur USB Type-C.
Nouvelles GeForce : une question de puissance (par watt)
Reste maintenant à voir comment AMD va se positionner face à ces nouveaux produits. Pour le moment, il n'a rien à opposer au-delà des Radeon RX 5700 XT et Vega VII. C'est avec RDNA2 et ses nouvelles Radeon (Navi 2X), gérant pour la première fois du ray tracing qu'il tentera de revenir sur le haut de gamme, mais la barre semble haute.
Intel devrait aussi devenir une menace grandissante avec ses GPU Xe, dont la version HPG doit être proposée aux joueurs l'année prochaine. C'est sans doute pour couper l'herbe sous le pied de ses deux concurrents que NVIDIA a décidé de frapper fort à de nombreux niveaux avec sa nouvelle gamme.
Mais la réussite se concrétisera-t-elle au-delà des annonces ? Car elles ne sont que le début de l'aventure pour ces GeForce RTX 3070, 3080 et 3090. NVIDIA ne détaillera l'architecture de ses puces que dans un second temps, les tests des premiers produits étant attendus d'ici leur mise en vente dans deux semaines.
Rendez-vous donc d'ici peu pour voir ce qu'elles ont dans le ventre.