NVIDIA : architecture Turing, nouvelles Quadro RTX, solutions de ray tracing et prochaines GeForce

Pas un mot sur le chiffrement ! 38
Accès libre
image dediée
Carte graphique
David Legrand

C'est fait, et finalement, ce sera bien Turing. NVIDIA a levé le voile sur sa nouvelle architecture qui arrivera bientôt dans de nouvelles GeForce. Mais pour le moment, il est question de Quadro RTX, de ray tracing et de RT Cores.

Hier, NVIDIA tenait une conférence de presse en marge de l'édition 2018 du SIGGRAPH, qui se tient à Vancouver. Le salon consacré aux solutions graphiques était en effet le lieu idéal pour faire de nouvelles annonces, surtout que celles-ci étaient attendues. Et c'est finalement bien l'architecture Turing qui a été dévoilée.

Pour le constructeur, qui aime faire dans la mesure, il s'agit de « l'innovation la plus importante dans l'industrie en plus d'une décennie » et « du plus gros bond en avant depuis l'invention de CUDA en 2006 », rien de moins. Autant dire qu'après une punchline pareille, il faudra assurer.

Cette dernière mention de NVIDIA rappelle que la société a déjà un passif lorsqu'il s'agit d'avoir une vision à long terme, et de préparer aujourd'hui ce qui fera une partie de l'activité des développeurs de demain. CUDA était de cette trempe-là, mais que diable peut nous réserver Turing pour susciter tant d'espoirs ?

Une solution pour les professionnels, mais pas que

La précédente architecture Volta avait introduit deux éléments qui changeaient la donne par rapport aux solutions mises sur le marché jusque-là. Tout d'abord les Tensor Core, permettant d'effectuer avec une efficacité redoutable des calculs liés à l'intelligence artificielle comme les phases d'entrainement ou d'inférence, et autres traitements matriciels.

Plus récemment, c'est de RTX dont il a été question, avec l'introduction de DirectX Raytracing par Microsoft. NVIDIA a ainsi fait la démonstration de la capacité de ses architectures à traiter en temps réel des scènes 3D qui n'exploitaient pas la rastérisation, mais plutôt les fameux « lancer de rayons », grâce à une solution de « denoising » maison (DLAA).

Mais voilà, Volta n'était pas vraiment adaptée pour révolutionner le marché des joueurs. Le constructeur voulait surtout assurer sa place dans la révolution en cours, avec un GPU qui n'est plus seulement cantonné à la 3D, mais est également de plus en plus présent dans les serveurs pour la recherche ou l'IA de manière plus générale.

Mais aussi la robotique ou les voitures connectées, avec des solutions plus spécifiques comme la gamme Xavier (de Jetson à Drive), où Volta joue son rôle. Avec Turing, l'idée était de passer à l'étape d'après : réconcilier ces deux mondes.

Moins d'unités, plus efficaces

Ainsi, la huitième architecture graphique de NVIDIA, dont le développement a demandé l'équivalent de plus de 10 000 années cumulées de travail d'ingénieurs selon le constructeur, reprend les basiques de Volta en poussant le curseur un peu plus loin sur de nombreux points.

Tous les détails n'ont pas encore été donné, mais quelques chiffres ont déjà été lâchés. Tout d'abord les CUDA Cores, qui sont la base de toutes les solutions de la marque, sont désormais au nombre de 4 608 dans la nouvelle Quadro RTX 8000 (nous y reviendrons), contre 5 120 pour une Quadro GV100 (Volta) ou 3 584 pour une GeForce GTX 1080 Ti.

Leur composition a été modifiée, mais n'est pas encore précisée. NVIDIA se contente d'annoncer une puissance de calcul de 16 TFLOPS pour les opérations sur des flottants en parallèle avec 16 TFLOPS pour les opérations sur des entiers, des unités étant désormais dédiées à cette tâche. 

Le moteur de compression vidéo a lui aussi été revu, avec un débit annoncé comme amélioré de 25 % et une capacité à traiter les vidéos 8K HEVC en temps réel. La puce intègre 6 Mo de cache L2. Sa finesse de gravure n'a pas été donnée, mais on apprend qu'elle contient 18,6 milliards de transistors dans 754 mm², contre 11,8 milliards et 471 mm² pour Pascal.

NVIDIA Turing Annonce SIGGRAPHNVIDIA Turing Annonce SIGGRAPH

Pour les Tensor Cores, qui sont eux aussi toujours au programme, c'est un peu la même chose. Ils sont désormais jusqu'à 576 sur la RTX 8000, contre 640 pour la GV100. Ici, les performances annoncées sont de 500 billions d'opérations Tensor par seconde. N'allez pas penser que c'est cinq fois plus que les 118,5 TFLOPS d'une GV100, puisque ce chiffre concerne les opérations sur des entiers (4 bits). En FP16, il est question de 125 TFLOPS.

De manière plus générale, la performance « pour simuler le monde physique » est annoncée comme six fois plus importante qu'avec une architecture Pascal. Il est ici bien question d'un rendu classique, via la rastérisation. Mais ne cherchez pas de score 3DMark ou de nombre de fps dans le dernier Battlefield, c'est pour plus tard. 

Les RT Cores font leur entrée

L'annonce du jour cache celle des RT Cores, un regroupement d'unités dédié aux calculs pour le ray tracing, qui est définitivement un objectif à long terme pour NVIDIA.

La société semble en effet penser que pour franchir un cap au niveau graphique, il faut en passer par là, les solutions de rendu actuelles montrant parfois leurs limites. La démonstration « Star Wars » (voir ci-dessus) effectuée maintes fois depuis l'annonce de RTX, semble aller dans ce sens et montre tout l'intérêt d'un tel chamboulement technologique.

Surtout, le ray tracing a l'intérêt d'être une solution actuellement utilisée principalement dans le domaine professionnel, pour le rendu 3D photoréaliste. En misant sur ce cheval, NVIDIA pousse un intérêt qui lui permettra de gagner tant le cœur des joueurs, que celui des utilisateurs de serveurs et autres stations de travail.

NVIDIA Turing Annonce SIGGRAPHNVIDIA Turing Annonce SIGGRAPH

RTX, tout comme les Tensor Cores, sont d'ailleurs en train de gagner les solutions de rendu comme Adobe Dimension CC, Arnold (Autodesk), DaVinci Resolve, Blender Cycles, Vray, Redshift 3.0, etc. 

L'illustration de cela se trouve dans la démonstration d'un rendu de Porsche, effectué sur scène. « Quatre serveurs exploitant huit GPU RTX peuvent effectuer le rendu de 240 serveurs à base de bi-processeurs (Skylake, 12 cœurs), avec un quart du coût (500 000 $), un dixième de l'espace occupé et un onzième de la puissance consommée (13 kW) » précise NVIDIA, avec un rendu effectué en une heure seulement contre cinq ou six habituellement.

Le nombre de RT Cores n'est pas évoqué par NVIDIA, qui préfère dans ses caractéristiques techniques évoquer la quantité de millions de rayons (GigaRays) pouvant être traités chaque seconde. Pour une Quadro RTX 8000, c'est dix. Une puissance de calcul annoncée comme 30x celle d'un processeur (sans détails) ou 25x celle de la génération Pascal. 

  • NVIDIA Turing Annonce SIGGRAPH
  • NVIDIA Turing Annonce SIGGRAPH
  • NVIDIA Turing Annonce SIGGRAPH
  • NVIDIA Turing Annonce SIGGRAPH
  • NVIDIA Turing Annonce SIGGRAPH
  • NVIDIA Turing Annonce SIGGRAPH

NVIDIA sait d'ailleurs que ce n'est pas avec des chiffres qu'il peut réellement convaincre. Alors il a opté pour des démonstrations. La plus marquante est sans doute le retour de la scène Star Wars qui nécessitait précédemment plusieurs GV100 pour fonctionner. Désormais, une Quadro RTX 8000 suffirait. 

Impressionnant, même si l'on attendra de le vérifier par nous-mêmes, et de savoir dans quelles conditions cela fonctionnait. Il ne faut d'ailleurs pas passer à côté du coût de la bête : 10 000 dollars. « Plus vous en achetez, plus vous économisez » par rapport à l'achat de plusieurs GV100, argumenterait sans doute le PDG de NVIDIA, Jen Hsun Huang.

Trois Quadro RTX à base de GDDR6 et RTX Server

Pour ce tarif, vous aurez droit à un modèle au format classique (PCIe 3.0 x16), occupant deux emplacements et affichant un ventilateur de taille moyenne, avec 48 Go de mémoire GDDR6 sur une interface de 384 bits à 14 Gb/s, soit 672 Go de bande passante. NVIDIA utilise ici des puces Samsung (16 Gb) de nouvelle génération pour la première fois.

Le constructeur précise que deux cartes peuvent être reliées par un NVLink (100 Go/s) pour doubler la quantité de mémoire pouvant être adressée. Le VirtualLink, qui exploite l'USB Type-C pour l'alimentation et la communication avec les casques VR de nouvelle génération, est aussi de la partie en complément de quatre DisplayPort 1.4.

NVIDIA évoque d'ailleurs de nouvelles solutions dédiées à la réalité virtuelle, sans trop entrer dans les détails pour le moment : Variable Rate Shading, Multi-View Rendering et VRWorks Audio.

NVIDIA Quadro RTX

Du côté des cartes, le tarif peut descendre à 2 300 dollars pour la Quadro RTX 5000 qui perd un tiers de ses unités : 3 072 CUDA Cores, 384 Tensor Cores et 6 GR/s pour le ray-tracing. Côté mémoire, c'est divisé par trois : 16 Go seulement. Vous pourrez récupérer toutes les unités tout en vous limitant à 24 Go de mémoire avec la RTX 6000, annoncée à 6 300 dollars.

NVIDIA évoque également sa solution Quadro RTX Server qui désigne la combinaison d'un GPU de nouvelle génération avec la couche logicielle Quadro Infinity, annoncée pour le premier trimestre 2019.

Là encore, le constructeur en dit peu, mais évoque la capacité de virtualiser un GPU pour plusieurs stations de travail, comme on peut déjà le faire avec certaines solutions professionnelles. Il en profite pour évoquer le soutien de ses partenaires dans cette nouvelle aventure, avec Dell, HP/HPE ou encore Lenovo qui proposeront ses Quadro RTX.

Ces cartes sont attendues d'ici la fin de l'année.

Des nouveautés pour les développeurs

NVIDIA profite également du SIGGRAPH pour annoncer qu'il passe en open source son SDK Material Definition Language (MDL) visant à simplifier la gestion des matériaux dans les solutions de rendu 3D.

Déjà utilisé dans des outils maison comme Iray, il l'est aussi par Adobe dans Dimension CC, Vray, ou encore Unreal Studio 4.2 d'EPIC. Il devrait ainsi pouvoir se renforcer et gagner d'autres logiciels, il est distribué sous licence BSD modifiée.

Mais la société a également mis en ligne de nouveaux tutoriels DirectX 12 liés au ray tracing, annoncé la version 2018.4 de son outil de développement Nsight qui améliore ses performances mais ajoute également quelques nouveautés, dont certaines liées à l'arrivée du ray tracing. 

Bien entendu, les SDK maison ont également été mis à jour pour intégrer le support de la nouvelle architecture Turing.

Les GeForce Turing annoncées à la Gamescom

Cela ne faisait plus grand mystère, le salon de Cologne sera l'occasion pour NVIDIA de dévoiler (enfin) de nouvelles cartes graphiques haut de gamme. Elles exploiteront la nouvelle architecture Turing et seront sans doute l'occasion d'en apprendre un peu plus à son sujet.

Pour le moment, aucun détail n'a été donné, même si on peut apercevoir quelques éléments de la carte. Rendez-vous est donc donné le 20 août prochain avec pour slogan #BeForTheGame. Autant dire que l'on s'attend à ce qu'AMD et ses Radeon RX Vega se retrouvent dans une assez mauvaise posture en attendant le 7 nm et la nouvelle architecture.


chargement
Chargement des commentaires...