Volta débarque enfin dans une carte graphique PCIe avec des sorties vidéo : la Titan V. NVIDIA inaugure pour l'occasion une version légèrement limitée du GV100, et annonce un tarif de 2 999 dollars.
L'édition 2017 de la conférence NIPS (Neural Information Processing Systems), se tient à Long Beach. L'équipe de NVIDIA est sur place et en a profité pour faire une annonce surprise cette nuit : la Titan V, exploitant une puce de la génération Volta.
Il s'agit d'une carte graphique dans un format standard (PCIe 3.0), qui reprend un design désormais classique pour la marque avec néanmoins un ventirad aux accents dorés. Trois sorties DisplayPort et une HDMI sont présentes à l'arrière, un duo de connecteurs 6+8 broches étant nécessaire pour son alimentation (16 phases). Le TDP de la carte est annoncé à 250 watts.
Volta est déjà disponible à travers le GV100
Pour rappel, Volta était jusqu'à présent proposé uniquement à travers deux produits pour serveurs connus sous la référence Tesla V100. L'un au format NVLink (300 Go/s), l'autre sous la forme d'une carte graphique plus classique avec un port PCIe (32 Go/s), lancée au début de l'été.
Les performances (7,8 TFLOPS DP) et le TDP (300 watts) étaient plus élevés dans le premier cas. Le modèle PCIe se limitant à 7 TFLOPS DP et 250 watts. Deux points communs : les 16 Go de HBM2 ECC et leur bande passante de 900 Go/s (4096 bits). La puce GV100 comprenant 5376 CUDA Cores regroupés en 84 Streaming Multiprocessors.
Au sein de la puce telle que commercialisée, seuls 5120 (80 SM) étaient actifs, avec 320 unités de texture et 6 Mo de cache L2. Des instructions pensées pour le deep learning avaient également été intégrées, NVIDIA évoquant alors 640 Tensor Cores (8/SM). Le tout fonctionnant à une fréquence maximale (Boost) de 1 530 MHz.
Au total, ce sont ainsi pas moins de 21,1 milliards de transistors qui composent cette puce de 815 mm² gravée en 12 nm.
Une première carte dans un format classique
Comment se distingue la Titan V ? Tout d'abord de par son format puisque les Tesla ne disposent pas de sortie vidéo, leur système de refroidissement étant également spécifique aux serveurs. Elles peuvent donc être utilisées dans un PC tout à fait classique pour la première fois.
Par leur composition ensuite. Si l'on retrouve bien les 5120 CUDA Cores, 640 Tensor Cores et les 320 unités de texture, la fréquence maximale passe à 1455 MHz alors que l'interface mémoire n'est plus que de 3072 bits (652,8 Go/s) pour 12 Go de HBM2. Le cache L2 passe à 4,5 Mo.
La puce compte toujours 21,1 milliards de transistors. La puissance de calcul côté deep learning est donnée pour 110 TFLOPS contre 125 TFLOPS pour une Tesla V100.
Côté tarif enfin, puisqu'il n'est question « que » de 2 999 dollars, avec une disponibilité directement sur le site de NVIDIA, soit 3100 euros. Les livraisons débuteront la semaine prochaine. Pour rappel, une Tesla V100 se négocie à plus de 12 000 euros. La GeForce GTX Titan Z avec deux GK100 était lancée en 2014 également à 2 999 dollars.
Après la déclinaison Titan, les GeForce ?
Gamme Titan oblige, cette carte se destine avant tout à ceux qui ont un besoin professionnel. NVIDIA vise surtout les chercheurs et autres scientifiques dans le domaine de l'IA qui peuvent désormais utiliser une puce de la génération Volta dans une station de travail plutôt que dans un serveur.
Ils auront également accès, sur demande et sans frais pour le moment, à GPU Cloud qui vient d'ouvrir ses portes. De quoi apporter une nouvelle concurrence à la Radeon RX Vega Frontier Edition lancée cet été. Celle-ci est néanmoins bien plus abordable puisqu'il était question de 999 dollars au lancement. Actuellement, on la trouve à un peu moins de 750 €.
Mais l'on se doute que certains tenteront d'en profiter pour s'essayer à des jeux vidéo sur un produit qui embarque tout de même 33 % d'unités de calcul en plus par rapport à une Titan Xp (pour un tarif 150 % plus élevé). Il sera alors intéressant de voir ce que Volta a dans le ventre sur ce terrain.
NVIDIA pourrait également profiter du CES de Las Vegas pour dévoiler ses plans concernant l'avenir des GeForce. L'architecture Pascal a été déclinée dans tous les sens et l'on attend de savoir ce qui est prévu à l'avenir. Dérivé de Volta, nouvelle architecture dédiée, les rumeurs sont nombreuses... et il est temps que NVIDIA clarifie les choses.