Ampere : NVIDIA lance huit nouvelles cartes graphiques « Pro »

Il y en a pour tous les goûts

Que vous cherchiez une carte graphique simple slot à petit TDP, un modèle pour PC portable ou un petit monstre à 4 GPU pour la virtualisation dans vos datacenters, NVIDIA a une solution Ampere pour entreprises à vous proposer désormais. Le constructeur vient en effet de dévoiler 8 nouvelles cartes graphiques.

Cette édition 2021 de la GTC est chargée pour NVIDIA. Le constructeur développe son écosystème ARM, notamment dans les serveurs, et a dévoilé un nouveau CPU maison pour ce marché. Les cartes graphiques ne sont pas oubliées pour autant. Et si Ampere n'est pas (encore) remplacé, de nombreuses références ont été évoquées.

Commençons par un rappel : il n'est plus question de Quadro ou de Tesla. Ces dénominations n'ont plus lieu d'être. Ainsi, lorsqu'elle décline ses GPU Ampere avec RT et Tensor Core pour les stations de travail, la société ne les distingue que par un « A » en début de référence. Les actuelles RTX A6000 sont ainsi accompagnées désormais des A5000 et A4000. On a également droit à plusieurs déclinaisons pour serveurs et PC portables.

NVIDIA lance ses A40, RTX A6000 et veut toujours plus de place dans les serveurs

RTX A4000 : une presque RTX 3070 compacte et peu gourmande

Passons à la NVIDIA RTX A4000 qui exploite une puce GA104 avec 6 144 CUDA Cores, 192 Tensor Cores et 48 RT Cores. Elle est accompagnée de 16 Go de GDDR6 (ECC). Sa puissance de calcul est annoncée pour 19,2 TFLOPS (FP32). Elle est donc un peu moins performante qu'une GeForce RTX 3070 (20,3 TFLOPS) avec un GPU plus complet. Cela s'explique sans doute par une fréquence plus faible et une consommation réduite : 140 watts contre 220 watts.

Modèle « 4000 » oblige, elle n'occupe en effet qu'un emplacement PCIe avec un ventirad réduit. Elle dispose de quatre sorties vidéo DP 1.4 et ne nécessite qu'un connecteur d'alimentation PCIe à 6 broches. Côté mémoire, elle double la GeForce RTX 3070 avec 16 Go de GDDR6 (ECC), toujours sur 256 bits, soit une bande passante de 448 Go/s.

RTX A5000 : 24 Go de mémoire dans une presque RTX 3080

La RTX A5000 est un peu dans la même veine, mais se positionne juste sous la GeForce RTX 3080. Elle embarque en effet une puce GA102 avec 8 192 CUDA Cores, 256 Tensor Cores et 64 RT Cores et 27,8 TFLOPS au compteur, contre 29,8 TFLOPS pour la déclinaison grand public. Mais avec une consommation de 230 watts plutôt que 320 watts.

Ici aussi on garde les 768 Go/s de bande passante mémoire (384 bits), avec une quantité supérieure : 24 Go de GDDR6 (ECC) plutôt que 10 Go. Deux emplacements PCIe sont occupés par cette carte également dotée de quatre sorties DP 1.4. Comme la A4000, elle intègre un moteur NVENC et un NVDEC. Mais ce dernier est ici accompagné d'un second.

L'alimentation est assurée par un connecteur PCIe à 8 broches. Un connecteur NV-Link (112,5 Go/s) permet de connecter jusqu'à deux RTX A5000 ensemble. Dans les deux cas, aucun tarif n'a été précisé. La disponibilité des RTX 4000 et 5000 est attendue pour avril. Espérons qu'elle sera meilleure que celle des GeForce RTX.

Quatre déclinaisons mobiles

Comme les GeForce RTX, ces cartes pour professionnels trouvent également leur place dans les PC portables. Quatre déclinaisons sont proposées : les RTX A2000, A3000, A4000 et A5000, d'une puissance de calcul allant de 9,3 à 21,7 TFLOPS, avec 2 560 à 6 144 CUDA Cores, 4 à 16 Go de GDDR6, 35 à 165 watts de TDP (et des plages assez larges).

Leurs caractéristiques sont détaillées ci-dessous. Comme pour les PC portables du grand public, il faudra faire attention aux fréquences annoncées qui pourront changer les performances constatées du tout au tout selon le TDP visé. Notez d'ailleurs que deux « nouveaux » modèles sont également de la partie : les T600 et T1200. Comme leur nom l'indique, ils exploitent des GPU Turing et visent l'entrée de gamme avec 2,5 et 3,7 TFLOPS.

NVIDIA évoque aussi tout une évolution de ses outils côté logiciel avec une offre Omniverse Entreprise, Cloud XR 2.1 sur iOS, de nombreux SDK et autres solutions de partenaires. Ses serveurs DGX évoluent d'ailleurs dans leur format et leur modèle commercial avec une offre de location mensuelle. Nous y reviendrons dans un prochain article.

NVIDIA A10 : RT et mémoire renforcés

On passe aux modèles pour serveurs, dépourvus de ventilation active. Et on commence avec l'A10 qui reprend le principe de la RTX A4000 avec un design n'occupant qu'un emplacement PCIe et un TDP de 150 watts.

Sa puissance de calcul annoncée est de 31,2 TFLOPS, mais avec une mémoire plus importante et plus rapide : 24 Go de GDDR6 et 600 Go/s de bande passante. Ce modèle est également doté de 72 RT Cores. NVIDIA la met ainsi en avant pour la virtualisation d'environnement de travail de rendu 3D, capable de gérer également calculs et IA.

Pour rappel, une A40 avait été annoncée en octobre dernier.

NVIDIA A16 : 4 GPU sur un PCB, chacun avec 16 Go de GDDR6

Le constructeur semblait également vouloir répondre aux solutions multi-GPU de ses concurrents, notamment Intel et sa carte H3C XG310 avec 4x server GPU. On trouve ici un modèle occupant deux emplacements PCIe avec un TDP de 250 watts sur lequel on sait encore peu de choses, si ce n'est qu'elle ne nécessite qu'un connecteur PCIe x16 pour fonctionner et qu'elle intègre 4 moteurs NVENC pour 8 moteurs NVDEC : l'A16.

Elle pourra donc être utilisée pour virtualiser des systèmes et applications, mais aussi traiter des vidéos en masse. Soit exactement les marchés visés par la solution d'Intel. Comme pour les autres modèles son prix n'est pas donné. Il faudra cette fois attendre le mois de mai pour les retrouver chez les différents intégrateurs partenaires de NVIDIA.

Aux États-Unis, Threads sur le point de dépasser X (Twitter)

14:00 6

Snapdragon X : Qualcomm tricherait dans ses benchmarks

11:30 1

Grindr visé par une plainte pour avoir partagé des données, dont le statut VIH, de ses utilisateurs

09:10 3

La FCC rétablit la réglementation sur la neutralité du net aux États-Unis

08:04 2

Ubuntu 24.04 LTS disponible en version finale

08:00 1

OVHcloud dévisse de près de 30 % en bourse après l’annonce de ses résultats

07:45 13

Commentaires (13)

sebld77

Le 12/04/2021 à 18h 09

Ça se positionne comment par rapport à une A100 ?

David_L Abonné

Le 12/04/2021 à 18h 52

A100 c’est 20 TFLOPS, mais pas trop le même genre de produit (format, HBM2, etc.). Ici ce sont des modèles assez spécifiques pour certains marchés (virtualisation surtout)

auberjine

Le 12/04/2021 à 22h 50

La plus grosse différence il me semble que c’est niveau FP64, 9,7 TFLOPS pour la A100, et même 19.5 sur les tensor cores, là où les RTX A doivent plafonner à ~1 TFLOPS si c’est comme les RTX de jeu

Inodemus Abonné

Le 12/04/2021 à 23h 06

(quote:0:Next Inpact)
Il y en a pour tous les goûts

Oui enfin pour l’instant, il y en a plutôt pour personne, et ça dure.

gallean

Le 13/04/2021 à 09h 38

et par rapport a une 3090 ? au vu de cette annonce, les prochaines titan/quadro seront sans doutes bientôt annoncés aussi…

Le 13/04/2021 à 09h 40

Il n’y a plus de Titan (la RTX 3090 est là pour ça). Comme dit dans l’article, la dénomination Quadro n’est plus utilisée. Il y a déjà eu une RTX A6000 à 48 Go de GDDR6 annoncée il y a quelques mois.

patos Abonné

Le 13/04/2021 à 10h 52

Ça va être relou l’absence de dénomination quadro à l’avenir :( ça avait le mérite d’être clair…

Le 13/04/2021 à 11h 31

Pas forcément, GeForce = grand public, sinon c’est du pro (avec Quadro/Tesla selon le type de référence). C’est surtout pour éviter les références à rallonge je suppose (AMD fait pareil d’ailleurs).

Le 13/04/2021 à 12h 13

David_L a dit:

Il n’y a plus de Titan (la RTX 3090 est là pour ça). Comme dit dans l’article, la dénomination Quadro n’est plus utilisée. Il y a déjà eu une RTX A6000 à 48 Go de GDDR6 annoncée il y a quelques mois.

la A6000 & A5000 semblent avoir été cité/référencés, mais ouai niveau dispo…et compatibles nvlink apparemment.

croustx

Le 13/04/2021 à 14h 19

#10

Combien de mhs ? :-p

Le 13/04/2021 à 14h 38

#11

Vu les tarifs de ces cartes, ce ne sont pas vraiment celles qu’on vise quand on veut miner rentable ;)

fofo9012 Abonné

Le 14/04/2021 à 06h 28

#12

Inodemus a dit:

Oui enfin pour l’instant, il y en a plutôt pour personne, et ça dure.

Ma RX500 commandée en novembre vient d’être expédiée, tout arrive !

Il y’a quelques 3090 : https://neeed.comptoir.co/ 2500€ ! Soit 1000€ de plus que le prix officiel

domFreedom

Le 14/04/2021 à 17h 40

#13

Hmmm. Pour remplacer les T4 du taf, et augmenter les perfs, surtout la VRAM, faudrait s’orienter vers la A10 du coup on dirait…
La A16 permettrait-elle d’augmenter la densité dans les ESX ?
edit : Mais ca va couter bonbon, tout ça…

Ampere : NVIDIA lance huit nouvelles cartes graphiques « Pro »

Il y en a pour tous les goûts

RTX A4000 : une presque RTX 3070 compacte et peu gourmande

RTX A5000 : 24 Go de mémoire dans une presque RTX 3080

Quatre déclinaisons mobiles

NVIDIA A10 : RT et mémoire renforcés

NVIDIA A16 : 4 GPU sur un PCB, chacun avec 16 Go de GDDR6

Tiens, en parlant de ça :

Le fichier des empreintes digitales sera interconnecté avec huit autres fichiers

FAED y verse

Le ciblage publicitaire ne peut pas utiliser des données personnelles récupérées ailleurs

Schrems vs Meta, encore et encore

Windows 11 ajoute des publicités dans le menu Démarrer, comment les supprimer

Rogntudjuuu !

Sommaire de l'article

Introduction

RTX A4000 : une presque RTX 3070 compacte et peu gourmande

RTX A5000 : 24 Go de mémoire dans une presque RTX 3080

Quatre déclinaisons mobiles

NVIDIA A10 : RT et mémoire renforcés

NVIDIA A16 : 4 GPU sur un PCB, chacun avec 16 Go de GDDR6

Le fichier des empreintes digitales sera interconnecté avec huit autres fichiers

Le ciblage publicitaire ne peut pas utiliser des données personnelles récupérées ailleurs

Windows 11 ajoute des publicités dans le menu Démarrer, comment les supprimer

Reddit : cas d’école de la pollution par les contenus générés par IA ?

Transhumanisme, long-termisme… comment les courants « TESCREAL » influent sur le développement de l’IA

Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

Transhumanisme, long-termisme… des idéologies aux racines eugénistes ?

Corrigée depuis deux ans, une faille Windows activement exploitée par des pirates russes

La CNIL fait le bilan de son année 2023, cinquième année après RGPD

#LeBrief : TikTok suspend sa version Lite, Ariane 6 debout, enquête sur Pegasus, l’Europe et la violence numérique aux femmes

Terrorgram, la fabrique de terroristes d’extrême-droite, à coups de mèmes et de shitposts

Fiabilité des disques durs HAMR de 30 To et plus : Seagate donne des chiffres

[Màj] Le Congrès des États-Unis vote la loi obligeant ByteDance à vendre TikTok

#LeBrief : Fedora 40, anniversaire Hubble, vidéosurveillance algorithmique à Cannes, Voyager 1, Android 15 bêta 1.1

Sur GitHub et GitLab, des commentaires détournés pour stocker des malwares

[FAQ] Notre antisèche sur l’informatique quantique

L’Université d’Oxford ferme le Future of Humanity Institute dirigé par Nick Bostrom

#LeBrief : Apple rachète le français Datakalab (IA), propagande de la Russie, fin de partie pour Roccat, Proton Mail vs dark web

Europol milite pour un chiffrement de bout en bout « flexible »

Inclusion dans la tech : critiqué, le CEO de Qovery menace une internaute de poursuites

L’extension des prestataires américains devant collaborer avec la NSA fait polémique

#LeBrief : fuite chez Speedy, Rust pour Thunderbird, Saint Exupéry et PhiFire AI pour le satellite Φsat-2

Des institutions internationales s’engagent pour l’ouverture des données sur la recherche

#Flock craque le slip et explose les quotas

Aux États-Unis, Threads sur le point de dépasser X (Twitter)

Snapdragon X : Qualcomm tricherait dans ses benchmarks

Grindr visé par une plainte pour avoir partagé des données, dont le statut VIH, de ses utilisateurs

La FCC rétablit la réglementation sur la neutralité du net aux États-Unis

Ubuntu 24.04 LTS disponible en version finale

OVHcloud dévisse de près de 30 % en bourse après l’annonce de ses résultats

Commentaires (13)