NVIDIA lance ses A40, RTX A6000 et veut toujours plus de place dans les serveurs

C'est aujourd'hui que s'ouvrent les portes (virtuelles) de l'édition 2020 de la GPU Technology Conference (GTC) de NVIDIA. Le constructeur y déploie sa stratégie de conquête progressive des serveurs, ainsi que deux nouvelles cartes : l'A40 et la RTX A6000 (ne dites plus Quadro et Tesla).

La GTC est un moment important pour NVIDIA. C'est en effet le salon où le géant de la puce graphique rencontre son écosystème, ses partenaires et les développeurs. Il peut ainsi les réunir pour parler tant de l'évolution de sa recherche que de ce que permettent ses produits. Un peu comme l'IDF à la grande époque d'Intel.

Covid-19 oblige, l'édition 2020 est dématérialisée. Toutes les conférences seront ainsi accessibles via le site de l'évènement. De quoi assurer des heures de lecture aux passionnés du secteur. Mais il y a aussi l'habituelle conférence d'ouverture de Jen Hsun Huang, où le PDG fait de nombreuses annonces. Elle vient de commencer.

Micro PC et grosses cartes graphiques

Cette année encore, NVIDIA n'y va pas avec le dos de la cuillère et multiplie les annonces. Il y a bien sûr celle qui retiendront l'attention du plus grand nombre comme le micro PC Jetson Nano 2 Go à 59 dollars ou les deux nouvelles cartes graphiques « Pro » : l'A40 et la RTX A6000, basées sur l'architecture Ampere.

Il s'agit en réalité de produits similaires, avec un GPU A102 complet, ses 10 752 CUDA Cores, 336 Tensor Cores et 84 RT Cores. Ici, pas question de la très rapide GDDR6X, mais de pas moins de 48 Go de GDDR6 ECC. Un chiffre qui peut être doublé avec deux cartes reliées par un NVLink. Leurs GPU peuvent être virtualisés.

La première se destine aux serveurs avec un TGP limité à 300 watts et un refroidissement passif. La seconde est un modèle classique pour station de travail. Elles visent les professionnels du calcul et du rendu 3D. Leur tarif n'a pas été dévoilé. La RTX A6000 sera disponible mi-décembre. Les sytèmes intégrant ces cartes sont attendus début 2021.

NVIDIA veut continuer de faire du CPU une commodité

Cette GTC est l'occasion pour NVIDIA de montrer ses cartes concernant sa stratégie à long terme. Il est d'ailleurs intéressant de voir que dans le serveur ou le PC, les mécaniques utilisées sont similaires, avec un même objectif : minorer l'intérêt du CPU. Faire du GPU le nouvel accélérateur à tout faire.

C'est là que la notion de DPU (Data Processing Unit) entre en scène avec la gamme BlueField2. Il s'agit de fusionner une carte réseau 2x 100 Gb/s PCIe 4.0 avec un SoC contenant huit cœurs ARM A72 et des accélérateurs spécialisés. Le tout pouvant être accompagné d'un GPU Ampere et géré à distance via une interface spécialisée.

De quoi aller plus loin que les habituels Smart NIC, les différents éléments pouvant échanger directement des données et reproduire une sorte de serveur tout-en-un sous la forme d'une carte PCIe. C'est pour cela que NVIDIA parle de Data Center Infrastructure-on-a-Chip. Il dévoile aujourd'hui une couche logicielle dédiée et mise à disposition des développeurs : DOCA SDK. Mais aussi une feuille de route complète pour deux générations (jusqu'à 2023) :

Une manière de montrer que si rachat d'ARM il y a dans les 18 mois à venir, il se fera effectivement pour renforcer la compétition dans le monde des serveurs avec une capacité d'intégration à ses solutions assez poussée. Le tout favorisé par le rachat de Mellanox, devenu depuis NVIDIA Networks. Intel est prévenu.

VMWare est annoncé comme partenaire, les deux sociétés multipliant les initiatives communes (nous y reviendrons). Canonical, Red Hat et Check Point Software sont également impliquées dans l'intégration et le support de ces DPU. La Gamme Bluefield2(X) est attendue pour le courant de l'année prochaine.

NVIDIA confirme sa volonté d'acheter ARM pour 40 milliards de dollars

De plus en plus de solutions collaboratives clé en main

Autre tendance lourde : les outils prêts à l'emploi. Comme pour les joueurs, NVIDIA ne veut pas se contenter de fournir des GPU. Il veut montrer de quoi ils sont capables, sans dépendre du bon vouloir de ses partenaires.

Il y a bien entendu la plateforme de travail collaboratif Omniverse, construite autour du format Universal Scene Description (USD) de Pixar, qui passera au stade de la bêta ouverte avant la fin de l'année. Cette étape fait suite à plus d'un an de test auprès d'une quarantaine de partenaires triés sur le volet.

Il faut également compter sur Maxine, une plateforme devant servir aux services de vidéo-conférence pour qu'ils puissent exploiter des fonctionnalités liées à l'IA. Cela va de l'annulation de bruit à l'amélioration de la définition de l'image en temps réel en passant par diverses corrections.

Pour le moment, Maxine est proposée en accès anticipé aux développeurs. Elle doit regrouper d'autres initiatives du même genre précédemment annoncées, comme Jarvis. Amazon AWS, Google Cloud, Microsoft Azure, Oracle Cloud Infrastructure et Tencent Cloud sont annoncés comme partenaires.

NVIDIA dévoile l'arrivée en bêta de la plateforme CloudXR sur les instances EC2 P3 et G4 d'Amazon AWS (GPU V100/T4), devant permettre l'accès en ligne à des solutions de réalité augmentée/virtuelle. Un SDK lui est associé.

Supercalcultateur Cambridge-1 et renforcement dans la santé

D'autres annonces ont été faites, comme un partenariat avec GSK qui va se fournir en serveurs DGX A100 mais aussi avoir accès au nouveau supercalculateur devant être livré en Angleterre : Cambridge-1. Il s'agit d'un DGX SuperPOD de pas moins de 8 PetaFLOPS (Linpack) et 400 TFLOPS (IA, précision non détaillée) qui serait 29e au TOP500.

Enfin, Jen Hsun Huang a mis en avant les travaux de son entreprise en matière de recherche sur le federated learning, qui consiste à entraîner des IA depuis différentes sources de données sans que les informations sensibles ne soient partagées. Des solutions déjà utilisées ici ou là pour mieux préserver la vie privée.

Clara Discovery est également officialisée, regroupant des outils existant ou nouveaux dans le monde de la santé.

NVIDIA lance ses A40, RTX A6000 et veut toujours plus de place dans les serveurs

GPU glouton

Micro PC et grosses cartes graphiques

NVIDIA veut continuer de faire du CPU une commodité

De plus en plus de solutions collaboratives clé en main

Supercalcultateur Cambridge-1 et renforcement dans la santé

Tiens, en parlant de ça :

[Édito] Au pays des VPN menteurs…

Article sponsorisé par les lecteurs de Next

Les clients LastPass victimes d’une attaque par phishing orchestrée grâce à un kit clé en main

Le progrès <3

Les recommandations de la NSA pour « déployer des systèmes d’IA en toute sécurité »

NSA.I

Sommaire de l'article

Introduction

Micro PC et grosses cartes graphiques

NVIDIA veut continuer de faire du CPU une commodité

De plus en plus de solutions collaboratives clé en main

Supercalcultateur Cambridge-1 et renforcement dans la santé

[Édito] Au pays des VPN menteurs…

Les clients LastPass victimes d’une attaque par phishing orchestrée grâce à un kit clé en main

Les recommandations de la NSA pour « déployer des systèmes d’IA en toute sécurité »

#LeBrief : Windows Store amélioré, 28 licenciements chez Google, sécurité des données des français, compétition 404CTF

EUCS : la certification cloud européenne sous le feu des critiques en France

L’Institut des normes de télécommunication de l’UE (ETSI) défie la Commission européenne

Le « payer ou accepter » de Meta incompatible avec le RGPD pour le CEPD

Le CERN libère les données de la découverte du boson de Higgs

Le ministère de l’Intérieur mise sur l’américain TRM Labs pour traquer les flux illégaux de cryptos

#LeBrief : spectre du gamergate, TikTok Lite sous pression, Freebox Ultra vs Deus Ex Silicium, Pegasus en Pologne

Le Slip français se fait trouer : 1,5 million d’emails et des données de 696 144 clients dérobés ?

Après l’affaire XZ Utils, la sécurité des projets open source en question

Samsung dépasse les 10 Gb/s avec sa mémoire LPDDR5X

Élections européennes : Meta échoue à modérer des publicités de propagande pro-russe

#LeBrief : fuite chez le Slip Français, YouTube et les antipubs, Firefox 125, délit pour les deepfakes, trou noir « dormant »

VMware by Broadcom : une situation tendue, l’Europe s’en mêle

Comment la désinformation d’extrême-droite sert les intérêts russes en France

Mars Sample : retour pas si sûr…

#LeBrief : « traumatisme » du deepfake pornographique, Tesla licencie, Samsung repasse devant Apple, Musk vs finances X

Aux USA, la surveillance des communications d’étrangers sans mandat (FISA) fait débat

Apple autorise puis supprime un émulateur Game Boy sur iOS

Android 15 bêta : Wallet par défaut, sécurité des réseaux mobiles et Wi-Fi, bugs sur le NFC

Rapidité vs précision : deux experts nous expliquent les enjeux des GPU modernes sur les IA

#LeBrief : Beeper rachetée, Cyber Command USA, incident technique BFMTV, « destin énergétique » de l’Europe

Commentaires (2)