Des GPU A100 (Ampere) de NVIDIA dans six supercalculateurs, Atos annonce son BullSequana X2415

13 000 GPU aux États-Unis et en Allemagne

À peine dévoilés, les nouveaux GPU A100 de NVIDIA prennent place dans plusieurs supercalculateurs : quatre projets sont annoncés aux États-Unis et deux en Allemagne, pour un total de 13 000 GPU environ. En Europe, le français Atos « lance le premier supercalculateur équipé des GPU NVIDIA A100 ».

Jeudi, NVIDIA présentait son premier GPU de la génération Ampere : A100. Pensé pour les datacenters, il est gravé en 7 nm et comporte pas moins de 54,2 milliards de transistors. Disponible, il doit d'ores et déjà intégrer plusieurs supercalculateurs un peu partout dans le monde.

Atos l'utilisera dans son BullSequana X2415 qui « fournira une puissance de calcul jamais atteinte jusqu’à présent et accélérera les performances des applications de HPC et d’IA [...] multipliera par plus de deux fois la puissance de calcul et optimisera la consommation d’énergie, grâce à la solution brevetée DLC (Direct Liquid Cooling) d’Atos qui refroidit totalement le système en utilisant de l'eau chaude ».

Un serveur, une baie, une lame, un rail, 1U : c'est quoi ?

Quatre GPU A100, deux CPU EPYC et 512 Go de mémoire par lame

Cette lame est basée sur un design HGX-A100 comprenant quatre GPU A100 interconnectés via des NVLink de 3e génération. Comme l'a fait NVIDIA pour ses propres serveurs, les CPU passent chez AMD puisqu'il s'agit d'EPYC en 7 nm (Milan, sans plus de précision). Un choix déjà fait par Atos sur d'autres produits.

512 Go (16 x 32 Go) de DDR4 accompagnent l'ensemble et jusqu’à quatre ports InfiniBand (NVIDIA Mellanox) pour une topologie de type Dragonfly+. Un SSD M.2 S-ATA ou NVMe est proposé en option.

La disponibilité est prévue d’ici fin juin.

Le Centre de recherche de Jülich – qui participe notamment aux projets « Humain Brain » de la Commission européenne, ainsi que « Science du Climat » et « Systèmes moléculaires » – sera le premier à l'utiliser affirme Atos. Le supercalculateur JUWELS sera ainsi mis à jour avec des lames BullSequana X2415 (et donc des GPU A100).

Il devrait alors « atteindre un pic de performance de plus de 70 pétaFLOPS, devenant ainsi le supercalculateur le plus puissant d’Europe ».

13 000 GPU A100 pour six projets de supercalculateurs

De son côté, NVIDIA annonce que cinq supercalculateurs à travers le monde se préparent à passer à Ampere. Le laboratoire national d'Argonne aux États-Unis va ainsi utiliser un cluster composé de 24 unités DGX A100, chacune comprenant 8 GPU A100 (soit 192 au total) et six NVSwitch de nouvelle génération.

Toujours outre-Atlantique, le National Energy Research Scientific Computing Center (NERSC) de Berkeley (en Californie) travaille avec HPE afin de déployer pas moins de 6 200 GPU A100 dans le supercalculateur Perlmutter. Deux des projets du NERSC utilisent déjà des prototypes de GPU Ampere avec, selon NVIDIA, « une augmentation significative des performances par rapport aux GPU Volta ».

Signalons aussi l’université de l’Indiana et son système Big Red 200 comprenant 256 GPU Ampere pour une puissance de 6 pétaFLOPS. Des recherches en cybersécurité et génétique y seront menées.

En Allemagne, outre le Centre de recherche de Jülich, le Karlsruhe Institute of Technology (KIT) s’est associé à Lenovo pour un nouveau supercalculateur de 17 pétaFLOPS comprenant 740 GPU A100.

Il effectuera des calculs pour des simulations climatiques, de la recherche autour de Covid-19, de nouveaux matériaux pour les batteries, etc. Le Max Planck Institute mise aussi sur Lenovo pour son Raven-GPU, avec 768 GPU cette fois. Il servira aux recherches en astrophysique, biologie, chimie théorique et science des matériaux.

Au total, les six projets de supercalculateurs – quatre aux États-Unis et deux en Allemagne – « utiliseront près de 13 000 GPU A100 », déclare NVIDIA. D’autres devraient suivre.

Google rassemble ses équipes Android et Appareils

07:34 0

« Projet Nimbus » : Google licencie 28 salariés qui ont manifesté contre un contrat cloud avec Israël

07:32 1

JOP : la préfecture de Paris autorise deux nouvelles expérimentations de vidéosurveillance algorithmique (VSA)

07:31 1

La DGSE lance la 3e édition de 404CTF, « la plus grande compétition de cybersécurité de France »

07:24 0

Sous Windows 10 et 11, le Store reçoit d’importantes améliorations

07:21 1

Changer de Cap demande aux administrations de garantir la sécurité des données des Français

07:19 1

Commentaires (6)

Gilbert_Gosseyn Abonné

Le 19/05/2020 à 15h 32

Comme quoi, niveau CPU serveurs, AMD gagne des points …

LordZurp Abonné

Le 19/05/2020 à 16h 24

en fait, NVidia a fait un kickstarter caché et les labos tippeurs vont recevoir leur contrepartie en A100

ElRabbit

Le 20/05/2020 à 05h 25

“Refroidi à l’eau chaude”: il n’y a pas à dire l’innovation informatique française reste à la pointe

barlav Abonné

Le 20/05/2020 à 06h 26

ElRabbit a dit:

“Refroidi à l’eau chaude”: il n’y a pas à dire l’innovation informatique française reste à la pointe

Ca m’a fait sourire aussi, mais a 400W la puce, quand tu en as 4 ou 8 par lame, l’eau chauffe vite à mon avis.
L’eau n’est qu’un vecteur pour drainer des watts, et c’est foutrement plus efficace que l’air pour ça.

DoWnR Abonné

Le 20/05/2020 à 17h 26

barlav a dit:

Ca m’a fait sourire aussi, mais a 400W la puce, quand tu en as 4 ou 8 par lame, l’eau chauffe vite à mon avis. L’eau n’est qu’un vecteur pour drainer des watts, et c’est foutrement plus efficace que l’air pour ça.

C’est surtout que c’est nettement moins énergivore de directement refroidir les composants avec de l’eau “chaude” à 35-40°C, plutôt que de refroidir inutilement des m³ d’air avec de l’eau “glacée” à 12-15°C. Le côté négatif, c’est que ce que tu ne dépenseras pas sur ta facture d’électricité, tu vas le dépenser en cuivre, aluminium et renforcement du plancher de ton datacenter qui va devoir supporter tout ce poids supplémentaire

the_Grim_Reaper Abonné

Le 21/05/2020 à 09h 06

DoWnR a dit:

C’est surtout que c’est nettement moins énergivore de directement refroidir les composants avec de l’eau “chaude” à 35-40°C, plutôt que de refroidir inutilement des m³ d’air avec de l’eau “glacée” à 12-15°C. Le côté négatif, c’est que ce que tu ne dépenseras pas sur ta facture d’électricité, tu vas le dépenser en cuivre, aluminium et renforcement du plancher de ton datacenter qui va devoir supporter tout ce poids supplémentaire

Sauf que le coût d’exploitation annuel d’un DC c’est à 60% la clim dans la plupart des cas.
Puis ton plancher tu peux le garder sur le HPC actuel, mais sur les suivants aussi. Le système de cuivre, si l’intégrateur est bon, tu peux t’en resservir à l’identique (ou presque) sur le prochain HPC (même placement de socket, dissipation thermique similaire pour le système global).

IBM a un système similaire, les lames sont plug and play avec le système de refroidissement intégré à la baie et au batiment. Et si tu restes chez eux, les emplacements sont les mêmes , donc évolutif mais attaché.

Des GPU A100 (Ampere) de NVIDIA dans six supercalculateurs, Atos annonce son BullSequana X2415

13 000 GPU aux États-Unis et en Allemagne

Quatre GPU A100, deux CPU EPYC et 512 Go de mémoire par lame

13 000 GPU A100 pour six projets de supercalculateurs

Tiens, en parlant de ça :

EUCS : la certification cloud européenne sous le feu des critiques en France

Chiens de faïence

L’Institut des normes de télécommunication de l’UE (ETSI) défie la Commission européenne

Irréductible gaulois, #oupas

Le « payer ou accepter » de Meta incompatible avec le RGPD pour le CEPD

Schrems vs Meta, une histoire sans fin

Sommaire de l'article

Introduction

Quatre GPU A100, deux CPU EPYC et 512 Go de mémoire par lame

13 000 GPU A100 pour six projets de supercalculateurs

#LeBrief : Windows Store amélioré, 28 licenciements chez Google, sécurité des données des français, compétition 404CTF

EUCS : la certification cloud européenne sous le feu des critiques en France

L’Institut des normes de télécommunication de l’UE (ETSI) défie la Commission européenne

Le « payer ou accepter » de Meta incompatible avec le RGPD pour le CEPD

Le CERN libère les données de la découverte du boson de Higgs

Le ministère de l’Intérieur mise sur l’américain TRM Labs pour traquer les flux illégaux de cryptos

#LeBrief : spectre du gamergate, TikTok Lite sous pression, Freebox Ultra vs Deus Ex Silicium, Pegasus en Pologne

Le Slip français se fait trouer : 1,5 million d’emails et des données de 696 144 clients dérobés ?

Après l’affaire XZ Utils, la sécurité des projets open source en question

Samsung dépasse les 10 Gb/s avec sa mémoire LPDDR5X

Élections européennes : Meta échoue à modérer des publicités de propagande pro-russe

#LeBrief : fuite chez le Slip Français, YouTube et les antipubs, Firefox 125, délit pour les deepfakes, trou noir « dormant »

VMware by Broadcom : une situation tendue, l’Europe s’en mêle

Comment la désinformation d’extrême-droite sert les intérêts russes en France

Mars Sample : retour pas si sûr…

#LeBrief : « traumatisme » du deepfake pornographique, Tesla licencie, Samsung repasse devant Apple, Musk vs finances X

Aux USA, la surveillance des communications d’étrangers sans mandat (FISA) fait débat

Apple autorise puis supprime un émulateur Game Boy sur iOS

Android 15 bêta : Wallet par défaut, sécurité des réseaux mobiles et Wi-Fi, bugs sur le NFC

Rapidité vs précision : deux experts nous expliquent les enjeux des GPU modernes sur les IA

#LeBrief : Beeper rachetée, Cyber Command USA, incident technique BFMTV, « destin énergétique » de l’Europe

#Flock : de Game of Shithrones au jeu des sept différences

Google rassemble ses équipes Android et Appareils

« Projet Nimbus » : Google licencie 28 salariés qui ont manifesté contre un contrat cloud avec Israël

JOP : la préfecture de Paris autorise deux nouvelles expérimentations de vidéosurveillance algorithmique (VSA)

La DGSE lance la 3e édition de 404CTF, « la plus grande compétition de cybersécurité de France »

Sous Windows 10 et 11, le Store reçoit d’importantes améliorations

Changer de Cap demande aux administrations de garantir la sécurité des données des Français

Commentaires (6)