NVIDIA continue de creuser son sillon dans les datacenters et intègre désormais sa solution A100 chez AWS. Il ne s'agit pas ici de louer un simple GPU, mais bien une infrastructure complète, pouvant être organisée en clusters pour traiter de très grandes masses de données.
Au tour d'AWS de passer à l'architecture Ampere à travers le GPU A100 de NVIDIA. Le géant américain vient d'annoncer la disponibilité de ses instances P4d au sein du service EC2. Elles sont annoncées comme 2,5 fois plus performantes pour les calculs liés à l'IA, jusqu'à 60 % moins coûteuses que les P3 pour une même charge de travail.
- NVIDIA dévoile son monstre A100 (Ampere) avec TF32 : 54 milliards de transistors en 7 nm
- NVIDIA : Serveurs Ampere A100, carte réseau avec GPU intégré, nouvelles plateformes
Chaque groupe de 8 GPU reliés par NVSwitch (600 Go/s) est accompagné de 96 vCPU Cascade Lake d'Intel, avec 1,1 To de mémoire et 8 To de stockage avec un débit maximal de 16 Go/s. Pas moins de quatre liens à 100 Gb/s sont accessibles via EFA pour une interconnexion à très haut débit, une architecture pensée spécialement pour l'occasion :

Autant dire que cette nouvelle solution ne s'adresse pas à tout le monde. D'autant plus que ces instances peuvent être organisées en UltraClusters, avec plus de 4 000 GPU précise AWS. Une seule déclinaison est pour le moment proposée : p4d.24xlarge. Elle est réservée aux régions USA East (Virginie du Nord ) et USA West (Oregon).
Son tarif est annoncé entre 11,37 et 32,77 dollars de l'heure. Tous les détails sont disponibles par ici.