Vous rêviez d'une nouvelle carte graphique pour serveur d'entrée de gamme, compacte mais basée sur l'architecture Ampere ? NVIDIA semble enfin vous avoir entendu et dévoile sa carte A2.
Il y a quelques années, NVIDIA mettait sur le marché une carte plutôt inhabituelle, la Tesla T4. Un modèle n'occupant qu'un emplacement PCIe, low profile, ne nécessitant pas d'alimentation complémentaire, pensée avant tout pour des usages spécifiques comme le traitement vidéo ou l'inférence dans le domaine de l'IA grâce à ses Tensor Cores.
A2 : la Tesla T4 sauce Ampere
Récemment, la société a dévoilé sa RTX A2000 qui était dans la même veine mais visant les stations de travail plutôt que les serveurs. Son système de refroidissement était alors inadapté. Certains attendaient avec impatience une déclinaison dans la gamme « A », passive et plus compacte. C'est désormais chose faite avec l'A2.
Annoncée en marge de la GTC, ce modèle reprend ce qui a fait le succès de la Tesla T4 : son format. Son TDP est plus faible, configurable entre 40 et 60 watts, elle ne nécessite que 8 lignes PCIe 4.0, intègre 16 Go de GDDR6 (128 bits, 200 Go/s), 1 moteur de compression vidéo, deux pour la décompression (gérant AV1).
Elle est compatible avec toute la couche logicielle vGPU (14.0+) et peut donc être utilisée dans un environnement virtualisé (vPC, vApps, vWS, vCS), gérant SR-IOV et 16 Virtual Functions. Son format permettant une intégration en grande densité par serveur. NVIDIA ne détaille pas son nombre d'unités (excepté 10 RT Cores) mais annonce :
- 4,5 TFLOPS (FP32)
- 9 TFLOPS, 18 TFLOPS avec sparsity (TF32)
- 18 TFLOPS, 36 TFLOPS avec sparsity (FP16, BFLOAT16)
- 36 TOPS, 72 TOPS avec sparsity (INT8)
- 72 TOPS, 144 TOPS avec sparsity (INT4)
Quelles performances en pratique ?
De son côté, la T4 annonçait 8,1 TFLOPS (FP32), jusqu'à 260 TOPS (INT4) et une bande passante mémoire de 300 Go/s. Cette A2 semble donc se positionner en-dessous, comme un complément plutôt qu'un remplacement. Mais du fait de son architecture plus moderne, elle serait néanmoins plus performante de 20 à 30 % selon NVIDIA.
Il faudra attendre les tests pour en juger.