La semaine dernière, le réseau social Meta annonçait AI Research SuperCluster. Il est présenté comme rien de moins que « l’un des supercalculateurs d’IA les plus rapides fonctionnant aujourd’hui » et – une fois entièrement construit à la mi-2022 – « le plus rapide au monde ». On y retrouve une débauche de cartes graphiques avec des centaines, voire des milliers, de DGX A100 de NVIDIA, chacun équipé de 8 GPU A100.

Le CEA propose un « décryptage » de cette annonce avec Christophe Calvin, expert en calcul hautes performances et en simulation numérique. L’occasion de revenir sur cette débauche de puissance et la remettre en perspective. Il explique notamment que, « malgré l’effet de buzz médiatique qu’a produit l’annonce de Meta, son supercalculateur ne devrait pas encore révolutionner le domaine du calcul hautes performances ».

Il commence par une explication générale : « l’architecture de ce supercalculateur est assez classique, mis à part le nombre impressionnant de processeurs graphiques intégrés à la machine ». « La nouveauté réside dans le fait que cette machine sera tournée essentiellement vers une seule application : le métavers et que cela nécessite de réaliser des traitements de données en masse », ajoute-t-il.

Derrière l’annonce, la guerre des FLOPS et la « précision »

Avant de plonger davantage dans la partie technique, prenons quelques instants pour définir ce qu’est « la précision » en informatique, et la conséquence qu’elle a sur les performances. Cet élément, qui est tout sauf un détail, peut en effet drastiquement changer la portée d’une annonce marketing qui vante de gros « FLOPS ».