Ampere Computing : derrière l'annonce de CPU maison, le besoin de transformer l'essai

Ampere Computing : derrière l’annonce de CPU maison, le besoin de transformer l’essai

5 nm is coming

Avatar de l'auteur
David Legrand

Publié dans

Hardware

24/05/2021 5 minutes
11

Ampere Computing : derrière l'annonce de CPU maison, le besoin de transformer l'essai

Si AMD a fait du mal à Intel dans le domaine des serveurs, un autre acteur s'est démarqué ces dernières années, avec des solutions exploitant l'architecture ARM cette fois : Ampere Computing. La société vient d'annoncer de nouveaux processeurs qui pourraient changer la donne.

Ampere Computing est une jeune société, créée fin 2017 par Renée James peu après son départ d'Intel. Elle est soutenue par le fonds Carlyle Group, qui lui a apporté des licences et IP, et s'est donnée pour mission de repenser les processeurs pour serveurs, en allégeant l'architecture ARM pour l'adapter aux seuls besoins du cloud.

Quelques mois plus tard, la société évoquait son premier produit gravé en 16 nm FinFET par TSMC : l'eMAG 8180. Disponible dès septembre 2018, il n'était qu'une première étape. Il ne proposait en effet « que » 32 cœurs ARMv8-A cadencés jusqu'à 3,3 GHz, avec 42 lignes PCIe 3.0 et huit canaux de DDR4-2667 pour un TDP de 125 watts. 

Ampere Computing avait déjà à l'époque l'objectif d'aller bien plus loin, avec l'intégration d'un nombre croissant de cœurs, offrant une densité incomparable par rapport à l'offre de ses concurrents. Ce qui lui a valu tôt le soutien de certains fournisseurs de services Cloud (CSP) comme Packet ou de constructeurs tels que Lenovo. 

Ampere Computing Altra Design

Altra ou le début de la réussite

Après une levée de fonds début 2019, la société lançait sa gamme Altra début 2020, avec cette fois pas moins de 80 cœurs jusqu'à 3 GHz. Comme prévu, elle était gravée en 7 nm par TSMC, exploitant l'architecture ARM Neoverse N1 (v8.2+, SBSA Level 4, SIMD 2x 128 bits), une accélération de l'IA en inférence (INT8, FP16). Elle pouvait fonctionner sur 1 ou 2 sockets avec un maximum de 4 To de DDR4 (3200), 128/192 lignes PCIe 4.0 et un TDP gobal de 210 watts.

De nouveaux partenaires étaient alors de la partie, comme Canonical, Gigabyte, Microsoft Azure, Oracle ou encore VMWare. Ce processeur était attendu pour la mi-2020, devant rapidement évoluer. Car dès juin la version Max à 128 cœurs était annoncée, prévue avant fin 2020. Là encore avec une croissance de l'écosystème.

D'autres de poids s'étaient manifestés : NVIDIA, qui était alors en pleine adaptation de sa couche logicielle à ARM, avant d'officialiser sa volonté de racheter l'entreprise, mais aussi Cloudflare ou Equinix et... Scaleway. Le Français disait à l'époque évaluer la solution pour un renouvellement de ses offres ARM fin 2020 qui n'est jamais intervenu. 

Ampere Computing indiquait alors disposer de solutions nécessitant les 3/4 de la consommation d'un EPYC d'AMD pour le même niveau de performances. Et pouvoir grimper à 1,6x ses performances avec une consommation moindre dans le cadre des Altra Max. Des affirmations vraies surtout dans certains cas.

Ampere Computing Roadmap 2021Ampere Computing Roadmap 2021

Cap sur le 5 nm

Quoi qu'il en soit, la suite était déjà tracée pour l'entreprise qui venait de réussir la production d'une puce de test en 5 nm. Là encore les choses sont allées assez vite et il y a quelques jours, Renée James et son équipe tenaient une conférence en ligne pour faire le point sur leur feuille de route et les projets des deux prochaines années.

Un évènement peu enthousiasmant dans sa forme, mais d'importance sur le fond. Car c'est une nouvelle étape importante qui se prépare : le développement de cœurs CPU maison, à la manière de ce qu'a annoncé NVIDIA avec Grace. Ils ne seront plus basés sur une solution clé en main à adapter, mais resteront compatibles avec ARM. 

Ils seront utilisés sur une puce « nouvelle génération » attendue pour l'année prochaine, gravée en 5 nm. Ils sont bien entendu annoncés comme plus performants et efficaces d'un point de vue énergétique. Plus de 128 cœurs pourront être embarqués au sein d'un même processeur, même si le chiffre exact n'a pas encore été dévoilé.

La génération suivante est attendue pour 2023, sans plus de détails pour l'instant.

Ampere Computing doit passer la seconde

Quatre ans après sa création, Ampere Computing semble arriver à un certain niveau de maturité et se préparer à un point d'inflexion dans son histoire. Elle le fait d'ailleurs avec un jeu à son avantage, puisque les solutions ARM sont dans la tendance du moment, avec un support qui tend à s'améliorer, une partie du secteur se focalisant de manière croissante sur les questions de densité, d'efficacité énergétique, cherchant parfois des alternatives à x86. 

La société peut ainsi être pour les CSP une manière de répondre à AWS et ses puces Graviton que l'entreprise de Jeff Bezos se réserve, lorsque la puissance et la grande compatibilité des EPYC d'AMD ou Xeon d'Intel n'est pas nécessaire. Le soutien de NVIDIA à l'écosystème ARM est un plus qui joue également en sa faveur, même s'il lui faudra prendre garde à l'arrivée de solutions très optimisées pour les GPU maison comme Grace (en 2023).

D'ici là, il faudra qu'Ampere Computing aille au-delà des effets d'annonce de ses débuts. Que l'on commence à trouver ses produits plus concrètement chez les CSP (comme Scaleway en France), dans les catalogues des constructeurs et leurs intégrateurs, avec un nombre croissant de serveurs visant des usages diversifiés. 

Car l'avance prise peut rapidement disparaître, et la concurrence accrue dans le secteur ces dernières années pousse ses acteurs à se dépasser. Pour rester indépendante, l'équipe de Renée James va donc devoir trouver le moyen de s'imposer et faire des solutions d'Ampere Computing un incontournable des datacenters de demain.

Écrit par David Legrand

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Altra ou le début de la réussite

Cap sur le 5 nm

Ampere Computing doit passer la seconde

Commentaires (11)


Du coup c’est quoi « le seul besoin du cloud » ?



(reply:57330:Fab’z)




Densité, consommation minimale, débit des E/S, sans doute certaines optimisations spécifiques. Mais pas tout ce qui vise des marchés grand public (smartphone, PC portable)


Je me suis toujours demandé comment ARM peut sur le serveur dépassé X86. Je trouve cette architecture “moins générique” que X86.



Après je suis d’accord que ça peut faire des merveilles aussi sur des besoins spécifiques, mais ça reste toujours pas assez générique comparé à X86.


Des gros die rempli de cœurs sans les set d’instruction inutiles que peuvent avoir les proc’ x86 j’imagine. Ca me rend curieux… ^^



(reply:57334:Fab’z)




Je dis pas qu’il y a pas de use case, et je pense que pour le cloud c’est super, mais honnêtement je vois pas trop les autres use cases.


Faire comme NVIDIA : un CPU minimal avec un côté brutasse côté E/S pour faire la belle vie à tes meilleurs amis : les GPU :transpi:


C’est intéressant tout ce qui se trame côté processeurs pour serveur :ouioui:
Hate de voir où cela va mener.


C’est exactement ça en vrai, comme pour le M1.



C’est vraiment une approche intéressante car on peut maximiser les performances pour une consommation ridicule. Après en R&D c’est pas le même budget (même si je pense que ça peut éviter de nombreux casse tête et donc finalement en faire gagner un paquet).



Je pense que le futur passera par les accélerateurs. Apple à bien tirer son épingle du jeu :D


C’est pas tant une question de futur, les accélérateurs multiples sont là désormais (et depuis un moment pour certains). L’enjeu c’est de généraliser leur utilisation. Là où il y a encore un point de tension, c’est surtout sur les accès directs à ces accélérateurs sans passer par le CPU. Les travaux en cours pour le permettre pour le stockage vont sans doute être la plus grosse source de gains de performances des années à venir (via DirectStorage chez MS par exemple, des solutions existant déjà pour les pro).



Non parce que si demain on a une version CUDA de Zip, la décompression des pilotes ira bien plus vite :D


Exact, vu comme ça ça fait sens.



C’est vrai que ZIP accéléré par GPU ça serait le pied :D.



Après sur les consoles ils ont des jolies puces dédiés, un jour on aura peut être ça aussi sur nos SSD qui sait :D.


C’est pas nécessaire si tu traites sur GPU, après tu peux intégrer des accélérateurs dans le SoC, mais sans l’API qui allait avec ça n’avait pas forcément trop d’intérêt. On verra comment ça va évoluer désormais.