Nouveaux cœurs Arm : CPU Cortex-X4, A720 et A520 en ARMv9.2 (64 bits), Immortalis-G720 et GPU « 5th Gen »

Nouveaux cœurs Arm : CPU Cortex-X4, A720 et A520 en ARMv9.2 (64 bits), Immortalis-G720 et GPU « 5th Gen »

On se prépare à une invasion de nouveaux SoC

Avatar de l'auteur
Sébastien Gavois

Publié dans

Sciences et espace

29/05/2023 7 minutes
3

Nouveaux cœurs Arm : CPU Cortex-X4, A720 et A520 en ARMv9.2 (64 bits), Immortalis-G720 et GPU « 5th Gen »

Quasiment un an après l’annonce des Cortex-X3, A715, A510 refresh et Immortalis-G715 (avec du ray tracing pour la première fois), Arm renouvelle sa gamme de cœurs CPU et GPU à l’occasion de sa conférence Total Compute Solutions édition 2023 (TCS23). On passe à l’architecture ARMv9.2 pour la partie processeur et à la 5e génération pour la partie graphique. 

Les cœurs (CPU et GPU) Arm sont utilisés par des partenaires comme Qualcomm et MediaTek, afin de construire leurs SoC. Ils prennent des cœurs CPU (qui peuvent être de différentes générations) qu’ils arrangent avec un orchestrateur maison (DSU chez Arm), y ajoutent un GPU et des éléments supplémentaires (réseau, Bluetooth, 5G…) pour monter un SoC prêt à l’emploi pour les fabricants de smartphones. 

Cortex-X4 et architecture ARMV9.2

On attaque directement par le cœur CPU Cortex-X4 qui exploite donc l’architecture maison ARMv9.2 (ou v9.2 pour simplifier), contre v9 pour les deux générations précédentes. Comme ces dernières, le nouveau Cortex-X4 ne prend en charge que le mode 64 bits (AArch64).

Au menu des changements, Arm annonce un algorithme QARMA3 pour le Pointer Authentication (PAC), une fonctionnalité permettant de renforcer la sécurité sur les pointeurs mémoire, introduite dans ARMv8.3. QARMA3 permet de réduire l’impact des performances sur le CPU à moins de 1 %, y compris sur les cœurs « Little » Cortex-A520. 

Le constructeur met aussi en avant de « améliorations en virgule flottante » et sur le Performance Monitor Unit (PMU) sans plus de détails. Arm propose une petite frise chronologique des modifications entre son architecture v9, v9.1 et v9.2. 

ARMv9.2

Au-delà de l’architecture, le cache L2 des Cortex-X4 peut désormais grimper jusqu’à 2 Mo par cœur, contre 1 Mo précédemment. Au final, le fabricant annonce des hausses de performances de 15 % maximum comparé au Cortex-X3, contre 25 % sur le Cortex-X3 par rapport au X2 et 16 % entre le X2 et le X1. L’efficacité énergétique ferait un bond jusqu’à 40 % entre la troisième et quatrième génération de Cortex-X. 

ARMv9.2 aussi pour le Cortex-A720 et Cortex-A520

Le cœur « big » Cortex-A720 prend la relève du A715 avec là encore une architecture v9.2. Arm annonce une hausse de l'efficacité énergétique de 20 %. Le gain en performances pures n’est que de 5 % environ.

Même chose pour le cœur « little » Cortex-A520 (qui remplace le A510) avec de nouveau l’architecture v9.2, mais un gain de 22 % cette fois-ci sur l’efficacité énergétique. Il est de 8 % sur les performances, toujours par rapport au Cortex-A510.

Rien ne bouge sur les caches L1 et L2 des cœurs Cortex-A720 et A520, qui peuvent respectivement aller jusqu’à 32 et 512 ko, comme sur les Cortex-A715 et A510.

Cortex-A720 A510Cortex-A720 A510

64 bits (AArch64) uniquement sur le Cortex-A520, vers des SoC Arm sans 32 bits

Autre changement important, « le Cortex-A520 est le premier cœur processeur Arm Little sur 64 bits uniquement ». Les Cortex-A715 et Cortex-X3 étaient déjà en 64 bits seulement, avec une architecture AArch64. Arm propose ainsi la possibilité de monter un SoC 64 bits seulement. Le Dimensity 9200(+) par exemple utilise du Cortex-X3 et Cortex-A715 (64 bits uniquement), mais avec du Cortex-A510(32 et 64 bits), le 32 bits peut donc tourner sur ces quatre cœurs.

Dans la pratique, cela ne change pas grand-chose. Sur mobile, l’utilisation du seul mode 64 bits est une réalité depuis quelques années : iOS 11 (2017) chez Apple et Android 13 chez Google. Dans les deux cas, les applications 32 bits n’étaient plus autorisés quelques années auparavant. 

Si Arm affirme que le Pixel 7 de Google est le premier Android « avec un système entièrement 64 bits »… cela ne signifie pas que le SoC Tensor G2 ne supporte que le 64 bits (spoiler : il supporte en effet les 32 et 64 bits), mais simplement que le système d’exploitation ne prend en charge que le 64 bits. Avec le Cortex-A520, il devient donc possible de proposer un SoC complet ne prenant en charge que le 64 bits. Avec un système d’exploitation et des SoC 64 bits, la fin du 32 bits est en marche. 

DSU-120 : jusqu’à 14 cœurs par SoC et 32 Mo de cache L3 

Le DSU-110 (DynamIQ Shared Unit) – une évolution du DynamIQ lancée en mars 2017 – laisse sa place au DSU-120. Ce dernier est capable de gérer jusqu’à 14 cœurs, contre 12 pour son grand frère. Le cache L3 partagé entre les cœurs passe de 16 à 32 Mo maximum, avec un palier intermédiaire à 24 Mo. 

Arm met en avant quelques exemples de configurations possibles : « un cluster CPU avec dix Cortex-X4 et quatre Cortex-A720 pour ordinateurs portables haut de gamme, un cluster avec un Cortex-X4, quatre Cortex-A720 quatre Cortex-A520 pour les smartphones haut de gamme ». Bien sûr, d’autres arrangements sont possibles et les constructeurs ne sont pas obligés d’intégrer 14 cœurs dans leur cluster CPU, il s’agit simplement du maximum possible avec le DSU-120. 

DSU-120 Arm

Immortalis-G720 avec une architecture GPU de 5e génération

Côté GPU, la série Immortalis lancée l’année dernière a droit à sa seconde génération avec l’Immortalis-G720. Derrière cette hausse de cinq points dans la numérotation se cache un détail important : l’architecture interne est désormais de 5e génération – nom de code « 5th Gen », l’équipe marketing devait être en vacances – alors que les précédents GPU (des Mali-G77 à l’Immortalis-G715) utilisaient l’architecture Valhall. 

Avec sa 5e génération d’architecture GPU, Arm cible trois tendances : « la complexité des scènes, de meilleurs graphismes et la gestion de mémoire du système ». L’entreprise met notamment en avant un nouveau pipeline DVS (Deferred Vertex Shading). De plus amples détails sont disponibles par ici.

Arm affirme que sa nouvelle génération de puce permet d’avoir « jusqu'à 40 % de réduction sur l'utilisation de la bande passante mémoire et de la charge CPU. La consommation d'énergie est ainsi en baisse pour des graphismes de meilleure qualité et des expériences visuelles plus immersives ». Du côté des performances, la hausse est « en moyenne de 15 % par rapport au GPU Immortalis-G715 », assure la société.

Comme toujours, il faudra être attentif sur le nombre de cœurs GPU dans la puce Immortalis-G720. Il peut en effet y en avoir « 10 ou plus » selon Arm, contre 10 à 16 pour le G715. Les performances d’un « Immortalis-G720 » ne seront évidemment pas les mêmes avec dix cœurs qu’avec vingt. 

  • Immortalis-G720
  • Immortalis-G720
  • im
  • Immortalis-G720
  • Immortalis-G720

5th Gen aussi pour les Mali-G720 et G620 

Les Mali-G720 et Mali-G620 passent aussi à la 5e génération d’architecture GPU. Le Mali-G720 est 15 % plus performant que le Mali-G715, mais rien n’est précisé concernant le Mali-G620.

Attention ici aussi au nombre de cœurs : entre un et cinq sur le Mali-G620 et jusqu’à neuf sur le Mali-G720. Dans les deux cas, le ray tracing n’est pas supporté et reste donc la chasse gardée des Immortalis. 

Immortalis-G720 Mali-G720 G620Mali-G720 G620

Arm profite de sa conférence pour donner les noms de code des prochaines architectures sur lesquelles il travaille : Krake pour le GPU et Blackhawk pour le CPU. Pour les détails, on repassera. 

3

Écrit par Sébastien Gavois

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Cortex-X4 et architecture ARMV9.2

ARMv9.2 aussi pour le Cortex-A720 et Cortex-A520

64 bits (AArch64) uniquement sur le Cortex-A520, vers des SoC Arm sans 32 bits

DSU-120 : jusqu’à 14 cœurs par SoC et 32 Mo de cache L3 

Immortalis-G720 avec une architecture GPU de 5e génération

5th Gen aussi pour les Mali-G720 et G620 

Commentaires (3)


Petite remarque sur les annonces “marketing”: le +20% “power efficiency” est-il mesuré uniquement en condition de charge?



Car c’est souvent le cas, et selon l’utilisation c’est la conso au repos qui est importante.



Par exemple dans les tel portables: on n’a pas gagné en autonomie grâce à l’efficience des CPU/GPU, qui sont utilisés 90% du temps (même plus en fait) à très faible régime, mais parce que les batteries ont doublé de capacité en 6ans (2500mAh -> 5000mAh).



Au final l’autonomie des terminaux a peu évolué: en gros 2j.



C’est comme pour les CPU de PC de bureau et même de portable: longtemps on a comparé l’efficience du CPU à pleine charge (ce qui donne u avantage généralement à AMD) alors qu’au repos/à charge faible (genre … les 80% d’ordis utilisés uniquement en bureautique/internet), l’avantage semble plutôt chez Intel depuis des années.



De même avec la percée de l’IA, le CPU/GPU ne sont plus forcément les plus importants, mais les instructions d’IA + une structure mémoire adaptée sont très importants pour conserver l’énergie sur les terminaux.



Pour résumer ce que j’ai compris:




  • belle avancée sans être un bond pour les terminaux lourds (genre enfin un ordi ARM pour Windows?) et peut-être serveurs, cartes embarquées genre RPI

  • rien de transcendant pour la partie “mobilité”


C’est un point important en effet le “leakage” (courant de fuite ?) dans les technos avancées.
:chinois:
Une solution c’est de construire des parties modulaires et de “gater” (couper l’alimentation ?) des parties non utilisées.



Tu serais pas en train de comparer une twingo qui dépose Jean-Kevin à l’école tous les jours avec la nouvelle mustang qui est sortie il y a 5-7 ans par hasard ?
:singe:


Ils sont uniquement 5-7 ans derrière les PCs désormais en termes de perfs graphiques c’est ça?