Si AMD a fait son grand retour sur le marché des CPU avec Ryzen, faire croitre ses parts de marché reste un défi. Surtout dans le monde des PC portables et des serveurs où ils n'étaient plus très appréciés après de nombreux ratés. Cela change peu à peu, forçant Intel à réagir. Le fondeur mise sur Tiger Lake pour revenir dans la course.
Le renouveau d'Intel annoncé en 2018 devait passer par celui de ses architectures. L'entreprise vivait en effet depuis 2014 sur des dérivés de Skylake : Kaby Lake, Coffee Lake, Cannon Lake, Whiskey Lake et Comet Lake. Six ans, nous sommes passés de la 6e à la 10e génération « Core », avec peu d'évolutions.
L'année dernière néanmoins, il y a eu du nouveau avec Ice Lake exploitant l'architecture Sunny Cove. Limitée à quatre cœurs, elle se voulait plus efficace, plus performante notamment lorsqu'il s'agit de traiter de l'IA via les instructions Deep Learning Boost, avec de meilleures connectique (Thunderbolt 3) et connectivité (Wi-Fi 6).
Mais cette famille de processeurs avait deux défauts. D'une part, elle ne visait que les machines ultra-fines, avec un TDP de 15 watts ou moins. Elle a donc été lancée sous la dénomination Core de 10e génération... mélangée avec des puces en 14 nm (Comet Lake) pour le haut de gamme. D'autre part, elle n'était qu'une phase de transition, servant de galop d'essai au 10 nm qui faisait ses débuts en volume, pour patienter jusqu'à Tiger Lake.
Car c'est bien cette nouvelle gamme qui doit signer le début du retour d'Intel dans la course : efficacité énergétique renforcée, passage au PCIe 4.0, à l'USB4 et au Thunderbolt 4, première intégration d'une partie graphique Xe (intégrée ou dédiée), LPDDR5, 10 nm « SuperFin »... et architecture Willow Cove.
Tant de sujets qu'Intel commence enfin à détailler, avant le grand lancement attendu pour le 2 septembre.
Xe : une architecture graphique repensée
L'un des éléments les plus intéressants de Tiger Lake est sa partie graphique Xe, dont c'est la première intégration. Elle a pour rappel été complètement retravaillée, s'éloignant des architectures précédentes (Gen 9, 10, 11). Il s'agit de sa version « LP » visant les besoins du grand public d'entrée et de milieu de gamme.
Par rapport à Ice Lake (Gen 11), Intel dit être parvenu à monter plus haut en fréquence à tension équivalente, dépassant 1,7 GHz. C'était l'un d'es objectif de Xe. Outre la montée en puissance brute (FLOPS), l'architecture devait obtenir des résultats concrets plus élevés pour un même nombre de FLOPS.
Pour y parvenir, l'équipe dit avoir repensé ses unités d'exécution (EU), désormais au nombre de 96 et organisées en 6 « subslices » de 16, contre 8x8 auparavant. Un cache L1 de données fait son entrée, en plus du cache L3 plus important : de 3,8 Mo dans Tiger Lake, il peut grimper à 16 Mo si nécessaire.
La bande passante de l'interface avec la mémoire (GTI) est doublée, passant à 2x 64 octets par cycle (en lecture et en écriture). Intel dit aussi assurer une compression de bout-en-bout
Plus d'unités de calcul, de cache, de possibilités
Mais c'est surtout l'équilibre interne des unités d'exécution qui a été modifié. Passant de quatre unités de calcul (ALU) sur des flottants/entiers (FPU/INT), accompagnées de quatre sur des flottants ou pour des fonctions mathématiques avancées (EM), à une organisation de type 8+2.
On passe donc de 8 à 10 ALU, avec quelques subtilités. Les huit principales peuvent effectuer des calculs flottants/entiers, alors que les deux autres ne sont plus utilisées que pour des opérations mathématiques avancées.
Ainsi, on garde le même nombre d'unités FPU, on double les INT, et les EM (deux fois moins nombreuses) ne sont plus partagées. La faible précision INT8 (via DP4A) est également de la partie sur Tiger Lake, un niveau de précision nécessaire pour de l'inférence hautes performances.
Autre point à noter : la distribution des calculs ne s'opère désormais plus au niveau d'une unité d'excution, mais deux. Une manière selon Intel de mieux gérer leur remplissage. Un cache L1 (données) fait son entrée.
Au final, Intel dit réussir à offrir un meilleur niveau de qualité d'image et de meilleures performances à TDP équivalent, ou un niveau similaire avec un TDP plus faible. Des déclarations à vérifier, aucun chiffre concret n'ayant été donné.
Il faudra attendre le 2 septembre prochain pour en savoir plus sur le sujet. On devrait alors avoir des nouvelles d'un autre projet : DG1, la première carte graphique grand public d'Intel. Elle doit arriver dans les PC portables Tiger Lake d'ici la fin de l'année, s'attaquant frontalement à AMD et NVIDIA.
Le multimédia également à l'honneur
Le moteur de traitement vidéo a lui aussi été grandement amélioré. Et pour cause : outre l'importance que ces fonctionnalités ont pour le grand public, il s'agit aussi d'un enjeu dans les serveurs où les solutions d'Intel servent pour la compression vidéo notamment. Xe annonce ainsi un débit multiplié par deux en (dé)compression.
AV1 est désormais géré matériellement pour la décompression, et le pipeline de traitement est sur 12 bits (BT2020). Bien entendu, le moteur sait gérer la 4K/8K à 60 ips, HDR et Dolby Vision, etc. Jusqu'à quatre sorties vidéo peuvent être actives, jusqu'à deux en eDP.
Elles peuvent également passer par une connectique externe : DisplayPort 1.4, HDMI 2.0, USB4 Type-C et Thunderbolt 4. La fréquence de sortie maximale est de 360 Hz, celle-ci pouvant être variable via AdaptiveSync. Le traitement d'image se fait désormais purement de manière matérielle, via l'IPU 6.
GNA 2.0 pour une inférence plus économe
Autre nouveauté : une version retravaillée du Gaussian and Neural Accelerator (GNA 2.0), introduit avec Ice Lake. Il s'agit d'une portion de l'architecture permettant de charger des modèles issus d'un réseau de neurones pour les appliquer par inférence, dans un cadre assez précis : l'exécution avec une consommation minimale.
Il s'agit plutôt d'un complément aux capacités d'inférence du CPU, GPU ou d'accélérateurs tiers. L'objectif est ici de pouvoir compter sur une application en continu même en situation de mobilité, comme pour la réduction de bruit sur une image ou du son pendant une visio-conférence, la reconnaissance vocale, etc.
Intel précise que cette v2 permettrait de réduire le taux d'utilisation CPU de 20 %.

Willow Cove : surtout une histoire de cache... et de 10 nm (SuperFin)
Côté CPU, les changements sont plus légers. Comme annoncé en 2018, l'architecture Willow Cove est surtout l'occasion pour Intel d'introduire de nouvelles protections contre les différentes attaques rencontrées ces dernières années. Mais aussi de revoir le cache à la hausse et la gravure en 10 nm.
Ce dernier point semble avoir beaucoup occupé le fondeur, qui veut en finir avec ses « +++ ». Un nom a donc été trouvé pour le process ici utilisé, t-shirt à l'appui : SuperFin. Avec ces transistors, le géant de Santa Clara dit être arrivé là où il le souhaitait avec le 10 nm, même si cela s'est fait dans la douleur.
Ainsi, les gains rencontrés seraient d'un peu moins de 18 %, un peu en-deçà de ce qui avait été constaté sur l'ensemble de l'évolution du 14 nm sur cinq générations. Le travail des équipes semble avoir payé, même si les défis restent nombreux, puisqu'il faut désormais passer au 7 nm, déjà en retard.
Au final, un cœur Willow Cove est annoncé comme capable d'atteindre une fréquence plus haute à tension équivalente, comme pour le GPU Xe LP. Avec les améliorations architecturales et la hausse des caches, il y a fort à parier que de beaux gains seront au rendez-vous.
Le cache L2 passe ainsi de 512 ko (inclusif, 8-way) par cœur à 1,25 Mo (non-inclusif, 20-way), le L3 de 8 (inclusif, 16 way) à 12 Mo (non inclusif, 12-way). Il s'agit bien entendu de valeurs maximales, qui pourront varier d'un processeur de la gamme à l'autre. Mais Intel n'en a pas encore détaillé la liste complète et les éléments de segmentation. Pour rappel, Ice Lake était limité à 4 cœurs, Comet Lake prenant le relai au-delà. Est-ce que ce sera encore le cas ?
D'autres éléments viendront renforcer les gains espérés. Tout d'abord le débit du bus interne (coherent fabric) double, organisé comme un « dual ring ». La LPDDR4X (4,3 Gb/s) et la LPDDR5 (5,4 Gb/s) sont supportées, avec la fonctionnalité Total Memory Encryption. Il s'agit comme chez AMD de permettre un chiffrement complet de la mémoire, sans que l'on sache si ce sera là aussi réservé à des modèles « Pro ».
Une fonctionnalité qui rejoint la possibilité de créer des enclaves sécurisées SGX, disponible depuis quelques générations. Intel a également revu son contrôleur mémoire, désormais scindé en deux pour être plus efficace, avec une bande passante maximale disponible annoncée à 86 Go/s.
Autre bonne nouvelle : le PCIe 4.0 est supporté par les lignes implémentées dans le CPU.
Une connectique renforcée
C'était l'un des autres grands travaux de Tiger Lake : monter en gamme au niveau des E/S. Outre la LPDDR5 et le PCIe 4.0, on a donc droit à un support natif de l'USB4 et de Thundebolt 4 (une version plus exigeante de la norme), proposant chacun jusqu'à 40 Gb/s sur des connecteurs au format Type-C, avec gestion du DisplayPort.
Le Wi-Fi 6 sera bien entendu toujours de la partie. On espère aussi voir un nombre croissant de PC portables proposer du réseau filaire (RJ45) à 2,5 Gb/s, cette norme devenant de plus en plus commune.
Tiger Lake face à AMD, Lakefield face aux SoC ARM
Pour Intel, la bataille de fin d'année sera double, et ira d'ailleurs au-delà de Tiger Lake. Celui-ci devra en effet lui permettre de remonter la pente face à AMD sur le marché des PC portables ultra-fins, intégrant des technologies en avance de phase, mettant le pied à l'étrier de l'architecture graphique Xe.
On attend d'ailleurs avec impatience de pouvoir tester les modèles qui intègreront également un GPU DG1, qui sera le premier du constructeur à devoir se battre frontalement avec les GeForce et autres Radeon. Intel aura pour lui l'intérêt d'un pilote repensé, unifié, mais la société a tout à prouver sur ce terrain.
Le 2 septembre sera aussi l'occasion de demander au géant de Santa Clara comment il compte répondre à AMD et ses Ryzen Mobile de 3e génération (série 4000) qui grimpent jusqu'à 8 cœurs en 7 nm avec une puce graphique plutôt efficace. Tiger Lake sera-t-il suffisant ? Nous le saurons bien assez tôt.
L'autre « danger » qui rôde est ARM, notamment avec sa montée en puissance chez Apple. Il y a fort à parier que l'entreprise à la pomme mettra à jour ses produits en tirant partie de Tiger Lake, mais elle doit aussi mettre sur le marché de premiers Mac avec ses propres SoC ARM. Un terrain sur lequel Intel va devoir aussi agir.
Cette fois, c'est Lakefield qui sera aux commandes : un SoC de 6 watts avec un cœur Sunny Cove et quatre Tremont (dérivés d'Atom). Intel espère que l'aspect hybride de cette puce jouera son rôle, et annonce des gains tant en termes de consommation énergétique que de performances.
Mais l'évolution du matériel et du logiciel auront là encore leur rôle à jouer, notamment pour ce qui est du scheduler de Linux et Windows, qui vont devoir apprendre à gérer ces solutions.
... en attendant Alder Lake
Ce n'est d'ailleurs qu'un début, puisqu'Alder Lake enfoncera le clou l'année prochaine. C'est la première fois qu'Intel en parlait d'ailleurs officiellement, évoquant son annonce pour l'année prochaine.
Il devrait néanmoins être mis sur le marché un peu plus tard que prévu initialement, puisqu'il est gravé en 7 nm. Il intègrera alors des cœurs de nouvelle génération (Golden Cove) dont l'IPC devrait être améliorée, ainsi que les performances liées à l'IA (via les instructions AMX ?) et autres fonctionnalités de sécurité.
Il disposera également de cœurs basse consommation Gracemont. La hausse de l'IPC est là encore au programme, tout comme pour les instructions vectorielles ou la montée en fréquence. De très nombreuses combinaisons sont prévues pour les modèles de bureau. Avec quels cas d'usage en tête ? Cela reste à découvrir.