Tera-Scale : Intel présente une puce dotée de 48 coeurs

Reliés en réseau via le protocole TCP/IP 62
Intel Tera-ScaleDepuis plusieurs années, Intel effectue des recherches sur le futur des processeurs en imaginant des puces dotées d'une multitude de cœurs (many-cores), c'est le programme Tera-Scale.

L'ambition n'est pas mince puisqu'au-delà de la simple multiplication du nombre de cœurs se pose la question de la communication entre ces derniers, la gestion de l'énergie et surtout la création de solutions logicielles capables de les exploiter.

Le futur du CPU selon Intel : des centaines de cœurs... en réseau

Il y a un peu plus de deux ans, Intel présentait ainsi une première puce, Polaris, dotée de 80 cœurs. Ceux-ci n'étaient alors composés que de deux unités de calcul de flottants et étaient reliés par un réseau en maillage 2D que le fondeur semblait alors avoir considéré comme plus efficace qu'un réseau de type « Ring » (voir cette animation).

Intel Tera-Scale Intel Tera-Scale

On obtenait ainsi au final un die composé de 100 millions de transistors, gravé en 65 nm, qui mesurait 275 mm².

Polaris : la première étape qui validait l'organisation de la puce

Le tout pouvait être cadencé à 3.16 GHz sous 0.95V afin d'obtenir une puissance de calcul de 1.01 TFlops ou à 5.7 GHz sous 1.35V afin de passer à 1.81 TFlops. Problème, la consommation passait alors de 62 watts à 265 watts.

Voici d'ailleurs la vidéo de présentation à laquelle nous avions droit à l'époque :

Hier, Intel a présenté l'aboutissement d'un autre projet du programme Tera-Scale, le SCC, pour « Single-chip Cloud Computer ».

Intel Tera-Scale Intel Tera-Scale Intel Tera-Scale

SCC : 48 cœurs x86 issus du P54C, en réseau au sein d'une seule et même puce

Plus que l'utilisation du terme «  Cloud », l'argument marketing à la mode dans le milieu professionnel en ce moment, il est ici question d'une nouvelle puce qui reprend l'architecture en réseau maillé 2D de Polaris, tout en étant capable de faire tourner un système d'exploitation standard.

Ces recherches, menées entre le laboratoire de Brunswick en Allemagne et de Bangalore en Inde furent aussi l'occasion pour Intel d'utiliser un procédé de conception, de validation et d'émulation sur des FPGA, afin de vérifier le bon fonctionnement de l'ensemble avant même sa mise en production.

Intel Tera-Scale Intel Tera-Scale

Le résultat est une puce dont le die mesure pas moins de 567 mm² (296 mm² pour un Lynnfield) malgré l'utilisation d'un procédé de gravure en 45 nm et un passage à « seulement » 48 cœurs. 

Intel Tera-ScaleCar comme dit précédemment, le but était ici de faire tourner un système d'exploitation standard (la présentation était effectuée sous Linux) grâce à des cœurs x86 complets qui sont en fait tirés du P54C. 

Pour rappel, ce sont exactement les mêmes que ceux qui seront utilisés au sein de la puce de Larrabee (la carte graphique d'Intel, elle aussi issue du programme Tera-Scale) et sont tout bonnement... des Pentium.

Une communication directe entre l'ensemble des cœurs, sans cohérence des caches

Ils sont regroupés par deux, au sein de ce qu'Intel appelle des Tiles, et disposent chacun d'un cache L1 et L2 qui leur est propre.

Intel Tera-ScaleDe plus, afin de se simplifier la vie, le fondeur a décidé que la cohérence des caches ne serait plus gérée de manière matérielle.

Chaque Tile dispose en effet d'un routeur et d'un Message Buffer de 384 ko qui lui permettent une communication directe entre les cœurs et entre les Tiles. Le tout forme ainsi un réseau en maillage qui exploite le protocole TCP/IP. Intel annonce un débit de pas moins de 256 Go/s et une latence minimale.

Au niveau de la mémoire, la puce dispose de quatre contrôleurs de DDR-3 capable de gérer 16 Go chacun, qui sont rattachés à des groupes de six Tiles.

Une gestion de l'énergie qui se veut la plus fine possible

Intel Tera-ScalePour ce qui est de la partie économie d'énergie, Intel a indiqué avoir fait de nombreux progrès puisque la puce présentée consomme entre 25 watts et 125 watts en fonction de sa charge, on regrettera néanmoins de n'avoir aucune indication de performance afin de pouvoir comparer ceci aux chiffres de Polaris.

La gestion des tensions et des fréquences se veut assez dynamique puisque chaque coeur dispose d'une fréquence qui lui est propre alors que la tension, elle, est la même pour chaque Tile. 

Les contrôleurs-mémoires et la partie E/S disposent aussi de leur propre tension et de leur propre fréquence.

Intel Tera-Scale Intel Tera-Scale Intel Tera-Scale

Intel franchi donc un cap supplémentaire concernant l'avènement de puces dotées de plusieurs dizaines de cœurs, ces derniers étant désormais complets, au sein d'une puce fonctionnelle.

Celle-ci sera d'ailleurs produite à une petite centaine d'exemplaire et distribuée à des universitaires et intégrateurs triés sur le volet.


Tera-Scale : après la recherche, le concret ?

Mais il faut maintenant penser aux prochaines étapes... et à la concrétisation des recherches du programme Tera-Scale. 

LarrabeeCela devrait tout d'abord passer par l'arrivée de Larrabee, qui sera le premier produit issu du programme Tera-Scale à être mis sur le marché puis de Ct, une extension de C++ permettant aux développeurs de profiter bien plus facilement de processeurs dotés d'une multitude de cœurs.

Des moments importants pour Intel qui semble prendre du retard sur les marchés concernés face aux fabricants de GPU, et plus spécialement NVIDIA, qui propose depuis 2006 des puces dotées eux aussi de nombreux cœurs (qui ne sont, certes, pas de type x86) ainsi qu'un écosystème logiciel complet autour de l'architecture CUDA.

Des travaux qui misent sur le futur, mais qui ne masquent pas le retard présent

FermiUn retard qui ne cesse de grandir avec l'arrivée des produits de nouvelle génération tels que les Radeon HD 5k chez AMD ou le futur Fermi de NVIDIA, aidés par des langages tels qu'OpenCL.

Des solutions qui pourraient bien, si Intel n'y prend pas garde, remporter les faveurs des professionnels et leur donner l'habitude de se tourner vers les GPU pour les calculs fortement parallélisable, à défaut de CPU réellement adaptés, ce que ne pourront pas enrayer des démonstrations, si INtéressantes soient-elles.

Espérons donc pour le fondeur que ces avancées lui permettront de proposer, dans les années à venir, des produits véritablement compétitifs pour ce genre d'usages.
Publiée le 03/12/2009 à 15:13
Publicité