SmartSSD (U.2) de Samsung : 3,84 To de stockage et un FPGA Xilinx

Un CPU, un GPU et on réinvente l’ordinateur

Petit à petit, les accélérateurs se rapprochent des sources de données. C'est le cas avec les SmartSSD, où Xilinx se place directement dans un périphérique de stockage Samsung.

Samsung avait déjà présenté son SmartSSD – dans la famille des Computational Storage Drive (CSD) – fin 2018. Il était alors question d’une carte PCIe. Le fabricant revient avec une nouvelle version, sous la forme d’un SSD de 2,5" en U.2.

SATA Express, U.2, Mini-SAS HD, SFF-TA-1002 : ces autres connecteurs pour le stockage de données

Il propose pour le moment 3,84 To de stockage via de la V-NAND de Samsung, sans plus de précision. Mais l'on sait d'ores et déjà que d’autres capacités suivront. Les débits sont de 3,5 Go/s en lecture et 3,2 Go/s en écriture (respectivement 800 et 135 kIOPS), avec une endurance de 1 DWPD (Drive Write Per Day) pendant cinq ans.

Une puce KintexUltrascale+ KU15P au plus près des données

Mais surtout ce Smart SSD intègre un FPGA (Field Programmable Gate Arrays) de chez Xilinx pour effectuer des calculs. Il s’agit en l’occurrence d’un KintexUltrascale+ KU15P, avec 4 Go de DDR4. Pour rappel, AMD a officialisé le rachat de cette société, pour 35 milliards de dollars en action, la finalisation n’est pas attendue avant fin 2021.

Le SmartSSD peut ainsi effectuer directement des calculs sur les données dont il dispose, sans avoir besoin de passer par le CPU de la machine. Le fabricant affirme que cela permet « d’importants gains de performances […] tout en libérant le processeur qui peut gérer plus efficacement d'autres tâches ».

Des améliorations de performances « jusqu’à 10 fois ou plus »

Le FPGA prend en charge la plateforme unifiée Vitis afin de faciliter « la création de nouveaux accélérateurs et leur intégration dans les applications ». Xilinx cite en exemple des fonctionnalités telles que dm-crypt et Virtual Data Optimizer.

De manière générale, la société affirme que le « SmartSSD accélère considérablement les applications gourmandes en données, jusqu’à 10 fois ou plus ». Selon des tests internes, il est par exemple question d’un gain de 2,8x sur les requêtes SQL et d’une réduction de 87 % de l’utilisation du CPU pour du transcodage vidéo.

Plus on ajoute de SmartSSD, plus on dispose de FPGA et plus les gains peuvent être importants. De plus amples détails sont disponibles sur cette page et celle-ci.

Précommande ouverte, pour le tarif on repassera

Des démonstrations ont été proposées durant le Flash Memory Summit 2020 qui vient de se terminer. Les précommandes sont ouvertes, avec une disponibilité prévue pour le mois de janvier. Le tarif n’est pas précisé.

Au tour de l’hôpital de Cannes d’être victime d’une cyberattaque

07:46 2

Une analyse (très) détaillée du hardware de la Freebox Ultra par Deus Ex Silicium

07:31 14

Des ondes gravitationnelles de la « fusion d’une étoile à neutrons et d’un objet compact inconnu »

07:19 1

Pegasus : près de 600 Polonais auraient été espionnées par l’ancien gouvernement conservateur

07:07 3

TikTok Lite sous pression de la Commission européenne

07:05 7

Solidaires informatiques alerte contre le « spectre du gamergate »

07:05 47

Commentaires (12)

yohansolo Abonné

Le 19/11/2020 à 08h 31

Plus on avance dans l’informatique moderne, plus je réalise qu’on revient aux prémices de celle-ci. Rappelez vous des co-processeurs arithmétiques des débuts.
On commence à ajouter des excroissances à nos CPU pour les libérer de calculs…

(3615malife) Rien à voir, mais en parlant de ça, j’ai des images de l’Amstrad pc1512 de mon père qui me reviennent :p
que de beaux souvenirs sur Gem Paint et l’outil de dessin en langage Basic ^_^

Magyar Abonné

Le 19/11/2020 à 08h 37

Hum, le problème des FPGA, c’est que ça peut faire une chose très efficacement, mais qu’une seule chose.
Donc si tu développes un accélérateur pour une tache, du coup il faut que tes 3.84To de données soit affectés à cette seule utilité (enfin c’est la compréhension que j’en ai). Donc évidemment ça peut avoir son utilité quand tu es un pro d’un domaine particulier, mais a voir niveau tarif, par rapport à avoir des RAID de NVMe + un plus gros CPU.
Et j’espère leur plateforme Vitis elle simplifie par rapport au VHDL, car ce truc c’est vraiment a pain in the ass…

Le 19/11/2020 à 08h 41

yohansolo a dit:

Plus on avance dans l’informatique moderne, plus je réalise qu’on revient aux prémices de celle-ci. Rappelez vous des co-processeurs arithmétiques des débuts. On commence à ajouter des excroissances à nos CPU pour les libérer de calculs…

(3615malife) Rien à voir, mais en parlant de ça, j’ai des images de l’Amstrad pc1512 de mon père qui me reviennent :p que de beaux souvenirs sur Gem Paint et l’outil de dessin en langage Basic ^_^

C’est toujours le cas, ça s’appelle un MAC, c’est juste que c’est gravé avec le reste du CPU sur le même silicium

ErGo_404

Je ne sais plus où j’avais vu ça, mais il me semblait qu’il existait déjà des machines avec des FPGA intégrés qui pouvaient être reprogrammés à la volée pour accélérer matériellement la tâche en cours.

En tous cas le gain annoncé est impressionnant, reste à voir si c’est assez ouvert pour que tous les systèmes en profitent.

Qruby

Le 19/11/2020 à 09h 50

Magyar a dit:

Hum, le problème des FPGA, c’est que ça peut faire une chose très efficacement, mais qu’une seule chose. Donc si tu développes un accélérateur pour une tache, du coup il faut que tes 3.84To de données soit affectés à cette seule utilité (enfin c’est la compréhension que j’en ai). Donc évidemment ça peut avoir son utilité quand tu es un pro d’un domaine particulier, mais a voir niveau tarif, par rapport à avoir des RAID de NVMe + un plus gros CPU. Et j’espère leur plateforme Vitis elle simplifie par rapport au VHDL, car ce truc c’est vraiment a pain in the ass…

C’est tout l’intérêt de la partie “FP” du FPGA: ça se reprogramme très vite, de l’ordre de la milliseconde. Du coup on peut très bien imaginer avoir un jeu d’applications pour les opérations les plus gourmandes et une automatisation pour basculer d’un mode à un autre.

tazvld Abonné

Le 19/11/2020 à 12h 20

Je me trompe peut-être, mais un FPGA, c’est justement reprogrammable (pas forcément rapidement).

Il me semble en effet qu’un FPGA est un cicruit avec plein de porte logique, et on peu le programmer en bloquant ou ouvrant les lignes entre les portes.

De plus, à l’époque que j’avais entendu parler de ça, on m’avait expliqué qu’en plus de coûter un bras, ce n’était pas très efficace, son principale intérêt, c’était pour faire du prototypage de puce.

patos Abonné

Le 19/11/2020 à 13h 42

tazvld a dit:

De plus, à l’époque que j’avais entendu parler de ça, on m’avait expliqué qu’en plus de coûter un bras, ce n’était pas très efficace, son principale intérêt, c’était pour faire du prototypage de puce.

Le FPGA est l’intermédiaire entre un ASIC et un CPU: ça a une partie de la performance de l’ASIC avec une partie de la programmabilité du CPU.

elldekaa Abonné

Le 19/11/2020 à 14h 17

tazvld a dit:

Je me trompe peut-être, mais un FPGA, c’est justement reprogrammable (pas forcément rapidement).

La programmation du FPGA est rapide. Ce qui est lent c’est la synthèse du programme qui tourne dessus (l’équivalent de la compilation pour un FPGA). Selon la taille du programme et du FPGA, c’est rapidement 1 heure de compilation. Mais une fois que le programme est compilé, c’est très rapide de programmer le FPGA (de l’ordre de la milliseconde). Il y a même des FPGAs qui se peuvent se reprogrammer partiellement pendant l’exécution.

Le principal avantage du FPGA c’est son parallélisme quasi sans limite: selon le problème les FPGAs peuvent être plus efficace que les CPUs/GPUs. Le principal problème c’est la fréquence maximum liée à la technologie utilisé mais aussi à l’application qu’il exécute (chemin critique du circuit programmé).

cyrano2 Abonné

Le 19/11/2020 à 14h 50

elldekaa a dit:

Mais une fois que le programme est compilé, c’est très rapide de programmer le FPGA (de l’ordre de la milliseconde).

Ce n’est pas toujours le cas. Si tu utilises une mémoire flash série et que le fpga est gros, cela peut être plus long.

Le 19/11/2020 à 16h 43

#10

Qruby a dit:

C’est tout l’intérêt de la partie “FP” du FPGA: ça se reprogramme très vite, de l’ordre de la milliseconde. Du coup on peut très bien imaginer avoir un jeu d’applications pour les opérations les plus gourmandes et une automatisation pour basculer d’un mode à un autre.

tazvld a dit:

Je me trompe peut-être, mais un FPGA, c’est justement reprogrammable (pas forcément rapidement).

Il me semble en effet qu’un FPGA est un cicruit avec plein de porte logique, et on peu le programmer en bloquant ou ouvrant les lignes entre les portes.

De plus, à l’époque que j’avais entendu parler de ça, on m’avait expliqué qu’en plus de coûter un bras, ce n’était pas très efficace, son principale intérêt, c’était pour faire du prototypage de puce.

Oui effectivement, je me suis mal exprimé. Je voulais dire “qu’une seule chose à la fois au même moment”

gremi Abonné

Le 20/11/2020 à 08h 36

#11

Prochaine étape, réintégrer tous ces circuits dédiés au sein d’une même puce …
Et recommencer

xlp Abonné

Le 21/11/2020 à 20h 33

#12

Ça s’appelle une Mac. Pardon, je veux dire que certaines machines Apple ont un FPGA intégré (Mac pro de mémoire).
Sinon y’a pas mal de FPGA en PCIe, mais c’est pas gagné que ça soit utilisé pour les programmer.

SmartSSD (U.2) de Samsung : 3,84 To de stockage et un FPGA Xilinx

Un CPU, un GPU et on réinvente l’ordinateur

Une puce KintexUltrascale+ KU15P au plus près des données

Des améliorations de performances « jusqu’à 10 fois ou plus »

Précommande ouverte, pour le tarif on repassera

Tiens, en parlant de ça :

EUCS : la certification cloud européenne sous le feu des critiques en France

Chiens de faïence

L’Institut des normes de télécommunication de l’UE (ETSI) défie la Commission européenne

Irréductible gaulois, #oupas

Le « payer ou accepter » de Meta incompatible avec le RGPD pour le CEPD

Schrems vs Meta, une histoire sans fin

Sommaire de l'article

Introduction

Une puce KintexUltrascale+ KU15P au plus près des données

Des améliorations de performances « jusqu’à 10 fois ou plus »

Précommande ouverte, pour le tarif on repassera

EUCS : la certification cloud européenne sous le feu des critiques en France

L’Institut des normes de télécommunication de l’UE (ETSI) défie la Commission européenne

Le « payer ou accepter » de Meta incompatible avec le RGPD pour le CEPD

Le CERN libère les données de la découverte du boson de Higgs

Le ministère de l’Intérieur mise sur l’américain TRM Labs pour traquer les flux illégaux de cryptos

#LeBrief : spectre du gamergate, TikTok Lite sous pression, Freebox Ultra vs Deus Ex Silicium, Pegasus en Pologne

Le Slip français se fait trouer : 1,5 million d’emails et des données de 696 144 clients dérobés ?

Après l’affaire XZ Utils, la sécurité des projets open source en question

Samsung dépasse les 10 Gb/s avec sa mémoire LPDDR5X

Élections européennes : Meta échoue à modérer des publicités de propagande pro-russe

#LeBrief : fuite chez le Slip Français, YouTube et les antipubs, Firefox 125, délit pour les deepfakes, trou noir « dormant »

VMware by Broadcom : une situation tendue, l’Europe s’en mêle

Comment la désinformation d’extrême-droite sert les intérêts russes en France

Mars Sample : retour pas si sûr…

#LeBrief : « traumatisme » du deepfake pornographique, Tesla licencie, Samsung repasse devant Apple, Musk vs finances X

Aux USA, la surveillance des communications d’étrangers sans mandat (FISA) fait débat

Apple autorise puis supprime un émulateur Game Boy sur iOS

Android 15 bêta : Wallet par défaut, sécurité des réseaux mobiles et Wi-Fi, bugs sur le NFC

Rapidité vs précision : deux experts nous expliquent les enjeux des GPU modernes sur les IA

#LeBrief : Beeper rachetée, Cyber Command USA, incident technique BFMTV, « destin énergétique » de l’Europe

#Flock : de Game of Shithrones au jeu des sept différences

[Édito] Respectez les sciences, bordel !

Une faille critique dans le langage Rust, Windows trinque

La CADA considère que le code source et les algorithmes de MIA devraient être rendus publics

Ubuntu 24.04 LTS se profile comme une version majeure, le tour des nouveautés

Loi SREN adoptée : comment la France va sécuriser et réguler l’espace numérique

« La vidéoprotection augmentée ne sera pas optimum au moment des JO »

#LeBrief : floutage DM Instagram, Apple vs espionnage, musique par IA avec Udio, Joe Biden vs Julian Assange

Au tour de l’hôpital de Cannes d’être victime d’une cyberattaque

Une analyse (très) détaillée du hardware de la Freebox Ultra par Deus Ex Silicium

Des ondes gravitationnelles de la « fusion d’une étoile à neutrons et d’un objet compact inconnu »

Pegasus : près de 600 Polonais auraient été espionnées par l’ancien gouvernement conservateur

TikTok Lite sous pression de la Commission européenne

Solidaires informatiques alerte contre le « spectre du gamergate »

Commentaires (12)