Backblaze : 2 906 SSD en service fin 2022, bilan des 25 pannes

C'est qui le BOSS ?
Tech 8 min
Backblaze : 2 906 SSD en service fin 2022, bilan des 25 pannes

Backblaze propose depuis des années un bilan des pannes rencontrées sur les dizaines de milliers de disques durs que la société utilise dans ses datacenters. Depuis fin 2018, elle utilise également des SSD comme périphériques de boot. Le bilan 2022 de ces derniers vient d'être mis en ligne. Voici ce qu'il faut en retenir. 

Comme toujours, la société utilise une méthode de calcul maison qui se veut plus « juste » qu'un simple pourcentage du nombre de pannes. Elle prend en effet en compte la durée de fonctionnement sur chaque période et parle d’un « taux de panne annualisé », ou AFR (Annualized Failure Rate), pour chaque référence de SSD. 

AFR, Drive Days... : session rattrapage 

Cela permet ainsi de faire la différence entre des SSD arrivés récemment et d'autres qui résistent pendant des années avant de rendre l'âme. L'AFR (un pourcentage) se calcule avec la formule suivante :

100 * (nombre de pannes / (jours cumulés de fonctionnement / 366))

Les jours cumulés de fonctionnement (ou Drive Days) correspondent à l'addition du nombre de jours de fonctionnement de chaque SSD d'une même référence. Ainsi, si 100 SSD ont fonctionné pendant 100 jours, cela donne 10 000 Drive Days (100 x 100). De même, 100 SSD en service durant 50 jours et 100 autres sur 200 jours (tous de la même série) donneront un Drive Days de 25 000 (5 000 + 20 000).

Sept références sans la moindre panne

Fin 2022, 2 906 SSD étaient utilisés dans les datacenters. L'entreprise reconnait que cela « représentent un nombre relativement restreint de périphériques sur lesquels effectuer une analyse et, bien que ce nombre conduise à des intervalles de confiance plus grands que souhaité, c'est un bon début ». Au même moment, Backblaze revendiquait plus de 230 000 HDD en service (stockage et boot confondus). 

Sur les 2 906 SSD en service, l'entreprise annonce 934 000 Drive Days pour 25 pannes, soit un AFR de 0,98 %. C'est un peu mieux qu'en 2021 où le taux AFR était à 1,05 % (627 000 Drive Days pour 18 pannes) et qu'en 2020 avec 0,39 % (281 000 Drive Days pour 3 pannes).  

Backblaze SSD 2022

Sept références de SSD ont un taux AFR à 0 %, signifiant qu'aucune panne n'a eu lieu l'année dernière. Par contre, six d'entre elles affichent « un nombre limité de Drive Days (moins de 10 000), ce qui signifie qu'il n'y a pas suffisamment de données pour faire une projection fiable sur les taux de pannes pour ces modèles de disque ». Comme sur les disques durs et de manière générale en statistiques, plus l'échantillon est grand, plus la marge d'erreur est faible.

C'est par exemple le cas des WD Blue SA510 de 250 Go qui ne sont que trois et installés pour un total de 102 Drive Days au cours des dernières années. Alors certes, l'AFR est à 0 %, mais l'intervalle de confiance oscille entre 0 et 1 320 %, ce qui est tout sauf significatif. 

Les SSD Dell BOSS VD ne flanchent pas depuis des années

Les Dell BOSS (Boot Optimized Storage Solution) VD de 500 Go sortent du lot avec plus de 123 000 Drive Days (ce qui équivaut à 400 SSD environ utilisés pendant l'année complète) et aucune panne. Aucune panne n'était non plus identifiée en 2021 et en 2020, avec respectivement 63 700 et 31 500 Drive Days. 

Ces données sont d'autant plus intéressantes que l'âge moyen des SSD Dell est d'un peu plus de deux ans. Backblaze précise par contre qu'il s'agit de « SSD M.2 montés sur une carte PCIe (HH-HL ou half height, half length) destiné aux déploiements de serveurs » ; ils ne sont généralement donc pas accessibles au grand public.

Le Seagate Barracuda 250 Go (ZA250CM10003) se tient bien 

Pour le reste, trois SSD dépassent le cap des 100 000 Drive Days, une limite théorique que se fixe Backblaze pour avoir des données significatives. Sur l'année 2022, celui qui s'en sort le mieux est le Seagate Barracuda de 250 Go (ZA250CM10003) avec un taux de panne annualisé de 0,73 %. Sur 1 104 SSD en service (totalisant plus de 400 000 Drive Days), huit pannes ont été relevées.

C'est en légère hausse par rapport à l'année dernière où l'AFR n'était que de 0,66 % avec un Drive Days à 276 000. En 2021, aucune panne n'était relevée, mais le Drive Days n'était alors que de 47 000. C'est dans tous les cas un bon score pour Seagate avec moins de 1 % d'AFR sur trois dernières années. Depuis 2018, l'AFR est de 0,66 % avec un intervalle de confiance entre 0,3 et 1,1 %, soit un delta de moins d'un point.

Le Crucial MX500 250 Go (CT250MX500SSD1) redresse la barre

En suivant, on retrouve le Crucial MX500 de 250 Go (CT250MX500SSD1) avec un taux AFR de 1,04 % (un peu plus de 100 000 Drive Days avec 488 SSD pour trois pannes). Le score de 2021 avait de quoi faire peur avec un AFR à... plus de 43 %, mais avec un Drive Days à seulement 1 689, cela n'avait rien de significatif. Preuve en est le nouvel AFR de 2022.

« Les disques Crucial (CT250MX500SSD1) se sont bien rétablis en 2022 après avoir connu quelques défaillances précoces en 2021. Nous prévoyons que cette tendance va se poursuivre », précise Backblaze. Depuis 2018, l'AFR est à 1,7 % avec un intervalle de confiance entre 0,4 et 3,5 %, un delta important de plus de trois points.

Hausse des pannes sur Seagate Barracuda 250 Go (ZA250CM10002)

Enfin, la troisième référence est de nouveau un Seagate Barracuda de 250 Go (mais portant la référence ZA250CM10002), avec un AFR de 1,98 %. C'est le taux le plus haut de tous les modèles confondus. C'est une belle hausse par rapport à 2021 où le taux de panne annualisé n'était que de 0,36 %. Le Drive Days était du même acabit (204 000 en 2021 et 203 000 en 2022), mais avec deux SSD seulement en panne en 2021 contre onze en 2022, ce qui explique la forte augmentation du pourcentage.

Backblaze n'explique pas les raisons de cette forte augmentation, si ce n'est que le ZA250CM10003 est une nouvelle version du ZA250CM10002, notamment avec une consommation IDLE en baisse à 116 mW au lieu de 185 mW. Alors que le taux de panne du ZA250CM10002 est montée en flèche en 2022, Backblaze se demande si son grand frère suivra la même tendance dans les années à venir ou s'il va tracer sa propre voie. Affaire à suivre.

Sur l'ensemble des données de Backblaze (en remontant à début 2018, mais uniquement pour les SSD encore actifs au 31 décembre 2022), le taux de panne des SSD est de 0,89 %, en dessous de celui des disques durs qui est à 1,39 % (dans les mêmes conditions évidemment).  

Backblaze SSD 2022

Des informations SMART pas très smart

La société profite de son bilan annuel de la fiabilité des SSD pour faire un détour par les informations SMART sur l'état de santé : elle a constaté « qu'il n'y a pas beaucoup de cohérence sur les attributs ou la dénomination que les fabricants de SSD utilisent pour enregistrer les données SMART ». C'est notamment le cas d'informations comme « wear leveling, endurance, lifetime used, life used, LBAs written, LBAs read... » qui manquent de cohérence entre les constructeurs ou qui ne sont parfois même pas enregistrées. 

Il existe une exception : la température est une donnée à peu près stable sur les différents SSD, même si le Dell BOSS VD « ne rapporte pas de valeurs brutes ou normalisées ». Ces SSD sont donc exclus du bilan des températures de l'année 2022.

Backblaze SSD 2022

Des mesures allant de 20 à 60 °C, avec une moyenne à 34,9 °C

Backblaze récupère entre près de 60 000 et 80 000 relevés de température par mois, avec une moyenne mensuelle entre 34,4 et 35,4 °C ; soit à peine 1 °C d'écart entre le minimum et le maximum. La moyenne annuelle est de 34,9 °C, mais avec de grands écarts sur les mesures individuelles.

En effet, Backblaze a enregistré quatre fois une température de 20 °C sur ses SSD, et jusqu'à 61 °C (une seule fois). La médiane est à 35 °C, qui est donc quasiment identique à la moyenne. La courbe de répartition des températures prend la forme d'une cloche, comme celle que Backblaze retrouve sur les températures des HDD. 

À titre de comparaison, la température moyenne des HDD sur la même période est plus basse avec 29,1 °C. « Cette différence semble aller à contre-courant de la croyance populaire selon laquelle les SSD chauffent moins que les disques durs [Dans le cas d'un usage et d'une installation de type datacenter comme le fait Backblaze, ndlr]. Une raison possible étant que dans tous nos serveurs, les disques de boot sont plus éloignés du couloir froid où se trouvent les HDD pour le stockage des données ».

Vous n'avez pas encore de notification

Page d'accueil
Options d'affichage
Abonné
Actualités
Abonné
Des thèmes sont disponibles :
Thème de baseThème de baseThème sombreThème sombreThème yinyang clairThème yinyang clairThème yinyang sombreThème yinyang sombreThème orange mécanique clairThème orange mécanique clairThème orange mécanique sombreThème orange mécanique sombreThème rose clairThème rose clairThème rose sombreThème rose sombre

Vous n'êtes pas encore INpactien ?

Inscrivez-vous !