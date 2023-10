Backblaze a mis en ligne son bilan sur les pannes de plus de 3 000 SSD sur le premier semestre de l’année. Dell tire son épingle du jeu, Seagate fait parler de lui avec un taux dépassant les 800 %. C’est l’occasion de rappeler, comme le fait très bien la société, l’importance de la taille de l’échantillon et de l’intervalle de confiance sur les statistiques avant de tirer des conclusions hâtives.

Cela fait des années que l’hébergeur Backblaze propose des statistiques sur les milliers de disques durs de ses datacenters. Depuis quelque temps, il en propose également sur les SSD. Des indicateurs intéressants, car ils se basent généralement sur des centaines d’unités en fonctionnement 24/7.

Les SSD sont utilisés comme périphérique de boot pour les serveurs, mais pas uniquement : « Ils stockent aussi les journaux et les fichiers temporaires produits par le serveur de stockage. Chaque jour, un lecteur de démarrage lit, écrit et supprime des fichiers en fonction de l'activité du serveur de stockage lui-même ». Fin 2022, 2 906 SSD étaient utilisés, contre 3 036 fin mars 2023 et 3 144 à la fin du second trimestre de l’année.

C’est quoi un AFR ?

Commençons par rappeler le calcul maison de Backblaze. Il prend en compte la durée de fonctionnement des SSD sur chaque période et parle d’un « taux de panne annualisé » ou AFR (Annualized Failure Rate). Cette manière de faire se veut plus « juste » qu'un simple pourcentage sur le nombre de pannes. L'AFR (en pourcentage) se calcule via la formule suivante : 100 * (nombre de pannes / (jours cumulés de fonctionnement / 366)).

Un exemple : si 100 SSD ont fonctionné pendant 100 jours, cela donne 10 000 Drive Days (100 SSD x 100 jours). De même, 100 SSD en service durant 50 jours et 100 autres sur 200 jours (tous de la même série) donneront un Drive Days de 25 000 (5 000 pour les 100 durant 50 jours + 20 000 pour les 100 durant 200 jours). Dans tous les cas, plus le pourcentage est faible, plus la fiabilité est importante.

Cette méthode a aussi des limites, comme nous allons le voir avec un SSD Seagate qui atteint… 830 % d’AFR au premier trimestre, puis 0 % au second.

Seagate explose les compteurs à 830 %, mais est-ce significatif ?