Backblaze : les taux de panne annuels sur plus de 200 000 disques durs en service

Backblaze : les taux de panne annuels sur plus de 200 000 disques durs en service

Ça en fait des To de perdus

Avatar de l'auteur
Sébastien Gavois

Publié dans

Sciences et espace

08/02/2022 7 minutes
13

Backblaze : les taux de panne annuels sur plus de 200 000 disques durs en service

Au moment de choisir son disque dur, le prix et les performances sont certes des éléments à prendre en considération, mais pas les seuls. La fiabilité aussi est importante, mais elle n’est pas facile à obtenir. Avec près de 207 000 HDD en fonctionnement l’année dernière, Backblaze permet d’y voir un peu plus clair sur certaines références.

Depuis maintenant plusieurs années, l’hébergeur Backblaze publie des rapports trimestriels sur l’état des dizaines de milliers de disques durs utilisés dans ces datacenters. Il en tire des statistiques sur les taux de pannes qui permettent de se faire une idée non pas sur quelques unités installées de-ci de-là, mais sur dizaines ou des centaines de disques d’une même référence.

Les (gros) chiffres de Backblaze et son taux de panne annualisé

Au 31 décembre, la société disposait très exactement de 206 928 HDD : 3 760 comme boot pour le système d’exploitation et 203 168 pour stocker des données. 409 disques durs ont été retirés des statistiques, soit parce qu’il s’agissait de modèles uniquement destinés à des tests internes, soit parce que Backblaze n’utilisait pas au moins 60 exemplaires de cette référence (le seuil minimum que s’impose l’entreprise). Cela laisse tout de même 202 759 HDD, dont 1 820 sont tombés en panne l’année dernière, pour tirer des statistiques et établir le rapport.

La méthode de calcul de l’hébergeur est un peu particulière au premier abord, mais elle se veut plus « juste ». Elle mérite donc que l’on s’y attarde quelques instants : elle prend en compte la durée totale de fonctionnement des HDD sur une période, l’année 2021 dans le cas présent.

Pour une même série, on parle ainsi de jours cumulés de fonctionnement. L’indice qui en ressort est un « taux de panne annualisé », ou AFR (Annualized Failure Rate). Il est calculé avec la formule suivante :

100 * (nombre de pannes / (jours cumulés de fonctionnement / 366))

Seagate quatre fois dans le « top 5 » des plus mauvais

Sur l’année 2021, Seagate arrive « en tête » des mauvais élèves avec 4,79 % de taux de panne sur son ST14000NM0138 de 14 To. Sur les 1 611 disques durs qui étaient en service, 77 sont tombés en panne. Ce taux est d’autant plus mauvais que l’âge moyen des disques durs est d’à peine plus de 12 mois. 

Au troisième trimestre, cette série obtenait un score encore plus mauvais avec 6,29 %. L’hébergeur rappelait néanmoins que ces disques durs sont certes fabriqués par Seagate, mais directement vendus dans des serveurs par Dell. Une enquête avait alors été ouverte afin de tenter de faire la lumière sur les causes de ces pannes largement plus importantes que la moyenne.

Backblaze 2021

Les premiers résultats sont tombés : « Les disques défaillants ont été examinés par des spécialistes de l'analyse des pannes et, à la fin du troisième trimestre, il a été décidé, dans un premier temps, de mettre à niveau le firmware pour la cohorte de disques encore en service ». Cela a permis de faire baisser le taux à 4,66 % au quatrième trimestre 2021, et ainsi de se replacer dans la lignée des scores au début de l’année. C’est mieux que trois mois auparavant, mais pas toujours bon pour autant. 

Quoi qu’il en soit, les 19 disques durs tombés en panne au quatrième trimestre ont eux aussi « été renvoyés pour une analyse plus approfondie ». En fonction des retours, Backblaze donnera de plus amples informations lors de la publication des prochains bilans trimestriels. 

On retrouve ensuite trois autres références à plus de 2 % : les Seagate ST12000NM0007 de 12 To (2,01 %), Toshiba MD04ABA400V de 4 To (2,04 %) et Seagate ST10000NM0086 de 10 To (2,26 %). On notera que les disques durs Toshiba n’étaient que 97 (2 sont tombés en panne), mais qu’ils sont parmi les plus anciens avec plus de six ans en moyenne.

Trois des quatre plus mauvais scores reviennent à des disques durs Seagate. Les mauvais résultats du fabricant ne s’arrêtent pas là puisqu’il récupère aussi la quatrième place avec son ST4000DM000 de 4 To à 1,80 %. Ce n’est pas la première fois que le constructeur s’illustre ainsi.

Les gros HDD s’en sortent mieux que ceux de 10 To et moins

Dans l’ensemble, les HDD de 16 To s’en sortent tous assez bien. Qu’ils proviennent de chez Seagate, Toshiba ou Western Digital, ils affichent tous un taux de panne annualisé compris entre 0,14 et 1,11 %. Là encore, Seagate est le plus mauvais élève, suivi par Toshiba et Western Digital. 

La palme de la série la plus résistante revient au ST6000DX000 de 6 To de… Seagate qui est décidément de tous les extrêmes. 886 disques durs étaient utilisés l’année dernière, avec une seule panne sur les douze mois ; le fabricant n’est pas passé loin du sans-faute sur cette référence. Un résultat d’autant appréciable que ce sont les disques durs avec la moyenne d‘âge la plus élevée : 80,85 mois.

Backblaze 2021

Au total, le taux de panne annualisé pour 2021 (tous modèles confondus) est de 1,01 %, en légère hausse par rapport aux 0,93 % de 2020. Les disques durs de 10 To et moins ont dans l’ensemble un taux de panne supérieur à celui de 12 To et plus : 1,27 % contre 0,87 % en moyenne. Ils sont aussi plus vieux, ce qui peut expliquer cette situation. 

Backblaze rappelle que les pannes des disques durs suivent généralement une courbe en forme de baignoire. Au début il y a des « morts subites » qui diminuent avec le temps, puis c’est au tour des maladies de la vieillesse de prendre le relai. Il y a des exceptions, comme les ST6000DX000 qui résistent bien à l’attaque du temps.

Si la courbe des pannes représentait plus ou moins une baignoire en 2013, c’est bien moins le cas en 2021 car les pannes durant les premières années sont beaucoup moins nombreuses qu’auparavant. Backblaze en profite pour préciser que les pannes des disques durs de plus de six ans sont peu nombreuses, moins de dix par trimestre. 

Backblaze 2021Backblaze 2021La théorie à gauche, crédits Wikipédia, la pratique selon Backblaze à droite

Western Digital et HGST au coude à coude, loin devant Seagate

Afin de proposer une vision à plus long terme, Backblaze analyse les taux de pannes par fabricant sur les trois dernières années. Ceux qui suivent régulièrement les rapports de la société ne seront pas surpris de voir que Seagate arrive en dernière position avec 1,48 % fin 2021.

Toshiba est avant-dernier avec 0,92 %, il dispose donc d’un écart significatif avec Seagate. Les deux fabricants sont des habitués des deux dernières places, dans cet ordre. 

Les deux premiers sont quasiment ex aequo : 0,32 % pour Western Digital et 0,37 % pour HGST. Notons par contre que WD était absent des statistiques en 2019 et 2020, faute d’une quantité suffisante de HDD dans les datacenters de Backblaze.

L’entreprise propose enfin des taux de pannes annuels sur toute la durée de vie des disques, en remontant jusqu’en 2013. La tendance générale est à la baisse : 1,69 % fin 2019, 1,54 % fin 2020 et enfin 1,4 % fin 2021. 

Backblaze 2021

Écrit par Sébastien Gavois

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Les (gros) chiffres de Backblaze et son taux de panne annualisé

Seagate quatre fois dans le « top 5 » des plus mauvais

Les gros HDD s’en sortent mieux que ceux de 10 To et moins

Western Digital et HGST au coude à coude, loin devant Seagate

Fermer

Commentaires (13)


merci pour le debrief :)
costaud le ST6000DX000
le ST14000NM0138 donne pas envie par contre XD


ça donne une idée de quoi prendre, pas forcément les modèles, mais au moins les marques sur le long terme, d’autant plus dans des systèmes à plusieurs disques comme les NAS.



Toshiba était bien meilleur il me semble, dans les 0.64% de mémoire y’a 2 ans.


Chez moi, la mauvaise génération ce sont les disque de 4To. Les 8To se portent bien, les vieux 1To et 2To ne veulent pas mourir. Mais mes 3 disques 4To (Seagate & WD) sont morts.


J’adore ces rapports, merci ! :)


Seagate. Une époque où il suffisait de regarder un disque de 1tb barracuda en 7200.10 11 ou 12 pour qu’il tombe en panne. J’ai ouvert un cimetière, avec des cartons remplis… HP les mettait en première monte dans des prodesk je passai mon temps à faire du sav… l’enfer


Je traînes une dizaine d’années et d’épaves Seagate. Et aussi des Ironwolf récents de 10 To qui ont présenté des problèmes très vite.
Que n’ai-je basculé chez Western Digital plus tôt ?… Des 10 To Gold à zéro soucis, ça me change …



Après, on a tous nos bêtes noires et nos top moumoute : j’ai un pote qui n’a jamais eu de problème avec les 60 et 75 GXP d’IBM (ouais, c’est vieux).


Comme quoi, j’ai plusieurs nas syno remplis d’ironwolf (pro) qui tournent en backup toute la journée avec active backup for business pour les VM et les PC et pas de problèmes (depuis deux ans que j’ai mis ça en place. Après, je viens de faire des upgrades sur du 10TB y a pas longtemps, me file pas la grouille anqualagon :non:


Intéressantes, les stats Backblaze, mais diffiilement transposable à nous les particuliers…
Perso je me base toujours sur le Taille/Prix à la capacité que je souhaite à un instant t : si ça tombe sur un Tosh’, je prendrai le Tosh’… :fumer:
Ah si je regarde aussi la RMA, comment ça se passe…
A ce jeu chez Seagate j’ai jamais eu d’emmerd*s… WD non plus il me semble. Tosh’, jamais essayé.


Avis identique ici, les marques ont toutes des hauts et des bas. Et selon les gammes, on peut avoir de grands écarts de fiabilité.
J’ai encore 2 Seagate de 320 Go qui tournent H24 dans mon Nas, ils refusent de mourir. En revanche, 1 de mes 2 WD de 2To donne des signes de faiblesse : autour de 20 secteurs défectueux, qui évoluent depuis quelques mois.



AncalagonTotof a dit:


Après, on a tous nos bêtes noires et nos top moumoute




C’est ce que je disais lors du dernier rapport Blackblaze il me semble :
-J’ai jamais cramé un WD, alors que Seagate et du Tosh ça oui!!
-Au contraire j’ai un collègue qui a été emmerdé plus d’une fois avec du WD et jamais du Seagate…



Du coup je continu sur WD, lui sur Seagate, et là karma power : aucun de nous n’est emmerdé :fou: :D


Est-ce que ces stats tiennent compte de l’utilisation réelle et le type d’utilisation des disques ?
Par exemple des serveurs de fichiers, des serveurs de bases de données, des serveurs de messagerie n’ont pas le même type d’utilisation du stockage.
Si les différents marques/modèles ne sont pas répartis d’une manière homogène sur les différents types de serveurs ça peut fausser les stats.
Cela dit j’ai 5 serveurs DELL avec des disques Seagate certifiés DELL de tailles < 1 To et j’ai eu des pannes relativement nombreuses sur ces disques. Vive le RAID.


“Notons par contre que WD était absent des statistiques en 2019 et 2020, faute d’une quantité suffisante de HDD dans les datacenters de Backblaze.”



Alors que leurs propres statistiques donnent Western Digital plus fiable en tendance sur trois ans, l’hébergeur évite d’en acheter. Paradoxal. Le RAID protège la couche d’abstraction des défaillances mécaniques, la garantie exclue le surcout quand un HDD doit être échangé, le TCO des disques Seagate doit sans doute rester bien inférieur, et tant pis pour leur qualité intrinsèque d’usinage vraisemblablement en retrait. Sinon pourquoi écarter WD ?


J’ai des morts dans les 2 camps, de mon expérience la seul différence c’est que la mort des Seagate était souvent assez rapide et bien souvent ne m’a pas laissé pas le temps de faire “une dernière sauvegarde”.