Au moment de choisir son disque dur, le prix et les performances sont certes des éléments à prendre en considération, mais pas les seuls. La fiabilité aussi est importante, mais elle n’est pas facile à obtenir. Avec près de 207 000 HDD en fonctionnement l’année dernière, Backblaze permet d’y voir un peu plus clair sur certaines références.
Depuis maintenant plusieurs années, l’hébergeur Backblaze publie des rapports trimestriels sur l’état des dizaines de milliers de disques durs utilisés dans ces datacenters. Il en tire des statistiques sur les taux de pannes qui permettent de se faire une idée non pas sur quelques unités installées de-ci de-là, mais sur dizaines ou des centaines de disques d’une même référence.
Les (gros) chiffres de Backblaze et son taux de panne annualisé
Au 31 décembre, la société disposait très exactement de 206 928 HDD : 3 760 comme boot pour le système d’exploitation et 203 168 pour stocker des données. 409 disques durs ont été retirés des statistiques, soit parce qu’il s’agissait de modèles uniquement destinés à des tests internes, soit parce que Backblaze n’utilisait pas au moins 60 exemplaires de cette référence (le seuil minimum que s’impose l’entreprise). Cela laisse tout de même 202 759 HDD, dont 1 820 sont tombés en panne l’année dernière, pour tirer des statistiques et établir le rapport.
La méthode de calcul de l’hébergeur est un peu particulière au premier abord, mais elle se veut plus « juste ». Elle mérite donc que l’on s’y attarde quelques instants : elle prend en compte la durée totale de fonctionnement des HDD sur une période, l’année 2021 dans le cas présent.
Pour une même série, on parle ainsi de jours cumulés de fonctionnement. L’indice qui en ressort est un « taux de panne annualisé », ou AFR (Annualized Failure Rate). Il est calculé avec la formule suivante :
100 * (nombre de pannes / (jours cumulés de fonctionnement / 366))
Seagate quatre fois dans le « top 5 » des plus mauvais
Sur l’année 2021, Seagate arrive « en tête » des mauvais élèves avec 4,79 % de taux de panne sur son ST14000NM0138 de 14 To. Sur les 1 611 disques durs qui étaient en service, 77 sont tombés en panne. Ce taux est d’autant plus mauvais que l’âge moyen des disques durs est d’à peine plus de 12 mois.
Au troisième trimestre, cette série obtenait un score encore plus mauvais avec 6,29 %. L’hébergeur rappelait néanmoins que ces disques durs sont certes fabriqués par Seagate, mais directement vendus dans des serveurs par Dell. Une enquête avait alors été ouverte afin de tenter de faire la lumière sur les causes de ces pannes largement plus importantes que la moyenne.

Les premiers résultats sont tombés : « Les disques défaillants ont été examinés par des spécialistes de l'analyse des pannes et, à la fin du troisième trimestre, il a été décidé, dans un premier temps, de mettre à niveau le firmware pour la cohorte de disques encore en service ». Cela a permis de faire baisser le taux à 4,66 % au quatrième trimestre 2021, et ainsi de se replacer dans la lignée des scores au début de l’année. C’est mieux que trois mois auparavant, mais pas toujours bon pour autant.
Quoi qu’il en soit, les 19 disques durs tombés en panne au quatrième trimestre ont eux aussi « été renvoyés pour une analyse plus approfondie ». En fonction des retours, Backblaze donnera de plus amples informations lors de la publication des prochains bilans trimestriels.
On retrouve ensuite trois autres références à plus de 2 % : les Seagate ST12000NM0007 de 12 To (2,01 %), Toshiba MD04ABA400V de 4 To (2,04 %) et Seagate ST10000NM0086 de 10 To (2,26 %). On notera que les disques durs Toshiba n’étaient que 97 (2 sont tombés en panne), mais qu’ils sont parmi les plus anciens avec plus de six ans en moyenne.
Trois des quatre plus mauvais scores reviennent à des disques durs Seagate. Les mauvais résultats du fabricant ne s’arrêtent pas là puisqu’il récupère aussi la quatrième place avec son ST4000DM000 de 4 To à 1,80 %. Ce n’est pas la première fois que le constructeur s’illustre ainsi.
Les gros HDD s’en sortent mieux que ceux de 10 To et moins
Dans l’ensemble, les HDD de 16 To s’en sortent tous assez bien. Qu’ils proviennent de chez Seagate, Toshiba ou Western Digital, ils affichent tous un taux de panne annualisé compris entre 0,14 et 1,11 %. Là encore, Seagate est le plus mauvais élève, suivi par Toshiba et Western Digital.
La palme de la série la plus résistante revient au ST6000DX000 de 6 To de… Seagate qui est décidément de tous les extrêmes. 886 disques durs étaient utilisés l’année dernière, avec une seule panne sur les douze mois ; le fabricant n’est pas passé loin du sans-faute sur cette référence. Un résultat d’autant appréciable que ce sont les disques durs avec la moyenne d‘âge la plus élevée : 80,85 mois.

Au total, le taux de panne annualisé pour 2021 (tous modèles confondus) est de 1,01 %, en légère hausse par rapport aux 0,93 % de 2020. Les disques durs de 10 To et moins ont dans l’ensemble un taux de panne supérieur à celui de 12 To et plus : 1,27 % contre 0,87 % en moyenne. Ils sont aussi plus vieux, ce qui peut expliquer cette situation.
Backblaze rappelle que les pannes des disques durs suivent généralement une courbe en forme de baignoire. Au début il y a des « morts subites » qui diminuent avec le temps, puis c’est au tour des maladies de la vieillesse de prendre le relai. Il y a des exceptions, comme les ST6000DX000 qui résistent bien à l’attaque du temps.
Si la courbe des pannes représentait plus ou moins une baignoire en 2013, c’est bien moins le cas en 2021 car les pannes durant les premières années sont beaucoup moins nombreuses qu’auparavant. Backblaze en profite pour préciser que les pannes des disques durs de plus de six ans sont peu nombreuses, moins de dix par trimestre.
La théorie à gauche, crédits Wikipédia, la pratique selon Backblaze à droite
Western Digital et HGST au coude à coude, loin devant Seagate
Afin de proposer une vision à plus long terme, Backblaze analyse les taux de pannes par fabricant sur les trois dernières années. Ceux qui suivent régulièrement les rapports de la société ne seront pas surpris de voir que Seagate arrive en dernière position avec 1,48 % fin 2021.
Toshiba est avant-dernier avec 0,92 %, il dispose donc d’un écart significatif avec Seagate. Les deux fabricants sont des habitués des deux dernières places, dans cet ordre.
Les deux premiers sont quasiment ex aequo : 0,32 % pour Western Digital et 0,37 % pour HGST. Notons par contre que WD était absent des statistiques en 2019 et 2020, faute d’une quantité suffisante de HDD dans les datacenters de Backblaze.
L’entreprise propose enfin des taux de pannes annuels sur toute la durée de vie des disques, en remontant jusqu’en 2013. La tendance générale est à la baisse : 1,69 % fin 2019, 1,54 % fin 2020 et enfin 1,4 % fin 2021.
