Backblaze vient de publier son rapport sur les pannes de disques durs qu'il a constaté en 2016 dans ses datacenter. Avec plus de 73 000 HDD en activité, cela permet de dresser un état des lieux intéressant... mais aussi de rappeler l'importance de ne pas mettre tous ses œufs dans le même panier.

Backblaze est une société spécialisée dans le stockage qui propose des offres de sauvegardes en ligne aux particuliers et aux professionnels. Elle utilise donc un grand nombre de disques durs (pas moins de 73 653 en 2016) et elle en profite pour faire quelques statistiques sur les pannes rencontrées.

Des taux de panne annuels sur un échantillon de plus de 72 100 disques durs

Sur le quatrième trimestre de l'année, 72 100 HDD servaient au stockage (les 1 553 autres sont utilisés pour booter des machines). Dans ses tableaux, la société a regroupé les modèles et marques de chaque HDD à condition qu'au moins 45 unités soient utilisées dans ses datacenter.

Si les statistiques sont intéressantes, il convient de préciser que la marge d'erreur est différente suivant les modèles. En effet, celle-ci dépend directement de la taille de l'échantillon et il y a une sacrée différence entre 45 disques durs d'une série et 34 738 d'une autre (les Seagate ST4000DM000).

Avant d'entrer dans le vif du sujet, une précision importante : dans ses tableaux, Backblaze indique le taux de panne annualisé. Il ne s'agit donc pas simplement de diviser le nombre de disques durs qui ont rencontré un incident par le nombre de disques en service, mais de prendre en compte la durée pendant laquelle les HDD étaient en service. Le taux de panne annualisé est donc « calculé en fonction du Drive Days et du Drive Failures, pas sur le nombre de Drive Count », indique la société.

Pour résumer, le taux de panne annualisé (en pourcent) est calculé de la manière suivante : « 100*(Drive Failures x 365)/(Drive Days) ».

Le Seagate ST4000DX000 se démarque... mais pas de la bonne manière

Dans l'ensemble, les taux de pannes annualisés sur le quatrième trimestre de l'année oscillent entre 14,72 % (mais avec un échantillon de seulement 184 unités pour le Seagate ST4000DX000) et 0 %, ce qui signifie que ceux de ces séries ont tous fonctionné correctement durant le quatrième trimestre de l'année.

Mais Backblaze a la bonne idée de proposer également une analyse portant sur l'année 2016 complète, avec donc bien plus de données à comparer (ce qui permet de réduire les marges d'erreur). Là encore, le Seagate ST4000DX000 de 4 To arrive en tête avec 13,57 %, les autres séries étant en dessous de 6 %.

Des statistiques globales, un taux en baisse d'année en année

La répartition des pannes entre les disques durs de 3, 4, 5, 6 et 8 To est à peu près équilibrée avec 1,40 % minimum pour les modèles de 3 To et 2,06 % maximum pour ceux de 4 To (nous n'avais pas pris en compte les modèles de 5 To qui n'étaient que 45 sur l'année 2016 avec une seule panne, rien de représentatif donc).

La répartition par fabricant (tous modèles et capacités confondus donc) est également intéressante : Western Digital arrive bon dernier avec 3,88 % de taux de panne annuels, contre 2,65 % pour Seagate qui est en deuxième position. Toshiba et HGST (filiale de Western Digital) sont respectivement troisième et quatrième respectivement, avec 1,27 % et 0,60 %.

En 2016, sur les 71 939 HDD analysés par Backblaze, 1 225 sont tombés en panne, soit une moyenne de 3,35 HDD à changer par jour. De manière générale, la fiabilité semble s'améliorer au fil des ans, avec un taux de panne annuel qui passe de 6,39 % en 2014 à 2,47 % en 2015 et 1,95 % en 2016.

Quid des taux de panne depuis 2013 ?

Enfin, Backblaze propose un récapitulatif des taux de panne annualisés pour l'ensemble des disques durs qui sont passés dans son datacenter, et ce depuis avril 2013. Cela fait plus de 85 000 HDD avec 5 380 unités qui ont rencontré des soucis.

Seagate truste les premières places avec 90,92 % (sic) pour le ST1500DL003 (1,5 To), 47,70 % pour le ST320LT007 (2 To) et 26,72 % pour le ST3000DM001 (3 To). De manière générale, la fiabilité augmente avec la capacité puisque le taux de panne annualisé ne dépasse pas les 5,68 % pour les HDD de 4 To et plus.

Pensez à sauvegarder vos données efficacement

Cette publication de Backblaze rappelle qu'une panne est vite arrivée et qu'il faut penser à prendre les devants. Un NAS avec un RAID (1, 5, 10... mais pas 0) permet de pallier la panne d'un disque, ce qui est vite arrivé. Cela ne vous protège par contre pas d'une défaillance du NAS, d'un incendie, d'une inondation, d'un vol, etc.

Les règles de base sont pourtant assez simples : dupliquer vos données sur plusieurs disques durs (via un RAID par exemple), mais aussi et surtout dans des lieux distincts. Plusieurs fabricants de NAS permettent de synchroniser à distance vos fichiers entre deux NAS, cela multiplie certes les coûts, mais renforce la pérennité des données. Vous pouvez également utiliser un système de sauvegarde en ligne, en chiffrant vos données si besoin.