Backblaze : 129 764 disques durs en service pour 335 pannes, dont 87 % sur des Seagate

Mieux vaut éviter les 4, 8, 10 et 12 To

Backblaze : 129 764 disques durs en service pour 335 pannes, dont 87 % sur des Seagate

Backblaze : 129 764 disques durs en service pour 335 pannes, dont 87 % sur des Seagate

Abonnez-vous pour tout dévorer et ne rien manquer.

Déjà abonné ? Se connecter

Abonnez-vous

Backblaze vient de publier son analyse des pannes de près de 130 000 disques durs. Ce trimestre encore, Seagate se distingue – pas vraiment de la bonne manière – principalement à cause de ses modèles de 4 et 12 To. La société note néanmoins une amélioration globale et fait le bilan de ses prédictions pour début 2020.

Chaque trimestre, l’hébergeur propose une analyse détaillée de l’état des disques durs présents dans ses serveurs. Au 31 mars, il disposait de 132 339 modèles en fonctionnement : 2 380 servaient pour du boot, les 129 959 autres étant utilisés pour du stockage. Les références avec moins de 60 unités ou mises en service à des fins de test sont retirées des statistiques pour éviter de les fausser en raison d’un trop faible échantillonnage.

Il reste ainsi 129 764 disques durs à analyser, provenant de trois fabricants : 93 418 sont de chez Seagate, 29 047 pour HGST (qui appartient à Western Digital) et 7 299 de Toshiba. 

87 % des HDD en panne sont des Seagate… 

Sur les trois premiers mois de 2020, 292 disques durs Seagate sont tombés en panne, contre 27 HGST et 16 Toshiba. En pourcentage, Seagate représente ainsi 72 % des HDD en service, mais concentre 87 % des pannes, contre respectivement 22/8 % pour HGST et 6/5 % pour Toshiba.

Mais il s’agit là d’un calcul ne prenant pas en compte la durée de fonctionnement des disques durs sur la période. Pour obtenir un décompte plus « juste » et surtout avoir une granularité au niveau de chaque référence, Backblaze calcule et met en avant un « taux de panne annualisé » (AFR pour Annualized Failure Rate).

Il tient compte du nombre de jours de fonctionnement cumulés des disques durs et de pannes et se calcule avec la formule suivante :

100 * (nombre de pannes / (jours cumulés de fonctionnement des disques durs / 366)

… dont 223 sur des modèles de 4 et 12 To

Avec cet indice, Seagate arrive de nouveau en tête du classement, en laissant à bonne distance ces concurrents. Quatre références ont un AFR de plus de 1,3 % :

  • ST4000DM000 de 4 To (1,42 %)
  • ST12000NM008 de 12 To (1,41 %)
  • ST12000N007 de 12 To (1,37 %)
  • ST10000NM0086 de 10 To (1,34 %)

Le ST800NM0055 de 8 To y échappe de peu avec un AFR de 1,28 %. Ces cinq références occupent les cinq premières places du classement, un « honneur » dont le fabricant se serait certainement bien passé… d’autant qu’il s’était déjà distingué sur le bilan 2019 sur ces mêmes modèles.

L’année dernière en effet, les deux versions des disques durs de 12 To  avaient un taux de pannes de 3,32 % et 1,14 %, contre 2 % pour celui de 4 To, 1,57 % pour le 8 To et 1 % pour le 10 To.

De son côté, Toshiba n’a que deux références dans ce bilan : le MD04ABA400V de 4 To sans aucune panne (sur 99 disques durs en service) et le MG007ACA14TA de 14 To avec 16 pannes sur 7 200 HDD, pour un taux de panne annualisé de 1,27 %. Il s'approche donc lui aussi des résultats de Seagate.

Chez HGST (Western Digital), cinq références sont listées, deux sans aucune panne, les trois avec un taux annualisé entre 0,28 et 0,56 %.

Au global, le taux de panne annualisé est en baisse

Dans l’ensemble, la société note que « le taux de panne annualisé pour le premier trimestre 2020 était de 1,07 %. C'est le taux le plus bas de tous les trimestres depuis que nous avons commencé à le calculer en 2013 ». La baisse est importante par rapport à début 2019 (1,56 %).

Lors de chaque publication trimestrielle, Backblaze propose également une analyse à plus long terme avec un bilan des taux de pannes annualisées remontant à ses premiers relevés. Là encore Seagate arrive « en tête » avec ses disques durs de 4 et 12 To qui sont à plus de 2 %, et ce sont les seuls du classement :

Backblaze Q1 2020Backblaze Q1 2020

HDD de 20 To, HAMR et MAMR aux abonnés absents

Au début de l’année dernière, l’auteur du billet de blog – Andy Klein – s’était livré à un exercice difficile : des prédictions pour le 1er trimestre 2020. Conclusion un an plus tard : « en résumé, je pense que je vais revenir à mes statistiques sur les disques durs et laisser les pronostics aux devins et aux baguettes de sorciers ».

Si la capacité de stockage totale de Backblaze a effectivement dépassé la barrière de l’exaoctet – soit 1000 pétaoctets – en mars, les autres prévisions ont toutes échoué. De peu dans le cas des disques durs de 4 To : ils sont 34 908, alors que la prévision espérait dépasser les 35 000 unités.

Andy Klein s’attendait à ce que Backblaze dispose d’au moins de 20 HDD de 20 To pour des tests ainsi qu’au moins un avec la technologie MAMR (Western Digital) et/ou HAMR (Seagate), mais le compteur est resté bloqué à 0. Tout n’est pas perdu : les premiers exemplaires sont attendus pour la fin de l’année.

Commentaires (22)


Sait-on pourquoi, bien qu’étant conscients que Seagate est le constructeur le plus défaillant, 72 % de leurs disques sont Seagate ?


Au contraire, quand on voit que 72% de leur cheptel est du Seagate, avoir 87% des pannes sur cette marque est presque logique !
Ok, cette valeur est un peu haute, et devrait être plus proche des 72%, mais afficher en gros, “87% des pannes chez Seagates” n’apporte rien…



Passific a dit:


avoir 87% des pannes sur cette marque est presque logique




C’est traité dans la source et dans l’article NI :




Pour obtenir un décompte plus « juste » et surtout avoir une granularité au niveau de chaque référence, Backblaze calcule et met en avant un « taux de panne annualisé » (AFR pour Annualized Failure Rate).




Et ce taux reste haut pour Seagate.



Gaor a dit:


Sait-on pourquoi, bien qu’étant conscients que Seagate est le constructeur le plus défaillant, 72 % de leurs disques sont Seagate ?




Parce qu’ils sont les moins cher ?



Malgré les nombreuses pannes que j’ai eu sur du Seagate, jusqu’à présent, je continue sur cette marque, à cause essentiellement du gros gap de prix avec WD & cie.



Mais ça pourrait changer. Je traîne un problème récurent sur mon NAS/Linux/RAID 5/md/LVM.

Je vais pas refaire tout l’historique ici, mais est-ce que quelqu’un connaîtrait un lien de cause à effet entre Seagate et ce genre d’erreur :




kern.log:Apr 12 15:16:02 xxx kernel: [66687.793598] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen
kern.log:Apr 12 15:16:02 xxx kernel: [66687.793617] ata3.00: failed command: FLUSH CACHE EXT
kern.log:Apr 12 15:16:02 xxx kernel: [66687.793629] ata3.00: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 19
kern.log:Apr 12 15:16:02 xxx kernel: [66687.793629] res 40/00:ff:81:00:00/00:00:00:00:00/40 Emask 0x4 (timeout)
kern.log:Apr 12 15:16:02 xxx kernel: [66687.793645] ata3.00: status: { DRDY }
kern.log:Apr 12 15:16:02 xxx kernel: [66687.793652] ata3: hard resetting link
kern.log:Apr 12 15:16:02 xxx kernel: [66688.269596] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
kern.log:Apr 12 15:16:02 xxx kernel: [66688.276137] ata3.00: configured for UDMA/133
kern.log:Apr 12 15:16:02 xxx kernel: [66688.276151] ata3.00: retrying FLUSH 0xea Emask 0x4
kern.log:Apr 12 15:16:02 xxx kernel: [66688.276353] ata3: EH complete


Après ça, j’ai le choix entre un reboot, ou des perfs diminuées (UDMA/133).

Après le reboot, c’est l’épée de Damoclès : je sais que ça se reproduira, après 1 jour, ou 25 …

Les câbles SATA ont été changés. J’avais le problème sur une machine (MoBo/CPU/RAM) M-A avec un set de disques D-A.

Même problème avec M-A et D-B.

Même problème avec M-B et D-B.



Je d’viens fou !



gileri a dit:


C’est traité dans la source et dans l’article NI :Et ce taux reste haut pour Seagate.




Le chiffre de 87% est dans un titre, et remit en gros plus bas, alors qu’il ne veut strictement rien dire, ou plutot qu’il ne porte aucune information, mais plutôt une désinformation pour qui survolerait un peu trop vite l’article.



Ensuite, comparer les taux de disques 4To avec des disques 12To n’a pas nom plus d’intérêt. Enfin, les taux ne sont justement pas très haut, que ce soit pour Seagate ou les autres. Blackbaze a publié dans le passé des statistiques où il y avait de réels modèle problématiques avec des taux à 8%. Aujourd’hui, ils ont l’air de globalement se tenir dans une fourchette étroite ou identique vu que statistiquement il y a pour certains modèles une grosse marge d’erreur (qui devrait être affichée/modèles pour être rigoureux).



AncalagonTotof a dit:


Parce qu’ils sont les moins cher ?Malgré les nombreuses pannes que j’ai eu sur du Seagate, jusqu’à présent, je continue sur cette marque, à cause essentiellement du gros gap de prix avec WD & cie.Mais ça pourrait changer. Je traîne un problème récurent sur mon NAS/Linux/RAID 5/md/LVM. Je vais pas refaire tout l’historique ici, mais est-ce que quelqu’un connaîtrait un lien de cause à effet entre Seagate et ce genre d’erreur : kern.log:Apr 12 15:16:02 xxx kernel: [66687.793598] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6 frozen kern.log:Apr 12 15:16:02 xxx kernel: [66687.793617] ata3.00: failed command: FLUSH CACHE EXT kern.log:Apr 12 15:16:02 xxx kernel: [66687.793629] ata3.00: cmd ea/00:00:00:00:00/00:00:00:00:00/a0 tag 19 kern.log:Apr 12 15:16:02 xxx kernel: [66687.793629] res 4000:ff:81:00:00/00:00:00:00:00/40 Emask 0x4 (timeout) kern.log:Apr 12 15:16:02 xxx kernel: [66687.793645] ata3.00: status: { DRDY } kern.log:Apr 12 15:16:02 xxx kernel: [66687.793652] ata3: hard resetting link kern.log:Apr 12 15:16:02 xxx kernel: [66688.269596] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300) kern.log:Apr 12 15:16:02 xxx kernel: [66688.276137] ata3.00: configured for UDMA/133 kern.log:Apr 12 15:16:02 xxx kernel: [66688.276151] ata3.00: retrying FLUSH 0xea Emask 0x4 kern.log:Apr 12 15:16:02 xxx kernel: [66688.276353] ata3: EH completeAprès ça, j’ai le choix entre un reboot, ou des perfs diminuées (UDMA/133). Après le reboot, c’est l’épée de Damoclès : je sais que ça se reproduira, après 1 jour, ou 25 … Les câbles SATA ont été changés. J’avais le problème sur une machine (MoBo/CPU/RAM) M-A avec un set de disques D-A. Même problème avec M-A et D-B. Même problème avec M-B et D-B. Je d’viens fou !




c’est quoi tes disques exactement ?
je me suis mangé quelques déconnexions de l’usb (linux me désactivait totalement l’usb, fallait rebooter pour avoir de nouveau accès au disque, et j’ai pas encore bien compris pourquoi, peut-être la puce qui fait la conversion sub3 / sata, et/ou des latences dues au fait que c’était des disques “SMR” (disons que c’est arrivé plusieurs fois d’affilée lors d’utilisation intensive de disques SMR, mais la dernière fois c’était avec un disque normalement pas SMR, donc je sais plus trop quoi penser))
c’est ton “frozen” qui me fait poser la question


Je vais donc publier ici mes statistiques perso : j’ai 5 disques Seagate, 1 Western Digital, et 1 Toshiba ; dans les pannes récentes, j’en ai une seule : le disque Western Digital (quelques semaines après la fin de la garantie).
Résumé : 100% des pannes chez moi sont WD, et 100% de mes disque WD sont en panne.



(quote:46933:alex.d.)




Tu as lu l’article sinon ?



AncalagonTotof a dit:


[..]




Tu a mis à jour les Firmware du/des disques et les controleurs de la machine (Bios/firmware si carte raid) ?
Ca ressemble a un soucis de gestion d’un côté ou de l’autre.



J’ai déjà eu ça sur des cartes RAID dans un serveur Dell sur mon ancien taf.
Une vraie plaie..



(quote:46933:alex.d.)
Je vais donc publier ici mes statistiques perso : j’ai 5 disques Seagate, 1 Western Digital, et 1 Toshiba ; dans les pannes récentes, j’en ai une seule : le disque Western Digital (quelques semaines après la fin de la garantie). Résumé : 100% des pannes chez moi sont WD, et 100% de mes disque WD sont en panne.




Le titre est parlant sur 130 000 disque (je fais de la louche), un peut moins de 350 DD HS, sur les 350, 87% de Seagate. Effectivement, le titre ne dit pas 72% de seagate sur les 130 000 disques, mais faut lire pour en savoir plus.
Pour le reste, c’est assez clair, mais faut lire.. entièrement.. l’article.



David_L a dit:


Tu as lu l’article sinon ?




Oui, et heureusement parce que le seul titre est un peu trompeur, laissant croire que c’est la catastrophe chez Seagate alors qu’ils ont un taux de pannes juste un poil au dessus des autres.
Ça ne m’empêche pas de publier mes propres stats où WD est bien moins fiable que Seagate.



(quote:46939:alex.d.)




Fais le en taux de panne moyen sur la durée alors, que ce soit un minimum utile ;)



David_L a dit:


Fais le en taux de panne moyen sur la durée alors, que ce soit un minimum utile ;)




Facile : sur l’année écoulé, chez moi, Seagate 0% de panne (0 sur 5), WD 100% de pannes (1 sur 1).
Et à la façon du titre NXI : 7 disques durs en service pour 1 panne, dont 100% sur des WD.


Je trouve aussi qu’ il serait plus judicieux dans le titre de mettre en rapport avec la population des disques . Sans aller des le calculs des heures qui sont dans le detail de l article , je vois un taux de défaut a 0.3 % chez Seagate qui est 3 fois plus que HGST ( 0.1 % ) et 1.5 fois plus que Toshiba ( qui est a 0.2% ) .
Ca fait quand même un grande difference entre les constructeurs.
Si les DD HGST étaient fabriques par WD avec les memes usine et memes process nous pourrions comparer les 2 mais je pense qu ils sont encore bien séparés niveaux design et manufacture?



Pour le grand public du coup on ne peut pas comparer facilement avec cela , ce serait pas mal s’il ils mettaient du disque WD dans leur baies pour pouvoir mieux comparer…



La ou ca aide bien est de donner les series qui ont des taux anormaux pour les éviter …Si nous sommes assez patients et malins d attendre de voir des retours parce que les DD de 4To ca me parait un peu tard alors que 6 a 12 ou plus on est dans encore dans la bonne période amha …



MsGambit a dit:


Je trouve aussi qu’ il serait plus judicieux dans le titre de mettre en rapport avec la population des disques . Sans aller des le calculs des heures qui sont dans le detail de l article , je vois un taux de défaut a 0.3 % chez Seagate qui est 3 fois plus que HGST ( 0.1 % ) et 1.5 fois plus que Toshiba ( qui est a 0.2% ) . Ca fait quand même un grande difference entre les constructeurs.




Il n’y a une différence que si c’est inférieure à la marge d’erreur, et vu que les quantités/durées sont différentes, elle n’est même pas commune. Si l’on souhaite réellement comparer, il faudrait avoir des fourchettes prenant en compte cette marge d’erreur. Comparer 0.1% et 0.3% sur un mélange de modèle, avec des marges d’erreurs mélangés qui sont en partie supérieur à ces %, cela ne veut rien dire du tout.



Avec les données communiqués, il n’y que la possibilité de connaitre un modèle avec réel problème, et sinon, il faut refaire des calculs préalables.



Gaor a dit:


Sait-on pourquoi, bien qu’étant conscients que Seagate est le constructeur le plus défaillant, 72 % de leurs disques sont Seagate ?




Probablement une question de coût de revient. Même sur les pires modèles, le taux de panne reste relativement faible, entre 1 et 2%. Donc il suffit qu’il soit ne serait ce que 5% moins cher au To pour que les Seagate soient quand même plus intéressants.



Privilégier la fiabilité quitte à payer plus cher, c’est valable pour ceux qui n’ont que quelques unités, car là une seule panne fait tout de suite exploser les coûts, on ne peut pas raisonner sur le taux de panne pour juger le coût d’une panne. Quand tu as des dizaines de milliers de disques, le surcoût des pannes devient faible.



(quote:46939:alex.d.)
Oui, et heureusement parce que le seul titre est un peu trompeur, laissant croire que c’est la catastrophe chez Seagate alors qu’ils ont un taux de pannes juste un poil au dessus des autres. Ça ne m’empêche pas de publier mes propres stats où WD est bien moins fiable que Seagate.




Statistique : “Science et techniques d’interprétation mathématique de données complexes et nombreuses, permettant de faire des prévisions.”



Tes chiffres ne sont pas des stats.



SartMatt a dit:


Statistique : “Science et techniques d’interprétation mathématique de données complexes et nombreuses, permettant de faire des prévisions.“Tes chiffres ne sont pas des stats.




Ça c’est la définition par google, qui n’est pas une référence sur la langue française puisque c’est un groupe américain. Si on va voir chez Larousse :
Ensemble de données d’observation relatives à un groupe d’individus ou d’unités (souvent pluriel).
Donc si, ce sont bien des statistiques.



Mais faut se détendre un peu et cliquer sur le lien.



SartMatt a dit:


Quand tu as des dizaines de milliers de disques, le surcoût des pannes devient faible.




+1
Dans une grappe RAID redondée (par exemple 2x5 disques) avec 2 spares, on peut largement se permettre d’avoir des disques qui tombent parfois en panne s’ils sont moins chers.



On tournera sur le redondé pendant la reconstruction, c’est transparent…



Ce sont des spécialistes du stockage,
et vu le suivi qu’ils ont pour sortir ces chiffres + l’analyse pertinente dans un unité “globale”, j’imagine bien que leur choix reste éclairé.


Je profite de cet article pour demander, quel équivalent de Backblaze sauriez-vous recommander mais avec des serveurs en Europe svp ? J’aimerai faire des sauvegardes en ligne de mon ordi portable mais aussi d’un NAS.



J’avais déjà essayé Backblaze, j’attendais qu’ils ouvrent leur datacenter en Europe, puis au final je n’ai pas été convaincu.



Merci.



Zekka a dit:





Ça dépend du besoin. Si c’est pour l’offre grand public « illimitée » je ne sais pas trop si ça existe. Sinon tu peux regarder du côté des solutions object/cold storage exploitables avec les NAS https://www.nextinpact.com/news/107960-utilisez-object-storage-pourstocker-fichiers-et-partager-simplement-en-ligne.htm



David_L a dit:


Ça dépend du besoin. Si c’est pour l’offre grand public « illimitée » je ne sais pas trop si ça existe. Sinon tu peux regarder du côté des solutions object/cold storage exploitables avec les NAS https://www.nextinpact.com/news/107960-utilisez-object-storage-pourstocker-fichiers-et-partager-simplement-en-ligne.htm




Merci je regarderai ça. Je pensais à des solutions dans la même veine que Backblaze, Carbonite et compagnie. J’avais essayé Synology C2 qui avait l’air parfait (datacenter en Europe + mon NAS est un Synology) mais alors le temps que ça mettait pour envoyer les données… J’ai du abandonner.



Hors sujet, je ne sais pas comment InpactHardware fonctionne exactement mais je n’ai eu aucune notification (ou ne serait-ce qu’un indice visuel quelque part dans la page) que tu m’avais répondu David (même si c’est juste citer mon message), je ne sais pas si c’est normal. Je m’attendais à quelque chose de similaire à NextInpact.


Fermer