Vous n'avez pas encore de notification

Page d'accueil

Options d'affichage

Abonné

Actualités

Abonné

Des thèmes sont disponibles :

Thème de baseThème de baseThème sombreThème sombreThème yinyang clairThème yinyang clairThème yinyang sombreThème yinyang sombreThème orange mécanique clairThème orange mécanique clairThème orange mécanique sombreThème orange mécanique sombreThème rose clairThème rose clairThème rose sombreThème rose sombre

Vous n'êtes pas encore INpactien ?

Inscrivez-vous !
Pannes chez OVH : tous les services sont de retour

La semaine dernière, OVH rencontrait une série de problèmes dans ses centres de données de Roubaix et Strasbourg, touchant un nombre important de clients. Octave Klaba a rapidement communiqué sur le sujet de manière détaillée sur Twitter, en complément du service de suivi des travaux, dès qu'il a été à nouveau opérationnel.

Si une grosse partie des serveurs était de retour dans la journée, ce ne fut pas le cas de tous les services, notamment en raison de pannes matérielles. Samedi, les instances Public cloud et les VPS étaient de retour. Ce matin, on apprenait que les derniers serveurs concernés avaient été remplacés. Les équipes travaillent désormais à la reconstitution des stocks, au nettoyage, etc.

C'est désormais la question de l'indemnisation qui va se poser, une panne chez OVH ayant parfois des effets inattendus. La société a indiqué qu'une fois l'incident clos elle appliquera « les SLA prévus dans nos contrats ». Il faudra voir si l'hébergeur contacte directement ses clients ou si celui-ci doit effectuer une demande. Nous tenterons d'en savoir plus rapidement.

10 commentaires
Avatar de secouss Abonné
Avatar de secousssecouss- 13/11/17 à 10:30:34

Pour ceux qui veulent tous les détails de strasbourg sont là :
http://travaux.ovh.net/?do=details&id=28247&PHPSESSID=8020432fe3...

J'ai plus le lien pour le détail de roubaix (y a une tache sur le site)

Avatar de Pierre_ INpactien
Avatar de Pierre_Pierre_- 13/11/17 à 12:22:20

Sacré communication, j'étais passé à coté ! Merci pour le lien :yes:

Avatar de Bejarid INpactien
Avatar de BejaridBejarid- 13/11/17 à 13:37:31

Le lien pour l'incident de Roubaix :http://travaux.ovh.net/?do=details&id=28244

La conclusion étant "Nous on met aussi souvent à jours nos noeux de réseaux que Equifax ses firewalls !" :D

Édité par Bejarid le 13/11/2017 à 13:39
Avatar de secouss Abonné
Avatar de secousssecouss- 13/11/17 à 13:45:38

Yep merci pour le lien ^^ j'avais la flemme de rechercher :D

En tout cas c'est sur que ça fait pas pro. Je sais que c'est l'horreur de suivre toutes les MAJ Soft et Hard sur leurs équipements mais là ils ont pris une grosse claque de rappel.

La conclusion pour Strasbourg c'est aussi pas mal "à l'avenir, un site prototype restera un site prototype, on mélange pas les test avec la prod"
(Pour connaître les équipes d'Electricité de Strasbourg c'est pas des champions... Franchement ça vaut pas Enedis, ils ont aussi une responsabilités)

Avatar de Bejarid INpactien
Avatar de BejaridBejarid- 13/11/17 à 13:53:01

Mouais, EDS a sans doute vendu un ligne à SLA de 99%, et ils vont la tenir. C'est OVH qui a besoin d'une alimentation à 99,99%, le métier du hosting est très particulier et on ne peut pas demander aux fournisseurs d'énergie de s'y adapter, eux leur coeurs de métier c'est des industriels pour qui 99% c'est largement suffisant. Sans compter qu'on ne connait pas la cause de rupture d'une des deux lignes, si c'est un de ces classiques "coup de pelleteuse", ils n'y sont pour strictement rien !

Ici OVH fait son méa culpa en disant "on aurait du en avoir 2", c'est bien gentil mais même ça c'est critiquable, les DC qui ont 3 alimentations distinctes ou plus ne sont pas rare, et pour certains 4 est le minimum avant de mettre un DC en prod. Là ils l'ont fait avec une seule et unique alimentation : dans le métier on appel ça du foutage de gueule.
Édité par Bejarid le 13/11/2017 à 13:56
Avatar de secouss Abonné
Avatar de secousssecouss- 13/11/17 à 14:14:12

Quand tu met 2 lignes à mon sens c'est sous entendu que si une se coupe le circuit se reconfigure...

Je suis d'accord avec toi ils sont sérieusement en dilettante je trouve .... Suffit de regarder sur lafibre.info la très bonne présentation du DC3 d'Iliad/Online et ses 6 groupes électrogènes qui le certifient Tier III
https://lafibre.info/online/dc3-iliad/

Car là ça fait vraiment pas propre chez OVH, ils tentent de réinventer le métier, mais pour le réinventer il faut déjà le maîtriser à plein :/

Avatar de Bejarid INpactien
Avatar de BejaridBejarid- 13/11/17 à 14:24:41

secouss a écrit :

Quand tu met 2 lignes à mon sens c'est sous entendu que si une se coupe le circuit se reconfigure...

 
Avec une seule ligne, le site s'est retrouvé en sous-tension (car moitié moins d'intensité dispo), ce qui a fait sauter le disjoncteur (sinon c'est toutes les alimentation qui auraient grillés...). Il aurait fallut que OVH prépare le coup et fasse un arrêt partiel automatique dans les différents DCs relié à cette alimentation (plusieurs DCs... une seule alimentation... Oh mon dieu le bordel, comment ils ont pensé que c'était une bonne idée quand ils ont tiré les câbles chez OVH ?!) pour équilibrer la consommation avec la fourniture, sauf que c'est pas vraiment une bonne solution, comparé à celles des groupes électrogènes, qui n'ont malheureusement pas pu se mettre en ligne à cause de leur automate défaillant.

Sachant que c'est pas la première fois qu'ils ont un problème d'automate, y s'en on eu un autre y a quelques années si je me souviens bien ^^
Édité par Bejarid le 13/11/2017 à 14:27
Avatar de Bejarid INpactien
Avatar de BejaridBejarid- 13/11/17 à 14:32:42

secouss a écrit :

Car là ça fait vraiment pas propre chez OVH, ils tentent de réinventer le métier, mais pour le réinventer il faut déjà le maîtriser à plein :/

Pécher par excès d'orgueil c'est la norme de nos jours. Et on couvre ça avec des "ouais mais c'est bien d'échouer, ça nous permet d'apprendre de nos erreurs, c'est comme ça qu'on avance, nous illettrés qui n'avons jamais appris à lire !".

Comme disait l'autre (me souvient plus de l'auteur ^^) "Les fous apprennent de leurs erreurs, les sages de l'histoire".

Avatar de secouss Abonné
Avatar de secousssecouss- 13/11/17 à 14:53:54

Sur lafibre.info ils en parlent justement ^^

https://lafibre.info/ovh-datacenter/sites-ovh-quasi-inacessibles-depuis-orange/

Leur système était sous dimensionné, mais c'était du style "on serre les fesses le temps de déployer le reste du bordel, avec du bol ça va le faire"

C'est sur que d'autres on eu des soucis d'automates comme tu dis, après je comprend mal la non redondance d'un équipement pareil.
Coupure à t0
t1 passage sur onduleur
t2 démarrage et stabilisation des groupes
t3 passage sur les groupes

 Si passage non effectifs soit :
t4 intervention manuelle (mais vu les tension faut une formation spécifique)
ou
t4 essai avec automate 2

Sachant que 2 groupes elecs sur une seule boucle ça me semble light aussi. Normalement si tu fais du N+1 tu as 2x2 groupes. Tu démarre tout à t2 et tu arrête ta boucle de secours si les premiers groupes supportent la charge.

Avatar de renaud07 INpactien
Avatar de renaud07renaud07- 13/11/17 à 15:30:36

C'est donc pour ça que je n'arrive plus à accéder à un site hébergé chez OVH depuis jeudi dernier... mais bizarrement il n'est toujours pas revenu... j'ai visiblement raté la news de jeudi.

Au début j'avais connexion échoué (firefox) sans doute la panne de courant. Puis quelques heures plus tard, un 502 bad gateway qui est toujours là...

Soit les responsables du site ne savent pas quoi faire, soit le site a été perdu pour de bon :transpi:

Il n'est plus possible de commenter cette actualité.