OVH livre les premiers détails sur sa panne de ce matin

OVH livre les premiers détails sur sa panne de ce matin

Merci Murphy

Avatar de l'auteur
Guénaël Pépin

Publié dans

Internet

09/11/2017 3 minutes
308

OVH livre les premiers détails sur sa panne de ce matin

Ce matin, OVH subissait une panne d'envergure, deux de ses centres de données à Strasbourg ayant perdu leurs sources d'alimentation. En parallèle, un lien d'interconnexion important tombait. La situation revient peu à peu à la normale.

À 8h15 sur Twitter, Octave Klaba annonce que les deux arrivées électriques de ses centres de données strasbourgeois (SBG1 et SBG4) sont tombées, quand les deux groupes électrogènes « se sont mis en défaut ». La salle de routage n'est donc plus alimentée, constate le fondateur d'OVH. Selon une capture d'écran du site Travaux de l'hébergeur, lui aussi inaccessible, les routeurs ne seraient plus alimentés depuis 7h14.

De nombreux sites touchés

Le réseau optique qui relie ses centres de données de Roubaix et de Strasbourg avec les autres points de présence de l'hébergeur serait aussi hors-ligne, affirme encore Klaba. Ce dernier ajoute par la suite que les châssis de ses points de présence européens ont éteint simultanément ses liens 100 Gb/s. Vers 9h, les sites ovh.com, ovh.net et ovhtelecom.fr étaient difficilement joignables, selon nos constatations.

Certains clients disent être affectés par la panne à l'image de BFM BusinessCozy Cloud et Slice42, une partie des sites concernés étant simplement inaccessible. D'autres ont rencontré des soucis avec leur service domotique, montrant l'impact que peut avoir ce genre de pannes sur le quotidien à l'heure du tout connecté. 

Octave Klaba a suivi le rétablissement des services sur Twitter pendant la matinée, et un premier bilan a été publié par OVH. On y apprend que les deux incidents sont indépendants.

Deux pannes simultanées

Sur Strasbourg il s'agissait d'un problème électrique. « L'alimentation a été rétablie et les services sont en cours de redémarrage. Certains clients sont UP et d'autres pas encore. Si votre service n'est pas encore UP, le délai de rétablissement est compris entre 5 minutes et 3-4 heures » précise l'hébergeur qui indiquait surveiller la situation des clients.

Concernant Roubaix, le souci était situé au niveau du réseau optique qui assure l'interconnexion avec Paris, Francfort, Amsterdam, Londres et Bruxelles. « L'origine du problème est un bug software sur les équipements optiques qui a provoqué la perte de la configuration et la coupure de la connexion avec notre site de RBX. Nous avons remis le backup de la configuration software dès que nous avons diagnostiqué l’origine du problème et le DC est à nouveau joignable » indique cette fois OVH qui déclare chercher l'origine du bug avec le constructeur afin que le problème ne se reproduise pas.

Désormais une bonne partie des services semble de retour. Nous avons contacté OVH et Octave Klaba pour avoir de plus amples détails. Nous reviendrons sur cet incident dès que nous aurons plus d'informations.

Écrit par Guénaël Pépin

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

De nombreux sites touchés

Deux pannes simultanées

next n'a pas de brief le week-end

Le Brief ne travaille pas le week-end.
C'est dur, mais c'est comme ça.
Allez donc dans une forêt lointaine,
Éloignez-vous de ce clavier pour une fois !

Fermer

Commentaires (308)


Merci pour la rapide news ! J’étais justement en train de faire ma veille journalière avec quelques difficultés !


Certains sites de la Presse Libre ne serait pas chez OVH par hasard ? Impossible de les joindre…



Arrêt sur Image est inaccessible et Alternatives Economiques échoue à l’identification.


Et la je suis heureux d’être passé chez AWS. Une pensée à tous les clients OVH. Nul doute qu’ils seront dédommagés.


Pour le coup, c’est dommage d’avoir une redondance qui ne fonctionne pas. A quand une triple redondance avec un système mécanique pour fournir le jus (genre accumulateur à énergie cinétique) ?

 


Tous nos sites sont down et ovh.com aussi. Heureusement pour nous rien de critique (chez Amazon).


Alors ça c’est fort.



Le seul jour de ma vie où je dois reprendre un mail qui m’a été envoyé hier soir sur mon tel, mais que je n’ai pas eu le temps de dl sur mon PC.



Je vais une recherche Google pour savoir comment imprimer depuis un tel Android, Phonandroid est down car hébergé chez OVH.



La journée qui commence bien. <img data-src=" />


Pour ma part site web HS ainsi que le VPS. Heureusement rien de critique.


J’essaie de me connecter sur certains sites, mais j’ai une erreur DNS systématique (que je n’avais pas vers 8h00).

Ca vient de là ?


cowcotland.com est inaccessible

&nbsp;


Cloudprint de Google?

Marche bien chez moi.


Cloudprint de Google?

Marche bien chez moi.


C’est cool le cloud, jusqu’au jour où ce genre de problème arrive, on a presque tout chez eux, jusqu’à l’ADSL et OverTheBox.

Ya plus qu’a attendre ….


Idem ici, sur kimsufi, aucun ping.



Edit : C’est marrant d’ailleurs, cette panne intervient peu après l’annonce d’une hause de tarif d’une évolution du service anti DDoS


Mmm cool ovh !


La situation OVH ce jour peut se résumer à ceci :

https://www.estcequonmetenprodaujourdhui.info/



double sanction…


Ils les testent jamais leurs groupes électrogènes? C’est fou quand même.


Nous on a juste nos SVN, notre site, notre intranet plus une 10aines de site clients de down! :p


Rien de down chez moi (un ESX et un VPS pour le site) ouf :)


Je me rend compte à quel point mon serveur m’est utile tous les jours. Serveur mail, Tiny rss, mes deux sites, ampache, tous installés sur mon serveur ovh ^^”

Heureusement, c’est qu des trucs perso. Je plains ceux qui ont leur business hébergé chez ovh et qui doivent faire face à la grogne de leurs clients <img data-src=" />


L’hébergeur VPSz doit aussi être chez OVH car tous mes sites chez eux sont down, et leur site à eux aussi…








SNUT a écrit :



Et la je suis heureux d’être passé chez AWS. Une pensée à tous les clients OVH. Nul doute qu’ils seront dédommagés.





Exactement la même remarque. J’ai lancé l’ecommerce de ma compagne il y a 2 mois, j’ai hésité entre AWS et OVH, je ne regrette absolument pas mon choix. Chez OVH il ne reste que la partie emails, mais pas pour longtemps, elle même étant trop souvent en rade…



On a des redondances entre leur centre à Roubaix et à Strasbourg, pratique, les 2 sont down !


Chômage technique chez nous en attendant que le problème soit résolu.

Je sens que nos admins system vont se prendre une bonne soufflante d’avoir tout centralisé chez eux (services internes ET clients) <img data-src=" />


Les messageries Exchange hébergées chez eux sont également inaccessibles. Déjà quasi 3h c’est sûr que ça handicape un peu !


Macbidouille inaccessible, macg.co inaccessible, sale journée pour les Macqeux.


Je ne sais pas si c’est lié ou pas, mais quasi impossible d’utiliser internet sur mon smartphone ce matin, en étant chez Sosh.



Entonnement, FB fonctionne avec l’appli.


C’est bon, j’ai utilisé Samsung Truc Muche&nbsp; Print.&nbsp; <img data-src=" />&nbsp;



Bizarre que l’on puisse pas imprimer directement les mails sur l’appli Outlook…obligé de faire des screens.&nbsp;


&nbsp;01net.com me sembler mort ausi. <img data-src=" />


Mon Kimsufi fonctionne étrangement


J’en connais qui passent une sale matinée…&nbsp;<img data-src=" />








Cronycs a écrit :



Ils les testent jamais leurs groupes électrogènes? C’est fou quand même.





+1



C’est un peu le même genre de bourde que les SI qui mettent en place un super système de backup et qui ne testent pas périodiquement la bonne restauration des données.



Pas très professionnel tout ça.



L’authentification VDSL ne passe pas chez moi…


Trainline (ex-Capitaine Train) est en carafe aussi.



Je suis bien content d’avoir mis mes billets en PDF sur le téléphone, plutôt que compter exclusivement sur l’appli pour faire valider mes billets au controleur… Dans le cas contraire, je me demande si on peut envoyer l’amende à OVH ? <img data-src=" />


C’est une bonne chose pour le coup. <img data-src=" />&nbsp;


Easyflyer en carafe aussi !


Peut être qu’il est au Canada le tien ?


quelques sites downs en effet mais est-ce réellement lié qu’au problème d’OVH? Certaines sites mettent énormément de temps à répondre voir impossible. Dommage, un vendredi, cela aurait été synonyme de complot <img data-src=" />


C’est le genre de matériel qui permet d’attendre le démarrage des groupes électrogènes&nbsp;



Faut pas espérer faire tourner des milliers de serveurs durant 1h avec juste ça


Mhhh ça me rappel la fois où dans une entreprise où je bossais on avait perdu la connexion réseau (Internet + liaisons des différents sites).



On avait bien deux lignes (une en backup) mais le coup de pelleteuse responsable de ça a été fait à l’endroit où la ligne principale et la backup se croisait avant de reprendre chacune leur chemin différent.



<img data-src=" />


Ça arrive quand même assez souvent chez OVH les crashes/pannes/etc., et le backup qui ne fonctionne pas.



VDSL OVH à moitié en rade en ce qui me concerne.

&nbsp;


Incroyable… que EDF tombe ok. Mais les deux générateurs ??? ils ne sont pas vérifiés et testés régulièrement. ? Putain c’est hors cahier des charges TIERS III



<img data-src=" />


penser qu’OVH ne teste pas ses groupes c’est se mettre le doigt dans l’oeil.

Tu peux tester périodiquement ca veut pas dire que le jour où y’en a besoin ca va marcher&nbsp;


DriversCloud out aussi….


C’est là ou je suis bien content d’avoir poussé ma direction à ne pas passer sur le cloud :d








alex.d. a écrit :



Ça arrive quand même assez souvent chez OVH les crashes/pannes/etc., et le backup qui ne fonctionne pas.



VDSL OVH à moitié en rade en ce qui me concerne.







ça fait plus de 15 ans que j’utilise OVH pour mes clients. C’est la première fois que j’ai un site web down à cause d’eux. Donc bon…



Bon tout est down chez moi, plus de site, c’est chômage technique ce matin! <img data-src=" />



&nbsp;Bon c’est pas très marrant pour les clients tout ça.


VPS kimsufi accessible.



Popcorn sorti.&nbsp;<img data-src=" />


Est-ce que des gens ont un site hébergé chez Ex2 ? En tout cas, le site web de l’entreprise étant hébergé la-bas, il ne répond plus non plus. Ni les mails d’ailleurs… La journée va être longue…


SIP,VDSL/ADSL, hébergement, serveur dédié -&gt; tout HS <img data-src=" />&nbsp;








Fuli a écrit :



Pour le coup, c’est dommage d’avoir une redondance qui ne fonctionne pas. A quand une triple redondance avec un système mécanique pour fournir le jus (genre accumulateur à énergie cinétique) ?

&nbsp;





Une dynamo sur un vélo et les employés pédalent? <img data-src=" />









sinbad21 a écrit :



Macbidouille inaccessible, macg.co inaccessible, sale journée pour les Macqeux.







Macqeux Donald ? <img data-src=" />



Notre site communautaire technologie/gamer aussi est down.&nbsp;


Et jeuxonline ne marche plus non plus, c’est la fête ce matin! :)


Mais Ex2 hosting utilise les infras de OVH ? Si c’est le cas, je ne le savais pas…


Par malchance, jeuxvideo.com et Gameblog fonctionnent, eux.&nbsp;<img data-src=" />


ah j’ai compris Ex2 comme une faute à la place de “eux” donc j’ai lu :&nbsp;

&nbsp;Est-ce que des gens ont un site hébergé chez Eux&nbsp;^^


Pas de mail ici.








boogieplayer a écrit :



ça fait plus de 15 ans que j’utilise OVH pour mes clients. C’est la première fois que j’ai un site web down à cause d’eux. Donc bon…





ADSL OVH depuis qu’il existe (depuis la bêta), j’ai subi les problèmes de collecte, les problèmes de dégroupage, les problèmes de leur p*t%# de box Technicolor, les bugs d’authentification SIP, les LNS qui crashent, le patch appliqué aux LNS qui crashe le truc encore plus, les LNS de backup qui s’écroulent. Je compte passer à court terme sur de la fibre Free.



Côté hébergement, il est clair qu’ils ont beaucoup de datacenters, et en fonction de la chance, ton site est hébergé dans le datacenter en panne ou non. Mais des datacenters entiers qui crashent ou se font inonder, c’est déjà arrivé ces dernières années.

&nbsp;



C’est marrant, moi j’ai un dédié chez OVH, RBX, et il fonctionne sans interruption de service aucune O_o



Coup de bol, mailles du filet, tout ça.








alex.d. a écrit :



ADSL OVH depuis qu’il existe (depuis la bêta), j’ai subi les problèmes de collecte, les problèmes de dégroupage, les problèmes de leur p*t%# de box Technicolor, les bugs d’authentification SIP, les LNS qui crashent, le patch appliqué aux LNS qui crashe le truc encore plus, les LNS de backup qui s’écroulent. Je compte passer à court terme sur de la fibre Free.



Côté hébergement, il est clair qu’ils ont beaucoup de datacenters, et en fonction de la chance, ton site est hébergé dans le datacenter en panne ou non. Mais des datacenters entiers qui crashent ou se font inonder, c’est déjà arrivé ces dernières années.







Je vois bien que les galères existent avec OVH, et je compatis largement car c’est vraiment l’horreur et la galère quand ça arrive. C’est pour cela que nous avons mis en place de la ganularité entre différents fournisseurs d’hébergement, du coup nos load-balancer répartissent la charge ailleurs que chez OVH. Donc pour l’instant tout va bien à l’exception d’un seul site vitrine, mais mon SLA va s’appliquer, je vais devoir rembourser le client. Je vais voir le geste commercial de OVH sur son SLA.



Moi ce que je ne comprends pas c’est pourquoi l’alimentation principale serait sur des groupes électrogènes? Les serveurs OVH sont alimenté avec un moteur de tondeuse à gazon donc et t’as un gars qui vient faire le plein d’essence de temps en temps??&nbsp;



A moins qu’il y ait une coupure de courant chez edf ou des travaux prévus et qu’ils ont du passé sur une alimentation de secours, je ne comprends pas.


Bonjour, c’est normal de recevoir un avertissement hadopi quand on fait une selection de texte&nbsp; pour l’ouvrir dans un nouvel onglet chez vous ?



https://www.noelshack.com/2017-45-4-1510218188-nextimpact.gif


Faut lire la news : il y a une coupure EDF.


Sinon lire la news répondrait à a ta question ;)





Octave Klaba déclare qu’Enedis tente de déterminer le problème d’alimentation, OVH essayant lui de redémarrer ses deux groupes électrogènes.



Il y a donc un soucis d’alimentation général (ERDF) ET de leurs groupes électrogènes.








boogieplayer a écrit :



Je vois bien que les galères existent avec OVH,





Ça arrive chez OVH comme chez les autres. C’est plus visible chez OVH, parce qu’ils sont gros (numéro 1 européen), donc quand ça crashe, beaucoup de monde est concerné ; et aussi parce qu’ils sont en général assez transparents sur ce qui se passe.

&nbsp;



Une seule panne électrique et tout s’effondre, ça n’est quand même pas très sérieux :/


<img data-src=" /><img data-src=" /> Relis bien la page ;)


http://www.futura-sciences.com/ aussi est inaccessible…

Zut moi qui voulait pas bosser..


<img data-src=" />&nbsp;pour l’effort :)


Après la panne due à une fuite d’eau ya qq mois, ca commence à gonfler… Si on ajoute à ça les 2 fois ou ils m’ont tout coupé pour une soit disant infection de fichiers, infection qu’ils n’ont jamais réussi à prouver, je doit en être à 5 ou 6 jours d’indisponibilité sur les 6 derniers mois…et aucun geste commercial…


Oui donc ce qui a du se passer c’est : coupure de l’alimentation électrique, du coup ils démarrent les groupes électrogènes, sauf que ceux-ci ne fonctionnent pas.

D’où la remarque : ils les testent jamais leurs groupes électrogènes?


ça affecte aussi l’ADSL OVH (ma box est down)


Chez OVH ADSL chez moi, j’avais pas de réseau ce matin, j’ai pas eu le temps de regarder plus que ça, je comprend mieux pourquoi.



Ça a intérêt à être rétabli quand je rentre, sinon je passe chez SFR <img data-src=" />


J’ai lu ça en parcourant les fils twitter:https://twitter.com/article011/status/928534525726089216



&nbsp;


en l’occurrence ils subissent 4 panne électrique :

les deux alim externe EDF et les 2 doubles groupe de chaque salle…

c’est quand même dur de prévoir un backup du double backup(double groupe electro) de la double alimentation principale …


Peste, choléra, toussa&nbsp;<img data-src=" />


Aucun hébergeur n’est à l’abri de la panne, surtout si la loi de Murphy s’en mêle ;)


Sauf que moi, mon mail OVH marche encore.

&nbsp;


le principe même de la panne

quand ça arrive aux autres tu t’en fous.

j’ai pas mal d’hébergements chez eux, ça arrive de temps en temps sur les différents services

j’ai pas mal de problèmes sur la voip (sans service)


Pareil, j’ai un pauvre VPS qui fonctionne, mais les mails non :d


Pourquoi est-ce que le trafic n’est pas redirigé vers un datacenter dans une autre ville ?


aaah c’est ça qu’un site était hs ce matin.. bon ben plus qu’à attendre


Parceque dans le meme temps les fibres optiques sont HS








revker a écrit :



Pourquoi est-ce que le trafic n’est pas redirigé vers un datacenter dans une autre ville ?





c’est la partie routage qui est morte justement .. <img data-src=" />



Oui, c’est le problème quand on prend pour argent comptant ce qui est indiqué sur twitter…


Ah non il n’y avait pas d’erreur !

En tout cas, je confirme que Ex2 Hosting est inaccessible également. Moi qui voulait migrer sur Infomaniak, et bien je vais prendre le temps de le faire pendant la coupure de Noël !



Et curieusement, aucune mention d’un quelconque lien entre OVH et Ex2… Pourtant le problème est le même.








oursgris a écrit :



le principe même de la panne

quand ça arrive aux autres tu t’en fous.

j’ai pas mal d’hébergements chez eux, ça arrive de temps en temps sur les différents services

j’ai pas mal de problèmes sur la voip (sans service)







j’ai des potes webdev en galère, on copie des sites marchand sur mes serveurs chez online. Heureusement le serveur de dns est up, c’est juste un changement d’IP.



On est tous solidaire ici entre IT guys, je compatis sincèrement au problème et je te jure que je ne m’en fous pas.



J’ai une copine dont le site marchand est down, je ne sais pas ce qu’on peut faire. La direction d’OVH annonce un retour à la normal pas avant ce soir <img data-src=" />



Et n’oubliez pas coupé vos adwords pour ceux qui en ont !! <img data-src=" />



Pour avoir les info:https://twitter.com/olesovhcom

Réseau optique down sur différents points en simultané (donc très bizarre)

SBG =&gt; problème électrique x 4 (2 arrivée ERDF & 2 groupes)


‘fectivement j’ai constaté… plus de sites et plus de courriel. J’espère que cela va être rétabli dans la journée.


parce que selon leur dire leur lien externe (POP) sont tombé aussi …


C’est la dark army à ce niveau là,&nbsp;deux alim externe EDF sur des sites différrents et les 2 doubles groupe de chaque salle hs.&nbsp;


Comment tu peux prévoir une double panne de l’arrivée générale ET de tes générateurs ?

En gestion des risques tu apprends à les minimiser, pas à les éviter (ce qui est impossible, tu ne peux pas couvrir tous les cas).



Là c’est clairement un manque de chance, même s’il y a sûrement des points à revoir chez eux vu les enchaînements de pannes cette année.

AMHA, ils grossissent trop vite pour gérer convenablement les risques sur leurs datacenters. N’est pas Amazon, Google ou Microsoft qui veut.



Mais là c’est clairement la faute à pas de chance.

Loi de Murphy à l’état brut <img data-src=" />


Ah ah ! Je sors (le week-end passé) d’un grosse interruption de service <img data-src=" /> (je sais c’était ironique, pas ma panne cela dit).



C’est là qu’on voit qu’on est drôlement dépendant de tout ça quand même.


les 4 pannes électriques simultanés plus les fibres optiques HS et on va nous faire croire que c’est une pur coïncidence ? mouais …

A voir mais il est bien plus probable que çà ne soit pas que le fruit du hasard !


J’ai un VPS down, mais un autre qui fonctionne (graveline je pense).


Un complot, c’est ça ? <img data-src=" /> <img data-src=" />


Je te recommande de lire en détail le contenu de l’avertissement Hadopi que tu as généré ;)


j’ai rien dit alors

big up ! :)


Faut fouetté les Hamsters !


<img data-src=" />


Tu essayes d’ouvrir du texte en ligne, il te faut un lien <img data-src=" />

La page Hadopi c’est une page d’erreur personnalisée.


Mr Robot : “It’s happening it’s happening it’s happening it’s happening it’s happening “








oursgris a écrit :



j’ai rien dit alors

big up ! :)







no offence ! <img data-src=" />



C’est good, le site est up sur online (avec son backup d’hier, c’est mieux que rien)



http://maitremo.fr down too :(



Pour avoir bossé chez un infogéreur, j’imagine tellement le stress de cette matinée, je compatis. Courage les gars !


Boite mail pro inaccessible depuis ce matin… Plusieurs collègues passent du coup leur temps à suivre les meilleurs tweets sur le pb.&nbsp; Mon préféré pour le moment :&nbsp;

“A premier jour, il fera froid puis les serveurs d’OVH seront HS”

Apocalypse 2.0


Du coup est ce qu’il y aurait un lien avec le fait que je n’arrive pas à valider la souscription à l’offre Presse Libre à 1€?


Ca vient juste de revenir chez nous en dédié à roubaix


idem, retour d’un serveur…


Pareil chez nous.








t1nt1n a écrit :



Peste, choléra, toussa <img data-src=" />





OVH a ses défauts, mais c’est quand même largement au dessus de SFR <img data-src=" />







numerid a écrit :



Ah ah ! Je sors (le week-end passé) d’un grosse interruption de service <img data-src=" /> (je sais c’était ironique, pas ma panne cela dit).





Je compatis, ça a dû être horrible. Obligé de regarder la télé, voir pire, de sortir <img data-src=" /> <img data-src=" />







numerid a écrit :



C’est là qu’on voit qu’on est drôlement dépendant de tout ça quand même.





Clair.



Au pire, je pourrais faire du tethering, mais je suis chez free en mobile <img data-src=" />



en attendant, j’ai tenté de faire marcher zelda switch sur mon pc

avec une geforce 1080 malgré pas mal d’optimisations, tout le bins à jour

je tourne à 35fps et parfois le framerate descend à 15

quand j’utilise mon bout de bois par ex

quelqu’un a une idée ?


Les mails sont revenus, par contre mon VPS sur SGB est toujours down


Je n’ai pas de téléviseur ! Mais une bonne bibliothèque, c’est mieux.


A quand un mariage SFR / OVH ? Ca pourrait le faire !








numerid a écrit :



Je n’ai pas de téléviseur !





Comme quoi, les technologie dépassées sont parfois toujours utiles <img data-src=" />







numerid a écrit :



Mais une bonne bibliothèque, c’est mieux.





Ça va pas, la tête ! Tu veux finir instruit ? <img data-src=" />



Ca semble remonter au fur et a mesure… Nos site sont a nouveau up.


les groupes, parce que y’en a pas qu’un, doivent être testé régulièrement pour vérifier justement leur bon fonctionnement, il semblerait que ce ne soit pas le cas, car la probabilité de perdre 2 sources d’alimentations + les groupes est quand même extrêmement faible, donc soit c’est un vrai coup de pas de bol, soit ils ont pas fait les tests de bons fonctionnements des groupes ……&nbsp;


ça refonctionne pour moi.

Serveur à nouveau joignable, et dns de la ligne ovh à nouveau ok.



Perso je tolère la panne, c’est la première fois en plus de 67 ans chez eux que j’e n’ai donc eu que cette panne.

ça serait bien de savoir pourquoi les groupes électrogènes n’ont pas pris la relève quand même.


pour ceux qui ont des problèmes dns, mettez un dns public (comme google) temporairement &nbsp;: 8.8.8.8



&nbsp;


VPS pro a nouveau UP, VPS perso toujours innaccessible


“Tester c’est douter”. <img data-src=" />


Règle millénaire : ne jamais mettre tous ses oeufs dans le même panier.



Sans compter les paniers troués… <img data-src=" />


Ca y est c’est revenu chez moi <img data-src=" />


Les 2 alim électrique en rideau, les deux séries de groupes électrogène en vrac, le réseau optique en carafe, tout ça en même temps, ça commence a faire beaucoup pour une simple loi de Murphy …


c’est une triple panne, le mode nominal c’est 2 sources EDF différentes (autrement dit pas même réseau et pas même chaîne de production), la probabilité que ça tombe est déjà très faible, ensuite ils ont plusieurs groupes, donc si tous tombent en panne, c’est clairement qu’ils les testent pas, c’est pas possible autrement, ou bien ils ont un énorme soucis sur leur circuit d’alimentation.








oursgris a écrit :



en attendant, j’ai tenté de faire marcher zelda switch sur mon pc

avec une geforce 1080 malgré pas mal d’optimisations, tout le bins à jour

je tourne à 35fps et parfois le framerate descend à 15

quand j’utilise mon bout de bois par ex

quelqu’un a une idée ?





Essaie ça.



Tous les clients font ce genre de remarque. Il faut rester humble sur les protections misent en place (PCA / PRA). La question n’est pas si on va tomber en panne, mais quand. C’est simplement inévitable pour qui gère des serveurs.


je ne peux que plussoyer, je pense qu’ils négligent sévèrement la maintenance de leurs équipements et donc de leurs groupes électrogènes….


Effectivement, l’hébergeur en carafe ça peut poser quelques soucis pour accéder à un site oui <img data-src=" />


Il n’existe pas un système à la Tor où un site web ne peut pas “disparaître”&nbsp; si il y a une coupure EDF, une guerre avec les russes, un attentat, un astéroïde, les Goa’uld? Le nom c’est pas genre Zero? Pourquoi personne ne l’utilise? Si tout le monde l’utilisait (comme pour les Bitcoins), est-ce que ça marcherait?


C’est quoi le rapport avec les DNS ?



Quelque soit le chemin que tu prends, si ta destination n’est pas accessible, tu n’y accèderas pas.


Encore 1h a 2h pour ques tous les serveur soient up

“SBG: ERDF repared 1 line 20KV. the second is still down. All Gens are

UP. 2 routing rooms coming UP. SBG2 will be UP in 15-20min (boot time).

SBG1/SBG4: 1h-2h”


Moi aussi ça refonctionne. Cool !


On est en plein dans le fake news là <img data-src=" />


rien que pour ça, c’est une bonne nouvelle, finalement!


Voilà comment perdre une matinée à répondre aux clients pour leur dire que c’est une panne générale chez OVH et qu’il faut attendre :-|


Ouais bon les 2 pannes EDF, ils ont pas de chance. Pour les groupes électrogènes, c’est peut-être une panne du à pas de chance. Mais bon, de loin ça ressemble surtout à un défaut de préparation. Ca ne m’étonnerai même pas que les groupes électrogènes ne soient pas assez puissants pour backupé la perte des deux alimentations EDF.


Oui ce n’est pas comme si AWS n’était jamais tombé en panne.








Network a écrit :



Tous les clients font ce genre de remarque. Il faut rester humble sur les protections misent en place (PCA / PRA). La question n’est pas si on va tomber en panne, mais quand. C’est simplement inévitable pour qui gère des serveurs.





Enfin un raisonnement censé.

&nbsp;

Non parce que les cons c’est plutot ceux qui ont choisi de TOUT mettre chez OVH :)

ou chez AWS, d’ailleurs.



Je suis à chaque fois surpris de l’ampleur des réactions de débiles mentaux, sur un incident de ce type. Evidemment que c’est pénible, évidemment que ca impose des choix importants, mais un fournisseur, c’est une équation entre les besoins, le prix, les garanties. Et si ce fournisseur a été choisi, c’est qu’il a eu des arguments, à un moment donné <img data-src=" />

&nbsp;



Un peu mon neveu !

S’ils ne sont pas capables de mettre en marche leurs propres groupes électriques dans des temps acceptables … c’est limite une cause de changement immédiat de fournisseur.



Ca faire mal en terme d’impact de chiffre d’affaire cette bourde de ne jamais tester leur matériel.


Arf oui je me doute bien, cela dit il n’était pas précisé dans l’article si un partenaire ou un autre était impacté&nbsp;<img data-src=" />. Mais effectivement, depuis j’ai pu valider mon paiement sans plus de soucis&nbsp;<img data-src=" />


Oui mais si on sépare registrar et hébergement, quand la destination est en panne, on peut faire pointer sur une autre au besoin.


C’est bon, c’est rétabli. Hébergement ok, Kimsufi ok, Ovh Télécom ok …

Ils se sont bien rattrapés.

&nbsp;


wep, j’ai juste posté comme ça.


C’est bon, çà revient là….


Ils ont l’air réactif en tout cas. J’ai mon site chez eux et je peux y accéder.&nbsp;


Ils auraient subis une attaque similaire aux centrales électriques ukrainiennes ?

… un composant de commande à distance mal sécurisé ?



Voilà donc la root cause : c’est juste l’empire soviétique qui cherche à se venger d’une famille de polacks capitalistes.





… oups, je suis plus là :)


Pas tout …

mon site perso est revenu, mais au niveau pro sur d’autres sites, j’ai encore des foutus KO.


Mes sites sont revenus et mes serveurs ont été restauré (pas redémarré).


Lol calmé vous !

Oui il y a des protections, oui si on mets des systèmes de secours c’est pas pour rien, et oui les systèmes de secours ont des failles, oui ils sont testés, et oui parfois tout bug en même, la raison est simple : quand ton système de secours se mets en route il peut soit marcher soit pas marcher…. que tu sois en procédure de test ou en prod.

Toutes les actions sont mises ne placent pour réduire les risques, personnes n’ira crier qu’il n’y a aucun risque.



Maintenant avant de cracher sur OVH voyons si ils ont des procédure de test de leur système de backup, si oui est ce qu’il est bien appliqué…


S’il ne s’agit pas d’un sabotage délibéré, ces deux gigantesques pannes sont inadmissibles. A ce niveau là ça ne serait pas de l’incompétence ni de l’amateurisme mais du foutage de gueule pur et dur !

&nbsp;








numerid a écrit :



Oui mais si on sépare registrar et hébergement, quand la destination est en panne, on peut faire pointer sur une autre au besoin.





Et son registrar/gestionnaire DNS tombe en panne ? Impossible de basculer…



Dans cette config tu as un single point of failure qui est le registrar



Pour l’instant, je n’ai jamais eu de problème avec un registrar en panne, un serveur si.

Sinon le risque zéro n’existe pas.








OVB1C a écrit :



S’il ne s’agit pas d’un sabotage délibéré, ces deux gigantesques pannes sont inadmissibles. A ce niveau là ça ne serait pas de l’incompétence ni de l’amateurisme mais du foutage de gueule pur et dur !

&nbsp;





Il y a eu des pannes partout ces dernières années, Twitter, Facebook, AWS, etc. Tous ne sont pas aussi transparents qu’OVH sur les pannes. Bon après je suis pas hyper fan d’OVH car je trouve leur support extrêmement lenttttttttttt, mais le rapport qualité prix est correcte.



Pas mal la théorie du complot sérieusement..


Je crois qu’ils se sont posés la question d’une attaque justement. Mais il faudrait peut-être attendre que la panne soit résorbée, priorité, pour qu’on en sache plus non ? Une chose à la fois.



C’est facile de dire ce qu’il faut faire quand on n’a pas tous les éléments en main.


reviens demain t’es en avance….








numerid a écrit :



Pour l’instant, je n’ai jamais eu de problème avec un registrar en panne, un serveur si.

Sinon le risque zéro n’existe pas.





Peut-être que toi tu n’as pas eu ces pannes, mais comme tu dis le risque zéro n’existe pas. ;-)



Exemple de panne de DNS de grande ampleur :&nbsphttps://www.nextinpact.com/news/101871-dyn-on-fait-point-sur-attaque-ddos-qui-a-… de gros sites avaient été touchés.

&nbsp;



Toujours est que la communication faîte par Octave, on ne peut rien en redire. Il a essayé de tenir au courant un maximum de l’évolution de tout ce beau bordel.



Et perso, même si j’ai été impacté aussi bien en perso qu’en pro, je tiens à les saluer pour leurs rapidités de remise en service et leur souhaite bien du courage pour les prochaines heures ! :)


C’est revenu ? Tout le monde a fini de râler ?


Reviendu en partie. SBG1 & 4 toujours HS en partie, ils rebootent les servs.

Râler ? T’en demande trop aux gens là ^^


Je trouve ça pas si mal moi ! au moins ça a permis de tester vos propres plan B, en plus des plans B de OVH.



Ce que j’en dis c’est que ceux qui ralent le plus contre OVH, sont ceux qui ont des plans B un peu bancale <img data-src=" />


En en mettant pas tous les œufs dans le même panier, cela dit, on limite la casse. C’est surtout l’idée.


Ou ceux qui paient suffisamment cher le plan B OVH pour ne pas repayer en plus un plan B maison <img data-src=" />


Bien vu :-)


Idem pour moi, mon kimsufi fonctionne aussi.








uzak a écrit :



Ou ceux qui paient suffisamment cher le plan B OVH pour ne pas repayer en plus un plan B maison <img data-src=" />







Comme quoi mettre tous ses oeufs dans le même panier, même un joli panier tout solide et très cher, ce n’est jamais raisonnable :)



Quel rapport avec le cloud ? C’est surtout une question de logique, ne pas mettre tout ses oeufs dans le même panier (ou alors prévoir une solution de secours).


Vers 10:00 je n’avais plus d’internet OVH, car impossible de joindre leurs serveurs d’authentification, c’est revenu au bout de 30mn, bon courage les gars <img data-src=" />


les groupes électrogènes _gros_ nécessite un démarrage régulier, en général c’est mensuel/hebdo au moins 30 mm dans des charges. C’est surement fait chez OVH.



après la bascule automatique est rarement effectué si il n’y a pas de probleme, sur le plan ca fonctionne.&nbsp; J’ai deja vu un service ne sachant plus comment placer le groupe sur le réseau une foix démarrer <img data-src=" /> (bascule manuel). les onduleurs sont mort un par un, avec le groupe lancé mais pas de relève. finalement tous le monde c’est éteind petit à petit.



forcement avec le stress, les commerciaux et autre directeur commercial n’étaient d’aucune aide mais faisaient le plus de bruit …

&nbsp;

un grand moment


Les transfo 20kV c’est à EDF de faire de la maintenance préventive, de plus OVH teste assez souvent les groupes électrogènes.

Bon Gérard il faut trouver un fusible tu sais, bah ça sera toi <img data-src=" />


Pourtant, les groupes électrogènes semblent bien testés :https://www.youtube.com/watch?v=6-ne4mDDdMc



Et ça date de 2009, j’ose croire que leurs procédures de tests ont été encore améliorées depuis.








Vekin a écrit :



Aucun hébergeur n’est à l’abri de la panne, surtout si la loi de Murphy s’en mêle ;)





On d’accord là dessus. Cependant, ça semble plus régulier chez certains que d’autres ;)



comme disait Jacques Chirac : “Les emmerdes, ça vole toujours en escadrille”








Meptalon a écrit :



Comme quoi mettre tous ses oeufs dans le même panier, même un joli panier tout solide et très cher, ce n’est jamais raisonnable :)





Ça c’est ben vrrai !









Asgardcfr a écrit :



Les transfo 20kV c’est à EDF de faire de la maintenance préventive, de plus OVH teste assez souvent les groupes électrogènes. &nbsp;





Pas forcément, dans mon usine nous sommes responsable de nos transfo 20K et même du poste de livraison.



Les hébergeurs ne savent plus quoi inventer pour se faire de la publicité, franchement… <img data-src=" />


Croire que payer te mets à l’abris des problèmes est une ereure que tu vas payer un jour… Tu ne paye pas pour ne plus avoir de problèmes, mais pour en avoir le moins possible…

Si tu trouve que OVH est chere va chez quelqu’un d’autre… tiens AWS (surement plus chere d’ailleurs) ah merde ils ont déjà eu pas mal de soucis aussi ceux là …


Un routeur 4g en 3ème recours n’est pas de trop&nbsp;








EVoTk a écrit :



Pas forcément, dans mon usine nous sommes responsable de nos transfo 20K et même du poste de livraison.







Si c’est pas indiscret, quelle est la durée de ce type de transformateur ?

OVH a peut être été trop gourmand sur l’amortissement de ces 2 tranfos

:)









typhoon006 a écrit :



penser qu’OVH ne teste pas ses groupes c’est se mettre le doigt dans l’oeil.

Tu peux tester périodiquement ca veut pas dire que le jour où y’en a besoin ca va marcher







Fukushima, c’est ce qui leur est arrivé.



Sinon, mes lignes SIP fonctionnent, c’est l’essentiel. Mon Hubic, comme c’est de l’archivage, ça peut attendre.



Je voulais faire un site pour la distribution de mes écrits en passant chez eux pour ne pas être chez Google, ben… ça attendra.



C’est de nouveau en ligne apparemment.








Asgardcfr a écrit :



Si c’est pas indiscret, quelle est la durée de ce type de transformateur ?

OVH a peut être été trop gourmand sur l’amortissement de ces 2 tranfos

:)







En principe, un amortissement d’un outil de production, c’est 15 à 30 ans.



Par curiosité il est classé Tier combien ce datacenter ? I / II / III ou IV (bon IV je me doute bien que non xD)


ouais, enfin quand t’en as deux et qu’ils pètent bizarremen en même temps, y’a comme qui dirait baleine sous gravier.








Commentaire_supprime a écrit :



En principe, un amortissement d’un outil de production, c’est 15 à 30 ans.







Houlà… Ca dépend du domaine. Dans l’INdustrie par exemple, un tour/fraiseuse à commande numérique, c’est 10 ans max.<img data-src=" />



La durée d’amortissement n’a pas grand chose à voir avec la probabilité d’une panne.



L’amortissement c’est la constatation de la perte de valeur d’un investissement. Au début il vaut 100, à la fin 0. Mais ce n’est pas pour cela qu’il n’est plus utilisable.



Un véhicule s’amortit souvent sur 5 ans, ce n’est pas pour cela qu’on le met à la casse à cette échéance.








J@ckHerror a écrit :



Croire que payer te mets à l’abris des problèmes est une ereure que tu vas payer un jour… Tu ne paye pas pour ne plus avoir de problèmes, mais pour en avoir le moins possible…

Si tu trouve que OVH est chere va chez quelqu’un d’autre… tiens AWS (surement plus chere d’ailleurs) ah merde ils ont déjà eu pas mal de soucis aussi ceux là …





C’est bien ce que je dis :

Tu vas pas repayer en plus pour un plan B maison <img data-src=" />









brazomyna a écrit :



ouais, enfin quand t’en as deux et qu’ils pètent bizarremen en même temps, y’a comme qui dirait baleine sous gravier.





C’est le joint de culasse <img data-src=" />









Ricard a écrit :



Houlà… Ca dépend du domaine. Dans l’INdustrie par exemple, un tour/fraiseuse à commande numérique, c’est 10 ans max.<img data-src=" />







Merci pour ta précision. <img data-src=" /><img data-src=" /><img data-src=" /><img data-src=" /><img data-src=" />



Le chiffre que j’ai donné, c’est ce que je connais à partir de l’industrie des transports.



certains clients adslou fibre qui sont hébergés par ovh n’avaient plus accès aux dns


J’aime beaucoup le routeur qui RAZ sa config comme ça, pour le fun. Octave a pas voulu balancer le nom du constructeur, mais j’imagine qu’ils vont l’entendre <img data-src=" />


Ça dépend du domaine et de la société/du service je pense.

Chez nous, dans notre service (c’est une grande boîte), on fait de l’analyse physico-chimiques. Les appareils coûtent entre 50 et 1500 k€ (non, pas de 0 en trop !) et ont tous une durée d’amortissement de 8 ans.


Sans doute Cisco ou Juniper <img data-src=" />&nbsp;








plop97 a écrit :



Un routeur 4g en 3ème recours n’est pas de trop



C’est ce qui avait été fait sur l’ancien site où j’étais : 3 modems 3G (la 4G commencait à peine à arriver), qui permettaient un Internet à débit réduit si la ligne principale tombait, et permettaient des appels sur les mobiles à coût nul (appels mobiles illimités) aussi au passage : les 3 forfaits payés, en plus de service en secours, nous faisait économiser pas mal d’argent au passage <img data-src=" />



la màj de 15h qui apprend rien de neuf que ce qu’on savait à 9h ce matin&nbsp;








Bejarid a écrit :



J’aime beaucoup le routeur qui RAZ sa config comme ça, pour le fun. Octave a pas voulu balancer le nom du constructeur, mais j’imagine qu’ils vont l’entendre <img data-src=" />





cette partie la pue le piratage quand meme …



La même ! Entre 7h30 et 10h30!

Par contre ligne VOIP, OK.


Ben le problème est résolu, c’est pas une petite info quand même <img data-src=" />



OVH cent est bien tiré, ça n’a pas duré trop longtemps…


Non, les détails sur la cause de la coupure réseau précise, n’ont été données qu’en fin de matinée vers 11h….



Ovh vient de communiquer à nouveau sur la cause de la coupure de la laison fibre. Bien détaillé d’ailleurs.



Pour le problème sur strasbourg pour l’alimentation oui c’était connu dès 9h.








kantfredo a écrit :



cette partie la pue le piratage quand meme …





Pas nécessairement non…

On a déjà eu une perte de config sur un firewall Fortinet suite à une coupure de courant alors qu’il n’accédait pas à internet à ce moment là (côté positif pour nous : ça nous a permis de voir que nos process de remise en route/restauration étaient bons <img data-src=" /> )



Ça existe un plan B d’exchange?








WereWindle a écrit :



Pas nécessairement non…

On a déjà eu une perte de config sur un firewall Fortinet suite à une coupure de courant alors qu’il n’accédait pas à internet à ce moment là (côté positif pour nous : ça nous a permis de voir que nos process de remise en route/restauration étaient bons <img data-src=" /> )





sauf que la il sagi de toute les cartes qui se sont déprogrammées en même temps, pas juste une…



Et ils ont surtout travaillé au rétablissement de l’alimentation et donc des connexions. Reste plus qu’à trouver la cause de la panne. Chaque chose en son temps.


Ca fait quand même beaucoup de pannes simultanées, c’est louche… Perdre 2 lignes électriques en même temps, c’est peu courant, mais avoir en plus les GE de 2s alles qui tombent en rade dans la foulée… Murphy est très fort, et moi quelque peu paranoïaque… Accident fortuit ?


Plutôt composant commun sur le chemin des 2 routes d’alimentation qui n’a pas fonctionné et qui est pas redondé ou configuration de panne non prévue et qui fait que la configuration de secours n’était pas opérationnelle.



Il peut y avoir plein de raisons même si il faudra probablement du temps pour le déterminer


moi j’ai plus de mail depuis ce matin et ce n’est pas fini…








Jarodd a écrit :



OVH cent est bien tiré, ça n’a pas duré trop longtemps…





C’est toi qui le dix, un ! <img data-src=" />



Mince, c’est déjà fini ? En tout cas, ça a mis en panique pas mal de monde, on dirais.



Perso, je n’ai rien ressenti de l’onde de choc, peut-être étais-je trop éloigné de l’épicentre.


Il faut aussi compter sur l’effet domino où un événement quelque part entraine un effet de bord autre part <img data-src=" />


C’est vrai, mais n’oublions pas que ce sont deux incidents isolés, dans deux datacenters différents. Improbable, mais pas impossible.


oui, par exemple, cela fait des queues sur nos serveurs smtp de sortie(qui ont de quoi absorber) vers les destinataires ovh.


ou pas… réduction des coûts quand tu nous tiens…


non ce n’est pas encore fini pour tout le monde :(((


on pourra dire ça quand les serveurs seront tous up.

tu anticipes ..


Idem dans entre structure dont je m’occupe : les mails partent, mais n’arrivaient pas.



Et là il y a quelques minutes, certains commencent doucement à arriver.


Pour le réseau ils ont la panne. Enfin ils connaissent le bug, remonté à l’équipementier quoi…



Un bug de fou quand même… Après ils communiquent sur les changements qu’ils vont/sont en train de faire pour que ça ne puisse plus se reproduire avec un tel bug.



Reste à savoir pourquoi les groupes électrogènes n’ont pas pris la relève par contre…


D’ailleurs pour les groupes électrogènes, les deux tombent en défauts, ça sent le transfert de charge un peu trop barbare qui à surchargé quelques instants les groupes…

C’était arrivé dans un DC où on avait installé des groupes froids, dés la reprise d’alim les groupes froids redémarraient et ça entraîne un pic d’une demi seconde en intensité, suffisant pour tuer les groupes faut croire (coup de bol ils faisaient un test en plein été c’était pas sur un DC en prod)


c’est peut-être le moment de jouer au LOTO pour le personnel d’OVH <img data-src=" />


Ué enfin les serveurs de nos clients sont toujours pas revenu, et 1 journée entière ca commence à être vraiment gênant !


Redémarrer un serveur depuis l’interface OVH peut le faire apparaître, ça a fonctionné pour moi.



J’en ai encore un qui ne vient pas par contre.








oursgris a écrit :



on pourra dire ça quand les serveurs seront tous up.

tu anticipes ..







&nbsp;







CreaYouz a écrit :



Ué enfin les serveurs de nos clients sont toujours pas revenu, et 1 journée entière ca commence à être vraiment gênant !





Si j’en crois l’actu :

&nbsp;



L’alimentation a été rétablie

(…)

Nous avons remis le backup de la configuration software dès que nous

avons diagnostiqué l’origine du problème et le DC est à nouveau

joignable





Donc le problème est résolu, mais les conséquences de la panne se font encore sentir. Ca ne repartira pas en un claquement de doigt, ce n’est pas juste un câble ethernet à rebrancher.



Pour râler s’adresser directement à Oles <img data-src=" />



Source ?








psn00ps a écrit :



Source ?







il n’y a qu’a regarder le fil twitter du mec, ça pue la merde quand même



OVH qui fait encore des siennes, à force de faire du bricolage de merde dans ses datacenters ça finit toujours par leur retomber sur la gueule. C’est le Dia de l’hébergement, tout est fait pour que ça coûte le moins possible.


Perso j’en ai 22 qui sont down, et quand je tente un reboot ca me dit:

“An error occurred on requesting to reboot. (Your VPS area is under maintenance, please come back later)”



Ca fait 10h depuis le début de la panne, ca commence à faire long..



Edit: je précise que c’est rien de critique etc, donc non j’ai pas de redondance/failover sur du AWS. Ils annoncent un SLA de 99.95% sur les VPS SSD, c’est mal barré….


Je confirme que j’ai des sites sur Dédié qui sont revenus en début d’après-midi mais ceux sur VPS sont toujours down…



&nbsp;On va atteindre les 10h de down, c’est du jamais vu. Je suis content d’avoir quelques billes côté Online aussi histoire de ne pas tout avoir perdu.


Pas d’accord. Dans les réponses, je vois juste des gens qui crient sans savoir.

Une info se vérifie.








psn00ps a écrit :



Pas d’accord. Dans les réponses, je vois juste des gens qui crient sans savoir.

Une info se vérifie.







justement le mec n’a aucune source, prétendre que ça vient des clients et d’un tech et tout le reste de ses publication sont du même accabit









Jarodd a écrit :



&nbsp;





Si j’en crois l’actu :

&nbsp;





Donc le problème est résolu, mais les conséquences de la panne se font encore sentir. Ca ne repartira pas en un claquement de doigt, ce n’est pas juste un câble ethernet à rebrancher.



Pour râler s’adresser directement à Oles <img data-src=" />





certes mais ça fait une belle jambe

si y a l’elec mais que tu n’as pas les serveurs parce qu’ils font des check filesystem etc.



Lol, ou comment voir la malveillance partout <img data-src=" /> C’est extrêmement peu probable ^^


Ppareil, j’ai appris qu’il y avait une panne en lisant la niouze (donc il y a 20 minutes :p)








loicblutz a écrit :



Ca fait quand même beaucoup de pannes simultanées, c’est louche… Perdre 2 lignes électriques en même temps, c’est peu courant, mais avoir en plus les GE de 2s alles qui tombent en rade dans la foulée… Murphy est très fort, et moi quelque peu paranoïaque… Accident fortuit ?











Bejarid a écrit :



Lol, ou comment voir la malveillance partout <img data-src=" /> C’est extrêmement peu probable ^^











Vekin a écrit :



C’est vrai, mais n’oublions pas que ce sont deux incidents isolés, dans deux datacenters différents. Improbable, mais pas impossible.







Les choses improbables arrivent.



N’oublions pas que c’est du matériel à la fois complexe et soumis à une charge de fonctionnement énorme, deux faits qui, per se, facilitent la grosse panne catastrophique.









_Quentin_ a écrit :



Perso j’en ai 22 qui sont down, et quand je tente un reboot ca me dit:

“An error occurred on requesting to reboot. (Your VPS area is under maintenance, please come back later)”



Ca fait 10h depuis le début de la panne, ca commence à faire long..



Edit: je précise que c’est rien de critique etc, donc non j’ai pas de redondance/failover sur du AWS. Ils annoncent un SLA de 99.95% sur les VPS SSD, c’est mal barré….







99,95% d’uptime ca fait 4h23 de coupure par an.









chantoine a écrit :



La durée d’amortissement n’a pas grand chose à voir avec la probabilité d’une panne.



L’amortissement c’est la constatation de la perte de valeur d’un investissement. Au début il vaut 100, à la fin 0. Mais ce n’est pas pour cela qu’il n’est plus utilisable.



Un véhicule s’amortit souvent sur 5 ans, ce n’est pas pour cela qu’on le met à la casse à cette échéance.







C’est pas ce que j’ai dit. Un tour/fraiseuse classique c’est pas le même amortissement qu’un tour numérique. Le taux d’amortissement n’est pas le même, même si le prix d’achat l’est.



Ou l’art de ne pas mettre tous ses oeufs dans le même panier.



<img data-src=" />


idem pour moi,1 KS1 et un KS5 : RAS


sympa le lien, merci <img data-src=" />


en lisant les commentaires ci dessus, je compatis, je n’ose pas imaginer le foutoir que ça va vous met dans les pattes et le temps que ça va prendre pour tout remettre en place <img data-src=" />



bon courage ! <img data-src=" />


OVH c’est pas la première fois, la dernière fois c’était dû à la rupture d’une conduite d’eau !



Je

vais finir par croire qu’Oscar Baklava héberge ses serveurs dans les

égouts, &nbsp;avec deux Roumains qui pédalent pour alimenter en courant

électrique…








boogieplayer a écrit :



ça fait plus de 15 ans que j’utilise OVH pour mes clients. C’est la première fois que j’ai un site web down à cause d’eux. Donc bon…





ou tu vérifies pas les sites de tes clients .. non car vendredi dernier un bon paquet de site webs étaient “inaccessible”&nbsp; bien que UP , mais car leur serveur de certificats était down 4-5h.



Entre les mails et la téléphonie, je trouve qu’il y a beaucoup trop de pannes chez OVH de façon récurrente, ces 2 dernières années



If something can go wrong…


Ton SLA se compte aussi sur la journée, et on a largement dépassé les minutes de coupures, et ce n’est pas la première fois cette année pour nombreux clients



&nbsp;Je trouve qu’une panne de cette ampleur est inacceptable .



4 Groupes électrogenes en panne au même moment ? ça n’a jamais été mis en route depuis qu’ils les ont .

2 lignes EDF coupées

1 backbone optique HS provoquant des problèmes supplémentaire.



On parle pas d’une boite qui perd son VPS pendant 4h . Mais l’impact de TOUS les services d’oVH ( les kimsufi n’étant pas sur les même datacenters ) , mails téléphonie adsl sites e-commerce, même si certains fonctionnait plus ou moins bien d’autres étaient totalement coupés


Pour rajouter même sur le site d’OVH garantie un SLA journalier pour certains services



https://www.ovh.com/fr/private-cloud/services_inclus/securite-et-sla.xml



https://www.ovh.com/fr/serveurs_dedies/sla.xml?range=ENT



la SLA n’est pas qu’annuel .. là il s’agit d’une panne pour beaucoup de clients de 5h , pour ta journée SLA ou le mois c’est raté les 99%


ça va tranquille, pas trop raciste ?


J’informais juste, pour ceux qui ne savent pas ce que représente 99.95% sur un an, que ca représente quand même des heures. Bien entendu, c’est si le SLA est signé sur l’année.



Sinon, un scénario catastrophe, ça arrive. Franchement, je pense qu’OVH n’est pas une boite à faire les choses à moitié, en tout cas, dans la volonté. OVH se serait bien passé de ce qui leur arrive. Après, c’est de la prod, et ca tombe, shit happens…



Ensuite, les boites qui ont toute leur prod sur 1 DC, chez 1 provider, bah faut pas être devin pour savoir que si le DC tombe, le service tombe. Ces boites pas, sont au mieux, comme OVH. On critique le fait que OVH ne teste pas sa redondance. Bah les boites qui ont tout dans 1 DC n’ont même pas de redondance…



Pour finir, les SLA, c’est de la paperasse pour avocat. Un SLA de 100% n’a jamais fait tourner un service à 100% du temps. C’est juste que quand ca tombe, les pénalités tombent. Maintenant, à combien sont ces pénalités, c’est ca la question.



En tout cas, petite pensé pour les tech sur place qui ont du faire journée double pour tout relancer.


Ca va trés bien ! Et toi de me parler de racisme alors que tu ne connais même pas mes origines !<img data-src=" />


Je remonte les threads par la fin, et la je suis 100% d’accord avec toi sur ce point. Y a des services OVH, ca craint vraiment.



J’ai un VPS il perd le réseau plusieurs fois par heure.



droprate sur 1 semaine pour 2 serveurs que j’ai chez OVH:https://ibb.co/eBtuvw








novaescorpion a écrit :



Ca va trés bien ! Et toi de me parler de racisme alors que tu ne connais même pas mes origines !<img data-src=" />







T’es en train de dire que tes origines ethniques te donne le droit d’être raciste?









Elwyns a écrit :



ou tu vérifies pas les sites de tes clients .. non car vendredi dernier un bon paquet de site webs étaient “inaccessible”  bien que UP , mais car leur serveur de certificats était down 4-5h.



Entre les mails et la téléphonie, je trouve qu’il y a beaucoup trop de pannes chez OVH de façon récurrente, ces 2 dernières années







Mon pauvre ami, je ne voudrai pas être désagréable. Mais qu’est-ce que t’en sais ? Tu ne connais pas mes sociétés, tu ne connais pas nos process interne, tu ne connais pas mes clients, tu ne sais rien et pourtant tu assures sans rien savoir que je ne vérifies pas les sites de mes clients.



J’ai des sites ultra critiques chez OVH ou Online, en france et ailleurs dans le monde. Chez OVH comme chez online le taux de problème est à peu près égal à zéro. Compte tenu que ce que ça me coûterai en SLA crois moi que j’en suis absolument certain.



Un SLA, c’est comme une GTR : ça ne garantit pas que ça marchera à coup sûr, c’est juste un contrat d’assurance. Si ça ne marche pas comme promis, on indemnise. Et il me semble qu’Oles a déjà dit que les clients seraient indemnisés. Bon, si c’est indemnisé comme une GTR, là ça risque de donner droit à une semaine d’abonnement gratuite <img data-src=" />&nbsp;

&nbsp;








Asgardcfr a écrit :



Si c’est pas indiscret, quelle est la durée de ce type de transformateur ?

OVH a peut être été trop gourmand sur l’amortissement de ces 2 tranfos

:)





Facilement une 40aines d’années. Ce sont des éléments qui demande peu d’entretien. Malgré tout, normalement il doit être surveillé(les cellules 20kv sont inspectées 1 fois par an a la caméra thermique chez nous, on peut aussi par exemple analysé l’huile de refroidissement, qui suivant sont contenu est un bon indicateur sur la santé du transformateur ), par contre s’il est surchargé il peu se dégradé très vite.





<img data-src=" />

J’ai beau le prendre par tous les bouts, je ne vois vraiment pas comment ton origine pourrait te rendre incompatible avec un quelconque racisme.

<img data-src=" />


S’il est roumain, c’est plus du racisme mais de l’autodérision ^^



D’ailleurs, en quoi c’est du racisme ce qu’il a dit ? Envers les blancs, arabes, noirs, jaunes d’accord mais roumains ?

Après si vous êtes bornés à tel point que vous n’acceptez plus aucun humour (aussi bon qu’il soit) faisant intervenir des peuples d’origines différentes… Ptêt ben que les racistes, c’est vous :)


Le point de départ c’était de dire que les roumains ne sont pas bons au tour de France et que O.K. vit dans les égouts; c’est au moins du bon dénigrement.



Après j’ai pas imaginé un novaescorpion roumain en effet.

<img data-src=" />


Sympa la vidéo!



Par contre en prenant les chiffres donnés, il y a un truc qui m’échappe:

1600L/h, il faut un camion citerne pour tenir une journée donc?

8MW max pour cette conso, ça fait un assez bon rendement:

0.2L de fioul détaxé pour 1kWh, alors que EDF nous vend 0.15E le kWh.

Bon, je pense bien qu’ils ont pas le contrat EDF d’un particulier….


C’est ton compte Twitter ? <img data-src=" />


Le téléphone, La poste et pour les PJ allons sur WeTransfert … :p


Si tu as ce genre de problème de manière récurrente, à toi de contacter le support pour leur expliquer et qu’ils règlent ton problème. Ils ne sont sans doute pas au courant de ce qui t’arrive !



OVH a un très bon support, je les ai très souvent contacté et généralement, on a des gens très compétents qui interviennent vite et efficacement.








Jarodd a écrit :



Trainline (ex-Capitaine Train) est en carafe aussi.



Je suis bien content d’avoir mis mes billets en PDF sur le téléphone, plutôt que compter exclusivement sur l’appli pour faire valider mes billets au controleur… Dans le cas contraire, je me demande si on peut envoyer l’amende à OVH ? <img data-src=" />





Avec votre nom et prénom, le contrôleur peut vérifier votre billet ;)



Ce n’est pas ce que j’ai dit non plus.



Quel que soit le taux d’amortissement, cela ne préjuge en rien de l’utilisabilité d’un bien une fois amorti.



Si je reprends mon véhicule, s’il a fait 250.000 kms en 5 ans, est usé jusqu’à la corde par manque d’entretien, il a (en plus de sa valeur comptable 0) effectivement une valeur d’usage de 0, et partira à la casse pour être remplacé. S’il a peu de kms et est bien entretenu, il pourra être utilisé encore 5 ans de plus.



La durée d’amortissement de ses groupes par OVH ne détermine pas leur fiabilité lors d’une panne, ni ne détermine la date de leur remplacement.








chantoine a écrit :



Ce n’est pas ce que j’ai dit non plus.



Quel que soit le taux d’amortissement, cela ne préjuge en rien de l’utilisabilité d’un bien une fois amorti.



Si je reprends mon véhicule, s’il a fait 250.000 kms en 5 ans, est usé jusqu’à la corde par manque d’entretien, il a (en plus de sa valeur comptable 0) effectivement une valeur d’usage de 0, et partira à la casse pour être remplacé. S’il a peu de kms et est bien entretenu, il pourra être utilisé encore 5 ans de plus.



La durée d’amortissement de ses groupes par OVH ne détermine pas leur fiabilité lors d’une panne, ni ne détermine la date de leur remplacement.





Oui ben c’est pas ce que j’ai dit non plus.<img data-src=" />



Bah le sujet portait sur la “durée d’amortissement” d’un bien.



Il fallait parler de planning de remplacement du matériel, voilà tout <img data-src=" />


Habituellement quand NX poste un nouvel article qui parle d’une panne, par exemple chez SFR, la justification de la panne est floue, ou complètement absente. Là ça fait plaisir de voir que les personnes qui s’occupent de la comm’ sont aussi des personnes qui connaissent le taf.

Bon en même temps, si je ne dis pas de bétises, là ce n’est pas de leur faute.. donc c’est toujours plus simple de donner les causes d’un problèmes quand ce n’est pas un employé de la boite qui est responsable. =‘)


OVH a communiqué en détails :



“Le problème est qu’en déployant SBG1 avec la technologie basée sur les containers maritimes, nous n’avons pas préparé le site au large scale. Nous avons fait 2 erreurs :





  1. nous n’avons pas remis le site SBG aux normes internes qui prévoient 2 arrivées électriques indépendantes de 20KV, comme tous nos sites de DCs qui possèdent plusieurs doubles arrivées électriques. Il s’agit d’un investissement important d’environ 2 à 3 millions d’euros par arrivée électrique, mais nous estimons que cela fait partie de notre norme interne.



  2. nous avons construit le réseau électrique de SBG2 en le posant sur le réseau électrique de SBG1, au lieu de les rendre indépendant l’un de l’autre, comme dans tous nos datacentres. Chez OVH, chaque numéro de datacentre veut dire que le réseau électrique est indépendant d’un autre datacentre. Partout sauf sur le site de SBG.”



    “Même si l’incident de ce matin a été causé par un automate tiers, nous ne pouvons nous dédouaner de la responsabilité de la panne. A cause du déploiement initial basé sur les containers maritimes, nous avons un historique à rattraper sur SBG pour atteindre le même niveau de normes que sur les autres sites d’OVH.



    Cet après-midi, nous avons décidé du plan d’actions suivant :

  3. la mise en place de la 2ème arrivée électrique, totalement séparée, de 20MVA ;

  4. la séparation du réseau électrique de SBG2 vis-à-vis de SBG1/SBG4, ainsi que la séparation du futur SBG3 vis-à-vis de SBG2 et SBG1/SBG4;

  5. la migration des clients de SBG1/SBG4 vers SBG3 ;

  6. la fermeture de SBG1/SBG4 et la désinstallation des containers maritimes.



    Il s’agit d’un plan d’investissement de 4-5 millions d’euros, que nous mettons en route dès demain, et qui, nous l’espérons, nous permettra de restaurer la confiance de nos clients envers SBG et plus largement OVH.”



    OVH reconnait clairement avoir fait des erreurs, je trouve cela assez honnête.



    Source : http://travaux.ovh.net/?do=details&id=28247








Elwyns a écrit :



2 lignes EDF coupées

1 backbone optique HS provoquant des problèmes supplémentaire.





En quoi OVH est responsable des problèmes d’EDF ?

En quoi OVH est responsable des problèmes engendrés par la construction de son matériel ?



Il y a des gens qui ont des services web sur des kimsufi ou assimilés ? Ça tien comment la charge s’il vous plait ? (quand ça marche <img data-src=" /> )


Il y a encore des gens qui vont trouver qu’ils sont incompétents. Là, moi je dis “chapeau”.


Ben j’ai été un temps hébergée chez kimsufi. Pour simplifier, des fois ça tombait en marche… mais j’ai des potes qui en sont très satisfaits.








numerid a écrit :



Ben j’ai été un temps hébergée chez kimsufi. Pour simplifier, des fois ça tombait en marche… mais j’ai des potes qui en sont très satisfaits.







Rassurant <img data-src=" />

Il y a quoi de mieux dans la meme fourchette de prix (30/40€) ?









Jarod79 a écrit :



Cet après-midi, nous avons décidé du plan d’actions suivant :




  1. la mise en place de la 2ème arrivée électrique, totalement séparée, de 20MVA ;

  2. la séparation du réseau électrique de SBG2 vis-à-vis de SBG1/SBG4, ainsi que la séparation du futur SBG3 vis-à-vis de SBG2 et SBG1/SBG4;

  3. la migration des clients de SBG1/SBG4 vers SBG3 ;

  4. la fermeture de SBG1/SBG4 et la désinstallation des containers maritimes.



    Il s’agit d’un plan d’investissement de 4-5 millions d’euros, que nous mettons en route dès demain, et qui, nous l’espérons, nous permettra de restaurer la confiance de nos clients envers SBG et plus largement OVH.”



    OVH reconnait clairement avoir fait des erreurs, je trouve cela assez honnête.



    Source : http://travaux.ovh.net/?do=details&id=28247





    et ils mettent les moyens ..

    j’ai tapé les 18h de panne sur un serveur (après j’ai dormi), c’est rassurant.









Elwyns a écrit :



2 lignes EDF coupées&nbsp;

1 backbone optique HS provoquant des problèmes supplémentaire.



En quoi OVH est responsable des problèmes d’EDF ?&nbsp;En quoi OVH est responsable des problèmes engendrés par la construction de son matériel ?

&nbsp;

&nbsp;- Quand tu gères des Datacenters, tu t’assures que les coupures du réseau 20 Kv ne puissent pas t’impacter à ce point. Et effectivement&nbsp; vu les décisions annoncés ils ont du boulot …&nbsp;









Jarod79 a écrit :



OVH reconnait clairement avoir fait des erreurs, je trouve cela assez honnête.





+1







numerid a écrit :



En quoi OVH est responsable des problèmes d’EDF ?

En quoi OVH est responsable des problèmes engendrés par la construction de son matériel ?





OVH est responsable de proposer une prestation et une garantie de disponibilité à ses clients ; c’est à eux de mettre en oeuvre les moyens adéquats (y compris les moyens de parer à une défaillance d’un de leur fournisseur) pour que ce qu’ils ont vendu à leurs clients soit respecté.



Si je suis client chez eux, je me fous de savoir qu’ils sous traitent la fourniture d’énergie à EDF ou qu’ils ont embauché des indiens qui pédalent dans un sous-sol, que leurs routeurs sont des cisco ou des tartampion, ou que Micheline de la compta elle est en congé maternité en ce moment. Je juge sur le résultat qui va en face du contrat qu’on a signé ensemble au regard des engagements qu’ils ont pris.



Si demain ta bagnole qui a 3 mois tombe en rade et que quand tu va voir le concessionnaire qui te l’a vendue, il t’explique que “caypamafot’ cay à cause de notre sous-traitant chinois qui a produit des pièces de mayrde”, j’ai comme un doute sur le fait que tu trouverais ça parfaitement normal.



Gros malin, comment on sait qu’un truc improbable va arriver ?&nbsp; C’est tout de même ce qui s’est passé non notamment avec le blackbone et, soit dit en passant, ils ont réglé le problème en un temps record ?



J’adore ces gens parfaits qui savent tout, qui règlent tous les pépins les doigts dans le nez en quelques secondes.








brazomyna a écrit :



Si demain ta bagnole qui a 3 mois tombe en rade et que quand tu va voir le concessionnaire qui te l’a vendue, il t’explique que “caypamafot’ cay à cause de notre sous-traitant chinois qui a produit des pièces de mayrde”, j’ai comme un doute sur le fait que tu trouverais ça parfaitement normal.





On m’a fait le coup pour un ordinateur de marque Apple.



Sinon, s’ils ont une responsabilité, qu’ils ne nient pas c’est effectivement cette histoire de groupe électrogène qui n’a pas tenu. Mais ils ne sont aucunement responsables du fait du prince (défaillance électrique et bug du blackbone).



Proposez vos services à OVH, je suis sûre qu’ils adoreront embaucher quelqu’un qui soit aussi capable que vous de régler tous les problèmes facilement avant même qu’ils arrivent.









Cashiderme a écrit :



Il y a des gens qui ont des services web sur des kimsufi ou assimilés ? Ça tien comment la charge s’il vous plait ? (quand ça marche <img data-src=" /> )





J’ai eu des dédiés Kimsufi pendant quelques années; j’en ai un en ce moment. Jamais eu de problème, sauf le jour où un disque dur est mort; de mémoire, il a fallu 2-3 jours pour le changer (et évidemment tout réinstaller, pas de RAID sur les Kimsufi).



Au sujet des disques durs, ce ne sont pas des patraques. Dans mon cas actuellement, un Hitachi entreprise. Je n’ai plus son âge en tête, mais assez récent. Donc heureusement les disques ne tombent pas trop souvent en panne.



Sur le débit, c’est du 100Mb/s “non garanti”; concrètement, la dernière fois que j’ai testé, j’avais environ 50Mb/s en débit montant.



Bref, je considère que j’en ai pour mon argent: c’est bien pour des services non critiques, et si tu n’as jamais besoin du support. Je n’ai pas l’impression qu’ils surveillent grand chose non plus (si ma mémoire est bonne, c’est moi qui leur ai signalé que le disque dur était en train de crever).



Pour un budget à partir de 38€/mois TTC, je te conseille plutôt les dédiés Soyoustart. Le RAID en +, ça permet de dormir plus tranquille; je suis en train de migrer là-bas.



Ca a l’air interessant Soyoustart en effet. Mais c’est un marque OVH aussi, Pas sure que ça ne soit pas le meme service au final. Merci pour les réponses.


Et OVH respecte sa part du contrat en proposant la meilleure prestation

possible compte tenu du budget allouée à cette prestation.

Si tu estimes ne pas en avoir pour ton argent, libre à toi de trouver meilleur prestation pour le même prix.



Si tu es client chez eux, c’est que tu as pris en compte la classe de leur datacenters, leur SLA, leur tarif, etc

Certes tu te fous de savoir quels moyens ils mettent en oeuvre pour répondre au besoin, mais il est illusoire de penser que tu auras une Ferrari pour le prix d’une Clio



En effet, ca sera pas normal, mais ca ne s’arrêtera pas là vu que tu vas exiger la réparation et que tu l’obtiendras.

Et la différence majeure est que OVH ne se dédouane pas en disant “GFY c’est pas nous”, ils communiquent clairement en disant que c’est un composant de leur infra qui vient d’une entreprise tiers et qu’ils sont en communication avec lui pour résoudre le problème.


jamais eu de soucis avec mon kimsuffi, quant à la charge tout dépend de la config choisi, comme n’importe quel serveur :)


Moi je suis chez digitalocean. Pour $13.60 par mois, j’ai un serveur unique avec une adresse IP unique, une Ubuntu16 LTS avec accès root ssh de 30 Go + un volume supplémentaire de 50Go.

Un serveur avec accès root: c’est sur il faut savoir tout installer à la main… monter un serveur web, savoir ajouter de la swap, installer un firewall + protection type fail2ban, etc…

&nbsp;

Mais c’est pas cher, ultra rapide avec des DD SSD. C’est même plus rapide que sur ma machine locale:

Machine locale: &lt;!–Page generated in 0.18671 seconds.–&gt;

Digitalocean: &lt;!–Page generated in 0.02117 seconds.–&gt;



Je ne comprends pas une telle différence Machine locale / Serveur digitalocean, j’ai moi aussi un disque SSD !&nbsp;



Alors oui ce ne sont pas des français, c’est chez les américains. Mais c’est quand même bien moins cher et super efficace et rapide.


&nbsp;fjarp&nbsp;Gros malin, comment on sait qu’un truc improbable va arriver ?&nbsp; C’est tout de même ce qui s’est passé non notamment avec le blackbone et, soit dit en passant, ils ont réglé le problème en un temps record ?&nbsp;J’adore ces gens parfaits qui savent tout, qui règlent tous les pépins les doigts dans le nez en quelques secondes.

&nbsp;——————



&nbsp;Désolé, mais c’est typiquement une architecture utilisée sur pas mal d’installation ‘sensible’ ( hôpitaux, etc…) avec les basculement de source d’alimentation effectuée de manière transparente pour les utilisateurs. D’ailleurs ils reconnaissent&nbsp;qu’il doivent mettre à jour leur installation ….&nbsp;


Quel processeur ?

Combien de mémoire ?

Quelle bande passante, garantie ou non ?

«Pas cher» par rapport à quoi ?

C’est un serveur dédié ou un machine virtuelle ?


Au hasard … Cisco ? Déjà vu cette crasse chez eux.


La dernière panne concernait le service S3 et uniquement sur une partie des USA. Avec un ELB chez Amazon, on peut héberger&nbsp; des instances sur différentes AZ, donc différents DC. Et avoir un service toujours dispo si une panne survient sur un service d’une AZ en particulier.


J’ai pris le serveur à 10$ par mois pour l’instant, pas besoin de plus :

&nbsp;1 GB de ram

&nbsp;1 vCPU (Vitual CPU)

&nbsp;30 GB de DD SSD

&nbsp;2 TB de transfert bande passante






  • &nbsp;Volume supplémentaire pour 3$ par mois de 50GB.



    Pour le CPU, je ne sais pas quelle est sa puissance, par contre j’ai fais des tests sur un script PHP de génération de fichier jpg à la volet qui assemble 10 fichiers png ou jpg.

    En local, ça génère le fichier en 0.29096 sec et sur le serveur en 0.49391sec et cela me suffit niveau puissance puisque de toute façon j’utilise le système de cache de nginx pour ne pas régénérer une image qui a été déjà générée.



    Et puis, si niveau puissance ça suffit pas, je peut l’augmenter, comme je peux augmenter la taille du volume supplémentaire. C’est ce qui me plait le plus, c’est ultra souple et on n’a l’impression de ne payer que ce que l’on utilise.

    &nbsp;

    Garantie ou non ?&nbsp; Vous me faites rire là. Dans l’informatique R.I.E.N n’est garantie. Pour preuve, on ne peut pas se retourner contre OVH ou contre Microsoft ou Digitalocean ou qui que ce soit en cas de perte de données et de clients.



    Un prestataire informatique ne garanti jamais ses outils ou solutions. J’imagine bien Airbus faire un procès à Microsoft : Votre système a planté sur une machine qui contenait 1 mois de travail de 10 ingénieurs cadres qui nous coute 10k€/mois. Vous nous devez 100k€.


1 giga de RAM, c’est plutôt léger.

Pour le moment le moins chez est encore français et la bande passante n’est pas limitée.

https://www.scaleway.com/


Pour la RAM ce n’est pas bien grave, déjà je n’utilisa pas encore toute ne RAM et ensuite, en cas de gros afflux sur le site, j’ai ajouté 4G de swap.








numerid a écrit :



Proposez vos services à OVH, je suis sûre qu’ils adoreront embaucher quelqu’un qui soit aussi capable que vous de régler tous les problèmes facilement avant même qu’ils arrivent.





Je bosse dans l’IT pour la finance ; de par les enjeux financiers, tu comprendras que c’est une problématique qui fait partie intégrante de mon métier.



D’une façon générale, on n’empêche pas les problème d’arriver, on évalue en amont tout ce qui pourrait se passer comme choses imprévues ou improbables, et en fonction de l’évaluation du risque et de l’impact, on met en place les moyens de les contourner quand ils arrivent et des procédures/moyens pour résoudre le souci au mieux.



Après, on choisit (ou pas) de mettre les moyens en face de tel ou tel risque et évidemment le nerf de la guerre ce sont les coûts induits par chacun de ces choix. Dans ma branche, on est dans une situation extrême, et on a de la redondance jusqu’au point d’assurer la continuité de service même si plusieurs bombes atomiques tombent (aux mauvais endroits) sur le territoire Européen. Parce-que l’enjeu concerne des montant qui avoisinnent le PIB d’un Etat.



OVH n’est évidemment pas dans ce cas extrême, mais il reste dans un cas intermédiaire, car en tant que 4ème hébergeur mondial, une défaillance majeure n’est pas neutre pour lui (et ses clients) non plus.



Non, ça arrive. C’est pas censé se produire, mais ça arrive.



Dans un de mes précédents boulots où quand un routeur comme ça qui, quand il plantait, il faillait copier/coller un script dans le terminal pour recharger sa config à la RACHE (ça a été comme ça pendant 1 an ou 2, et le routeur n’a pas été remplacé parce que le produit qui l’utilisait était en fin de vie). Bon, c’était un petit routeur aussi… Mais quand je vois l’un des commentaires plus haut qui dit qu’il a déjà vu ça chez Cisco, je plussoie !


Ne jamais ARRACHER un routeur, surtout s’il est petit <img data-src=" />


de son matériel ? ( à EDF ? )



selon le communiqué, OVH reconnait sa faute entière car il s’agit d’une panne non seulement d’EDF donc prestataire tiers ( et encore c’est le réseau de distribution de strasbourg ) mais surtout de la conception des datacenters en prototype de datacenter en container maritime , dont ils n’ont pas fait de backup de ligne électrique, il y avait bien 2 lignes, mais c’était 2 lignes d’arrivées non backup, etc etc y a le communiqué assez long


ils sont&nbsp; pas responsable d’EDF ( et j’ai pas dit qu’ils l’étaient n’allez pas penser ce que je pense derrière mes propos à ma place&nbsp; mais des défaillances dans le schéma de backup, et des 4 groupes élect


Oups désolé ! j’avais oublié le credo : On peut rigoler de tout mais pas avec tout le monde ! <img data-src=" />


Et comment tu lui montres ton billet si l’appli est indisponible ?








brazomyna a écrit :



Je bosse dans l’IT pour la finance ; de par les enjeux financiers, tu comprendras que c’est une problématique qui fait partie intégrante de mon métier.





J’ai arrêté de lire à partir du mot finances.



&nbsp;S’il y a bien un domaine où on fait n’importe quoi, où on perdre des milliards en 5 minutes, où on ne se remet jamais en question, où on est responsable de crises mondiales sans jamais en tirer des leçons et où on se fiche du client normal, c’est bien la finance.



Quelqu’un qui bosse dans ou pour la finance n’a pas de leçons à donner à quiconque.









PtiDidi a écrit :



Et OVH respecte sa part du contrat en proposant la meilleure prestation

possible compte tenu du budget allouée à cette prestation.

Si tu estimes ne pas en avoir pour ton argent, libre à toi de trouver meilleur prestation pour le même prix.



Si tu es client chez eux, c’est que tu as pris en compte la classe de leur datacenters, leur SLA, leur tarif, etc

Certes tu te fous de savoir quels moyens ils mettent en oeuvre pour répondre au besoin, mais il est illusoire de penser que tu auras une Ferrari pour le prix d’une Clio&nbsp;



le soucis ici c’est qu’il y a vraisemblablement une différence de qualité entre les datacenters STG1+4 face aux autres. à l’ouverture de la ligne, tu as le choix entre Roubaix Strasbourg etc. mais tu ne peux ni choisir la salle, et tu n’es pas au courant de cette différence de traitement

à l’avenir perso je ne commanderai pas sur Strasbourg à nouveau avant qu’il fasse les travaux.

encore une fois si ils avaient présenté Strasbourg comme une salle de moindre qualité que Roubaix cela ne me poserait pas de soucis









numerid a écrit :



troll troll troll





ça en fait des certitudes en l’espace de 2 phrases <img data-src=" />



Non des réalités !

&nbsp;Les trolleurs ce sont les gens de la finance qui donnent des leçons aux autres.








brazomyna a écrit :



ça en fait des certitudes en l’espace de 2 phrases <img data-src=" />



Parce que les finances, ce ne sont pas des parasites qui sont là uniquement pour s’enrichir en ruinant les autres par cycles?









Gilbert_Gosseyn a écrit :



Au hasard … Cisco ? Déjà vu cette crasse chez eux.






  Effectivement, c'est du Cisco ! Info de chez OVH :        



&nbsp;



      D’après les logs récoltés sur tous les châssis du nœud de Roubaix (20), il apparait que nous avons eu 3 phénomènes en cascade sur le noeud de Roubaix :     



&nbsp;



1. Surcharge du CPU du Node Controller (châssis maitre)Chaque nœud optique a un châssis maitre qui permet d'échanger les informations entre les nœuds et permet d'échanger avec ses châssis slaves. Sur ce châssis maitre est sauvegardé la database sur 2 cartes controllers et le LCD. A partir de 7h50, on remarque que Roubaix commence à avoir des problèmes de communication avec les nœuds directement connectés à lui et montrer une surcharge CPU du châssis maitre. Aujourd'hui, nous n'avons pas encore la cause de cette surcharge du CPU. Malgré le down de SBG plus tôt, nous examinons toutes les pistes. Les équipes du constructeur investiguent encore sur cette cause. Nous avons un call samedi 11 novembre pour en savoir plus.     







  1. Switchover en cascadeSuite à la surcharge du CPU du node, le châssis maitre a effectué un switchover des cartes controller. Après le premier switchover des controllers et la surcharge du CPU, nous sommes tombé sur un bug soft connu de Cisco. Ce bug arrive sur les gros nœuds et a pour conséquence de faire un switchover des controllers toutes les 30 secondes. En temps normal ce switch over se stabilise seul. Ce bug est fixé en release 10.8 qui sera disponible à partir du 3111.

    &nbsp;



    1. Perte de la databaseA 8h00, suite aux switchover en cascade, nous sommes tombé sur un autre bug soft qui est une désynchro du timing entre les 2 cartes controllers du chassis maitre. Ce bug a provoquer l’envoi d’une commande disant aux cartes controller de mettre la database à 0. Les cartes controllers du châssis maitre ont donc envoyées cette nouvelle information aux châssis slaves ce qui a fait perdre tous les liens 100G de Roubaix. Ce bug est fixé en release 10.7 qui est actuellement disponible.



      Conclusion, bizarrement toujours la même : APPLIQUEZ VOS PUTAINS DE MISES A JOUR ! Si ils étaient à jour, leur infra aurait eu droit à 10 mins d’instabilité puis un retour à la normal au lieu d’une coupure de 8 heures !

      Apparemment ils ont prévu de le faire d’ici 4 semaines, on est sauvé \o/



      Edit: l’italique fait bugué les retours à la ligne ici, j’ai du rusé pour garder ça lisible <img data-src=" />










Jarodd a écrit :



Et comment tu lui montres ton billet si l’appli est indisponible ?





De la même façon que quand ton smartphone/connexion est en carafe: tu donnes le nom utilisé à la commande, et le contrôleur vérifie dans la BDD de SNCF Réseaux que tu as bien un billet (infos qui lui aura été transmise par ton revendeur).



Ces boites là sont seulement pénalisé au niveau des ventes/échanges quand leur serveurs tombent, c’est pas elles qui gèrent le trafic et les billets :)









LondonUK371 a écrit :



J’imagine bien Airbus faire un procès à Microsoft : Votre système a planté sur une machine qui contenait 1 mois de travail de 10 ingénieurs cadres qui nous coute 10k€/mois. Vous nous devez 100k€.





MS le propose pas car ils ne veulent pas de ce segment de marché, mais tu as des prestataire locaux qui peuvent te le fournir. C’est le principe même du SLA, qui n’est qu’une forme spécifique d’assurance. Tu t’engages à appliquer/accepter leur prérequis, et en échange, quand ces prérequis ne suffisent pas (ce qui arrive tôt ou tard, on est bien d’accord), ils acceptent de dédommager ta perte (jusqu’a la limite du contrat qui dépend de ce que tu payes, etc.).



Si ta maison a une bonne serrure et des volets, t’es bien remboursé de tes biens non ? Les serrure et volets en informatiques peuvent être compliqué, mais ça ne change rien au principe.



Ca dépend du controlleur alors. S’il n’a pas envie de faire l’effort, il te mettra une prune pour “non présentation d’un titre de transport valdie”, qu’il ait ou pas ton nom dans sa base de données. Et si tu es le 150e à lui dire “l’appli marche pas, j’ai pas de billet à montrer”, je doute qu’il soit aussi tolérant et patient qu’avec la première personne.








Jarodd a écrit :



Ca dépend du controlleur alors. S’il n’a pas envie de faire l’effort, il te mettra une prune pour “non présentation d’un titre de transport valdie”, qu’il ait ou pas ton nom dans sa base de données. Et si tu es le 150e à lui dire “l’appli marche pas, j’ai pas de billet à montrer”, je doute qu’il soit aussi tolérant et patient qu’avec la première personne.





Non, que ça soit l’appli ou n’importe quoi d’autre qui marche, il doit prendre ton nom et s’en débrouiller. C’est la contre-partie de l’existence même de l’e-billet, c’est dans le contrat (qui personne ne lit, on est d’accord).



Si il refuse de regarder ton nom (cas dont je n’ai jamais entendu parlé, mais imaginons), refuse ton amende et quand il demandera l’intervention des forces de l’ordre au prochain arrêt son responsable lui apprendra son métier. Et si jamais il n’arrive pas à vérifier ta présence dans sa BDD (appareil qui marche pas, sait pas comment faire…) tu es considéré dans ton bon droit (ça, ça m’est arrivé personnellement).



Et vérifier le billet avec le nom est à peine plus long que de scanner le QCR sur l’écran de ton téléphone, donc même si tout le monde fait ça, il s’en fout un peu…



Les contrôleurs ne sont pas tous borné et même dans ce cas tu pourrais faire un recours.