Hier après-midi, OVH a subi une panne sur 75 % de son trafic. En cause un problème de routage qui a pu être réparé en quelques dizaines de minutes. L'hébergeur s'explique et annonce des dispositions afin d'éviter pareille mésaventure à l'avenir.
Hier aux alentours de 17h00, de nombreux clients se sont plaint d'une panne : les serveurs étaient inaccessibles et les sites hébergés ne répondaient pas. Le service client a rapidement confirmé la situation, indiquant que ces équipes étaient sur la brèche. Le retour à la normale a eu lieu quelques dizaines de minutes plus tard. Depuis, Octave Klaba, fondateur et directeur technique d’OVH, a donné des explications.
« Nous venons d’avoir un problème de routage qui a impacté 75% de notre trafic. L’origine du problème a été corrigée et nous sommes en train de finir de gérer l’incident » explique le dirigeant. Il ajoute que le problème venait du point de peering DECIX à Francfort qui a « annoncé via le BGP "tout Internet" ». Résultat, 75% du trafic d'OVH passait alors par Francfort, alors que ça ne devait pas être le cas, ce qui a provoqué une panne. Pour rappel, c’était la même histoire en juin dernier lorsqu’une partie des sites d’Internet était inaccessible.
Il s’agit d’une erreur de manipulation humaine qui arriverait « assez souvent » selon OVH, mais qui ne devrait pas avoir d’impact, car il existe des protections. Problème, « ce mécanisme [de protection] n’a pas été mis en place sur la connexion avec ce réseau-là » avoue Octave Klaba. Pourquoi ? La raison n’a pas été précisée, mais la société enquête afin d’éviter que cela ne se reproduise à l'avenir. Afin de faire un tour d’horizon de la configuration des routeurs, un script maison est en train d’être développé pour procéder à des vérifications automatiques.
Pour rappel, il y a un peu plus d'un an, c'était un autre hébergeur, Oxalide, qui subissait une importante panne, plongeant une partie de la presse en ligne dans le noir. Oxalide avait « disparu d'Internet » pendant un peu plus de deux heures, à cause là encore d'un problème de routage (voir notre analyse).