Azure, Office 365 et VS Online : retour à la normale après une panne de plusieurs heures

Azure, Office 365 et VS Online : retour à la normale après une panne de plusieurs heures

Mauvais timing

Avatar de l'auteur
Vincent Hermann

Publié dans

Internet

03/12/2015 3 minutes
19

Azure, Office 365 et VS Online : retour à la normale après une panne de plusieurs heures

Alors même que Microsoft lançait plusieurs produits autour de son offre Azure, la solution d’hébergement et d’autres services majeurs ont subi une avarie de quelques heures aujourd’hui. La situation est revenue à la normale, mais rappelle combien la dépendance au cloud peut être problématique.

Les premiers symptômes ont commencé en fin de matinée : plusieurs services majeurs de Microsoft ont montré un fonctionnement erratique. Azure tout d’abord, mais également Office 365 et même la partie Online de Visual Studio. De temps de connexion et de chargement allongés, les problèmes se sont aggravés jusqu’à ce que plusieurs services soient complètement inaccessibles. Une panne qui a notamment perturbé les premiers instants de vie du nouveau portail Azure dont nous parlions précédemment.

Une grande partie de l'Europe touchée

La situation est rétablie et tous les services sont désormais accessibles comme d'habitude. Nous avons joint Microsoft qui nous a confirmé que le problème était bien né dans Azure (puisque c’est la plateforme qui héberge tous les services maison ou presque). Mais la société n’avait pas d’informations sur l’origine du problème. On ne sait donc pas s’il s’agissait d’une panne matérielle ou logicielle.

La panne a touché en tout cas une grande partie de l’Europe, notamment toute celle de l’Ouest et du Nord. En France et au Royaume-Uni notamment, de nombreux services étaient inaccessibles. L’incident aura duré en tout un peu de plus trois heures, un laps de temps qui, s’il n’est pas forcément énorme, représente une contrainte importante pour des entreprises qui s’appuient sur de tels services et ne peuvent plus forcément avancer en cas de panne.

Même une disponibilité de 99,9 % n'est pas suffisante

Avec Azure, Microsoft promet une disponibilité de 99,9 %, comme d’autres prestataires de solutions cloud, notamment Amazon. Mais quelle que soit finalement cette garantie, les pannes ne peuvent que survenir à un moment ou un autre, ne serait-ce que via des erreurs humaines. Or, le déplacement des activités professionnelles dans le cloud offre des avantages indéniables (comme pour le grand public), notamment une gestion centralisée des ressources et des outils, mais une panne de plusieurs heures rappelle que les clients sont alors totalement dépendants de la fiabilité de serveurs distants.

En attendant, l’incident est clos, et Microsoft nous a indiqué qu’elle reviendrait vers nous si des informations supplémentaires sur la panne étaient disponibles.

Écrit par Vincent Hermann

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Une grande partie de l'Europe touchée

Même une disponibilité de 99,9 % n'est pas suffisante

Fermer

Commentaires (19)


99,9% c’est ce qu’ils promettent, cela fait environ 10h par an d’indisponibilité. Est ce qu’ils dépassent ce chiffre ou non ?


Le problème c’est à quel moment c’est 10h ont lieu <img data-src=" />

&nbsp;A 4h du matin ou à 18h le week end ?


La disponibilité annoncée n’est pas la disponibilité visée, c’est une information contractuelle qui donne droit à tes clients à une indemnité quand elle n’est pas respectée. Indemnité dont la limite est évidemment fixée dans le contrat d’utilisation du service cloud.

Le taux de disponibilité visé ça ne vaut rien et ça ne garantit rien en soit, d’où l’intérêt quand on travaille sur le cloud de combiner plusieurs prestataires hétérogènes avec une API en pattern adapter. Pour info, c’est ce vers quoi Netflix s’oriente après avoir été trop pénalisé par les indispos d’AWS.


Quand on regarde les contrats dans ma boite, on pose toujours la question si c’est 0,01% en cumulé ou accumulé sur une période de temps <img data-src=" />


Nothing in the Cloud : harder better faster stronger ! <img data-src=" />


Je serai plus mitigé et j’irai avec du “Hybrid-Cloud” s’il faut vraiment y aller <img data-src=" />


Ha , c’est pour ça que les enfants n’avaient pas cours !


Je ne&nbsp; suis pas aussi sûr de ca. Car oui 3 heures c’est beaucoup, mais un hébergement local n’empêche pas les pannes, et&nbsp;à par une grosse entreprise, si le problème est sérieux, je suis pas convaincu que la remise ne prod se face en 3 Heures…








DotNerk a écrit :



Je serai plus mitigé et j’irai avec du “Hybrid-Cloud” s’il faut vraiment y aller <img data-src=" />





Mitigation est effectivement le maître mot en informatique… Toujours espérer le meilleur et se préparer au pire.



Comme disait un de mes anciens collègues “la peur n’évite pas le danger” <img data-src=" />








exatex a écrit :



Je ne  suis pas aussi sûr de ca. Car oui 3 heures c’est beaucoup, mais un hébergement local n’empêche pas les pannes, et à par une grosse entreprise, si le problème est sérieux, je suis pas convaincu que la remise ne prod se face en 3 Heures…







Même sur une grosse entreprise, les pannes de plusieurs heures existent.

Il y a des centaines d’exemples tous les ans. La disponibilité à 100% n’existe pas



99,9% c’est ce qu’ils promettent, cela fait environ 10h par an d’indisponibilité

99,9 % de disponibilité ? Soit 0,1 % d’indisponibilité.

365x24*0,1=876 Heures plutôt non ?



Pour obtenir 10 heures d’indisponibilité cumulée par an, il faut 99,999 % de disponibilité et ce ne sont pas les même prix … ni le même stress pour les équipes d’exploitation.

Et pas la même infrastructure non plus.


&gt; mais une panne de plusieurs heures rappelle que les clients sont alors totalement dépendants de la fiabilité de serveurs distants.



Des serveurs locaux sont soumis exactement aux meme problemes… Et il est illusoire de croire que la disponibilité est meilleure en gardant les machines chez soi.



Le vrai probleme avec le cloud est qu’on devient totalement dependant de sa liaison internet en réalité. Et toute la question est là : veut on etre dependant de son operateur ?








luxian a écrit :



99,9% c’est ce qu’ils promettent, cela fait environ 10h par an d’indisponibilité



  99,9 % de disponibilité ? Soit 0,1 % d'indisponibilité.        

365x24*0,1=876 Heures plutôt non ?&nbsp;








 S'te fail. 0,1 c'est 10%. T'as calculé une fiabilité de&nbsp;90%. GG no re.&nbsp;&nbsp;     



&nbsp;&nbsp;&nbsp;

99,9%, c’est 365240,001, soit moins de 9h, et ils le dépassent quasiment chaque année. Ce qu’ils promettent c’est 99,5%, soit moins de 45h, et ils s’en sont approché plusieurs fois (même dépassé la deuxième année il me semble). Pour comparaison, un hébergement classique (courant + internet) tiens aisément du 99,95% (sauf mauvaise année où tu sera légèrement au dessus, mais bon, personne n’est parfait)&nbsp;si t’y mets un peu le prix (rien d’horrible, au final tu restes en dessous des prix d’Azure).




 Le Cloud n'est pas là pour la fiabilité (ça reste des datacenters, mais avec plusieurs couches de complexités supplémentaires qui plantent forcément de temps en temps), il est là pour la flexibilité.       






 Faut arrêter de tout confondre !


exactement.

…. et surtout a quel prix ! (une GTR il faut la payer)








ledufakademy a écrit :



exactement.

…. et surtout a quel prix ! (une GTR il faut la payer)







C’est simple :

4Mb SDSL avec GTR, c’est entre 200 et 400€ mensuels HT chez un opérateur pour pro (OBS, Cegetel, Completel, etc)

Ensuite, il faut ajouter environ 50% du prix pour doubler la bande passante.



Mais de la meme façon qu’un SLA de Cloud n’est pas respecté, la GTR ne l’est pas toujours non plus donc il est nécessaire de la doubler. Avec un 2e opérateur de préférence et sur un 2e DSLAM si possible.

Après, on peut doubler avec une liaison ADSL beaucoup moins chère mais on tombera sur un mode dégradé qui ne sera pas forcément pratique le jour J.









Bejarid a écrit :



Le Cloud n’est pas là pour la fiabilité (ça reste des datacenters, mais avec plusieurs couches de complexités supplémentaires qui plantent forcément de temps en temps), il est là pour la flexibilité.




 Faut arrêter de tout confondre !









De toute facon, tant que les pénalités ne sont qu’une fraction au prorata de l’abonnement mensuel, les GTR ne veulent absolument rien dire. N’importe qui peut promettre des GTR de dingue si ca lui coute que dalle en cas de loupé.



Cloud pas là pour la fiabilité ?



ben non, tout faux.



On multiplie les salles et sites pour se fendre la poire (et le porte-monnaie par là même) ? pardi.


Je suis d’accord sur la connexion internet!



C’est un de mes soucis majeur, notre infra est sur amazon, et on n’a pas trop de soucis, par contre quand la connexion internet est mauvaise ou morte ce n’est pas la joie!

Impossible de se connecter pour les serveurs et fichiers, on utilise hangout pour la communication internet, pas de connexion, pas de com (on est petit et on travaille dans des bureaux ou maison dans des endroits differents), et si reunion avec clients en ligne, il faut que je retourne chez moi et espere que ma connexion perso marche!



J’ai 23 trucs en local, dons si amazon est en rade pour 23 heures je peux bosser et je ne suis pas “couper” du monde.