Alors même que Microsoft lançait plusieurs produits autour de son offre Azure, la solution d’hébergement et d’autres services majeurs ont subi une avarie de quelques heures aujourd’hui. La situation est revenue à la normale, mais rappelle combien la dépendance au cloud peut être problématique.
Les premiers symptômes ont commencé en fin de matinée : plusieurs services majeurs de Microsoft ont montré un fonctionnement erratique. Azure tout d’abord, mais également Office 365 et même la partie Online de Visual Studio. De temps de connexion et de chargement allongés, les problèmes se sont aggravés jusqu’à ce que plusieurs services soient complètement inaccessibles. Une panne qui a notamment perturbé les premiers instants de vie du nouveau portail Azure dont nous parlions précédemment.
Une grande partie de l'Europe touchée
La situation est rétablie et tous les services sont désormais accessibles comme d'habitude. Nous avons joint Microsoft qui nous a confirmé que le problème était bien né dans Azure (puisque c’est la plateforme qui héberge tous les services maison ou presque). Mais la société n’avait pas d’informations sur l’origine du problème. On ne sait donc pas s’il s’agissait d’une panne matérielle ou logicielle.
La panne a touché en tout cas une grande partie de l’Europe, notamment toute celle de l’Ouest et du Nord. En France et au Royaume-Uni notamment, de nombreux services étaient inaccessibles. L’incident aura duré en tout un peu de plus trois heures, un laps de temps qui, s’il n’est pas forcément énorme, représente une contrainte importante pour des entreprises qui s’appuient sur de tels services et ne peuvent plus forcément avancer en cas de panne.
Même une disponibilité de 99,9 % n'est pas suffisante
Avec Azure, Microsoft promet une disponibilité de 99,9 %, comme d’autres prestataires de solutions cloud, notamment Amazon. Mais quelle que soit finalement cette garantie, les pannes ne peuvent que survenir à un moment ou un autre, ne serait-ce que via des erreurs humaines. Or, le déplacement des activités professionnelles dans le cloud offre des avantages indéniables (comme pour le grand public), notamment une gestion centralisée des ressources et des outils, mais une panne de plusieurs heures rappelle que les clients sont alors totalement dépendants de la fiabilité de serveurs distants.
En attendant, l’incident est clos, et Microsoft nous a indiqué qu’elle reviendrait vers nous si des informations supplémentaires sur la panne étaient disponibles.
Commentaires (19)
#1
99,9% c’est ce qu’ils promettent, cela fait environ 10h par an d’indisponibilité. Est ce qu’ils dépassent ce chiffre ou non ?
#2
Le problème c’est à quel moment c’est 10h ont lieu " />
A 4h du matin ou à 18h le week end ?
#3
La disponibilité annoncée n’est pas la disponibilité visée, c’est une information contractuelle qui donne droit à tes clients à une indemnité quand elle n’est pas respectée. Indemnité dont la limite est évidemment fixée dans le contrat d’utilisation du service cloud.
Le taux de disponibilité visé ça ne vaut rien et ça ne garantit rien en soit, d’où l’intérêt quand on travaille sur le cloud de combiner plusieurs prestataires hétérogènes avec une API en pattern adapter. Pour info, c’est ce vers quoi Netflix s’oriente après avoir été trop pénalisé par les indispos d’AWS.
#4
Quand on regarde les contrats dans ma boite, on pose toujours la question si c’est 0,01% en cumulé ou accumulé sur une période de temps " />
#5
Nothing in the Cloud : harder better faster stronger ! " />
#6
Je serai plus mitigé et j’irai avec du “Hybrid-Cloud” s’il faut vraiment y aller " />
#7
Ha , c’est pour ça que les enfants n’avaient pas cours !
#8
Je ne suis pas aussi sûr de ca. Car oui 3 heures c’est beaucoup, mais un hébergement local n’empêche pas les pannes, et à par une grosse entreprise, si le problème est sérieux, je suis pas convaincu que la remise ne prod se face en 3 Heures…
#9
#10
Comme disait un de mes anciens collègues “la peur n’évite pas le danger” " />
#11
#12
99,9% c’est ce qu’ils promettent, cela fait environ 10h par an d’indisponibilité
99,9 % de disponibilité ? Soit 0,1 % d’indisponibilité.
365x24*0,1=876 Heures plutôt non ?
Pour obtenir 10 heures d’indisponibilité cumulée par an, il faut 99,999 % de disponibilité et ce ne sont pas les même prix … ni le même stress pour les équipes d’exploitation.
Et pas la même infrastructure non plus.
#13
> mais une panne de plusieurs heures rappelle que les clients sont alors totalement dépendants de la fiabilité de serveurs distants.
Des serveurs locaux sont soumis exactement aux meme problemes… Et il est illusoire de croire que la disponibilité est meilleure en gardant les machines chez soi.
Le vrai probleme avec le cloud est qu’on devient totalement dependant de sa liaison internet en réalité. Et toute la question est là : veut on etre dependant de son operateur ?
#14
#15
exactement.
…. et surtout a quel prix ! (une GTR il faut la payer)
#16
#17
#18
Cloud pas là pour la fiabilité ?
ben non, tout faux.
On multiplie les salles et sites pour se fendre la poire (et le porte-monnaie par là même) ? pardi.
#19
Je suis d’accord sur la connexion internet!
C’est un de mes soucis majeur, notre infra est sur amazon, et on n’a pas trop de soucis, par contre quand la connexion internet est mauvaise ou morte ce n’est pas la joie!
Impossible de se connecter pour les serveurs et fichiers, on utilise hangout pour la communication internet, pas de connexion, pas de com (on est petit et on travaille dans des bureaux ou maison dans des endroits differents), et si reunion avec clients en ligne, il faut que je retourne chez moi et espere que ma connexion perso marche!
J’ai 2⁄3 trucs en local, dons si amazon est en rade pour 2⁄3 heures je peux bosser et je ne suis pas “couper” du monde.