La journée d’hier a été marquée par une panne assez longue chez Microsoft qui a engendré de nombreux problèmes avec le service Outlook.com. Au total, ce sont pas moins de 16 heures de perturbation qui ont été comptabilisées. En cause, une mise à jour de firmware dans un centre de données qui a viré au cauchemar.
Outlook.com est à la base des comptes Microsoft. Le service permet la création d’adresses qui serviront ensuite aux emails, ainsi qu’à la gestion des contacts et agendas. Le service peut être synchronisé via EAS (Exchange Active Service) sur pratiquement tous les smartphones, ainsi que dans Windows 8. De fait, une panne touchant le service pouvait donc potentiellement affecter un grand nombre d’utilisateurs.
L’incident s’est déclaré dans l’après-midi du 12 mars pour se terminer hier. Il s’est manifesté pour la première fois chez des utilisateurs tentant d’accéder au service SkyDrive (synchronisation et stockage de fichiers), mais surtout à Hotmail.com et Outlook.com. Microsoft indique sur l’un de ses blogs qu’un nouveau firmware a été mis en place dans une section logique du centre de données. Cependant, alors que la procédure n’avait rien de nouveau, les résultats n’étaient pas ceux prévus : les serveurs ont enregistré un brusque pic de chaleur.
C’est cette chaleur qui a provoqué l’activation des mesures de protection. Une partie du centre de données n’a alors plus fonctionné, engendrant des problèmes d’accès chez les utilisateurs. Ces soucis étaient assez aléatoires, certains ne pouvant pas du tout se connecter, tandis que d’autres n’avaient aucune difficulté.
Cependant, une durée de 16 heures parait très longue pour ce type d’incident. Le ralentissement est venu de la cause-même du problème, ce qui a forcé la firme à déclencher une intervention humaine. Cette dernière, bien qu’obligatoire, ralentit le processus de réparation à cause de la logistique particulière et surtout de l’ensemble des tests à réaliser sur place.
Microsoft indique travailler dur pour que ce type de problème ne se reproduise pas. Il faut noter cependant qu’il s’agit du troisième incident de ce genre depuis le début de l’année.
Actuellement, tous les voyants sont à nouveau au vert. Les statuts des services peuvent être vérifiés depuis cette page.