Amazon S3 : des sites et objets connectés inaccessibles cette nuit à cause d'une panne

Un seul datacenter vous manque... 40
En bref
image dediée
Web
Vincent Hermann

Pendant plusieurs heures hier soir, une panne dans Amazon S3 a provoqué l’inaccessibilité de bon nombre de sites. Un incident rare, mais qui rappelle que la concentration, malgré ses avantages, comporte son lot de dangers.

Si beaucoup connaissent Amazon comme une gigantesque plateforme de commerce en ligne, il ne faudrait pas oublier que l’entreprise est également leader dans un autre domaine : l’hébergement web. Via son Simple Storage Service (ou S3), Amazon Web Services est premier dans ce secteur, même si Microsoft voit sa part continuellement augmenter avec sa gamme Azure.

Les premiers problèmes hier soir vers 20h30

Ce type de solution offre des avantages indéniables, notamment en termes d’intégration et de facilité de déploiement, sans parler de la distribution des ressources à la demande. Aussi, de très nombreuses entreprises font appel à Amazon S3 (environ 120 000 domaines uniques) pour l’hébergement de leurs sites ou au moins d’une partie de leurs données. Et si une telle structure tombe en panne, c’est toute une partie du web qui devient inaccessible.

C’est précisément ce qui s’est passé pendant plusieurs heures hier soir. Les premiers incidents ont été rapportés vers 20h30, la page de statut d’IFTTT (qui utilise AWS) commençant à remonter des problèmes dans la foulée. Rapidement, des témoignages sont apparus sur des soucis liés aux fonctions d’objets connectés, comme des fours, des contrôleurs de lumière et même des portes d’entrée.

Nombreux sites et objets connectés touchés

La page de statut d’AWS permet de mieux se rendre compte de la chronologie. L’entreprise reconnait pour la première fois à 20h35 qu’il existe un problème, mais que la page a justement été réparée pour pouvoir transmettre des informations. Dans ce premier message, Amazon précise que le taux d’erreur est très important dans S3, mais que la cause de la panne a probablement été identifiée.

Environ deux heures plus tard, les opérations de récupération, listing et suppression des objets S3 sont de retour, mais les ajouts continuent de générer de nombreuses erreurs. Il faut encore attendre une heure de plus pour que la totalité des opérations soit de nouveau accessibles et que le service S3 soit considéré comme de retour à la normale. On ne sait pas exactement ce qui s’est passé, mais le problème émanait d’un centre de données situé en Virginie.

amazon aws

Durant ces heures de panne, de très nombreux sites ont également été affectés, notamment ceux de Slack, Trello, Quora, Business Insider, Coursera, Time Inc, Giphy, Instagram, IMDb, American Airlines, Imgur ainsi que tous les sites créés avec la plateforme Wix. Notez que les symptômes n’étaient pas toujours les mêmes, certains ne fonctionnant plus du tout, d’autres partiellement. Ironie du sort, le site « Is It Down Right Now » était lui aussi inaccessible. Même une partie des services d'Apple ont été touchés.

Notez cependant qu'il semble qu'une bonne partie des problèmes aient été concentrés sur le marché américain, et pas de manière systématique. Netflix s'appuie par exemple lourdement sur Amazon et n'a par exemple rencontré aucune difficulté.

Dure piqûre de rappel

En tout, les services d’Amazon ont été coupés pendant environ trois heures. Une période très longue pour de nombreux objets connectés qui se sont mis à ne plus répondre aux ordres. Changement de sensibilité d’une souris, four qui ne veut plus s’éteindre, lumières qui ne peuvent plus s’allumer et ainsi de suite ont été notés, notamment par le compte Twitter « Internet of Shit », qui a retweeté ce genre de mésaventure.

De quoi rappeler qu’une telle structure centralisée peut avoir un impact très conséquent sur la vie personnelle et professionnelle si elle s’éternise, tout en faisant une piqûre de rappel sur les objets connectés. Si ces derniers peuvent en effet rendre bien des services, ils sont par nature dépendants de serveurs distants. La moindre interruption de connexion désactive des fonctionnalités, voire peut les rendre totalement inopérants, avec les soucis que l’on imagine.


chargement
Chargement des commentaires...