OVHcloud coupé du monde (en IPv4) : retour sur une panne à l’échelle mondiale

bohwaz Abonné

Le 13/10/2021 à 19h 13

#1

Une heure de black-out c’est relativement peu au final, et la communication d’Oles est toujours très rapide, et riche en détails techniques, en toute transparence. Je préfère ça à du bla bla marketing du genre “nos équipes travaillent à rétablir le service”. Par contre cette communication devrait être faite par une équipe, sur un compte Twitter dédié, pas juste par le CEO sur son compte perso…

olt01 Abonné

Le 13/10/2021 à 19h 25

#2

J’ai bien lu dans l’article que la panne était différente de celle de Facebook (interne à l’AS v.s. externe). Cependant, sa nature est est identique. La loi des séries ?

Idiogène

Le 13/10/2021 à 19h 31

#2.1

Tout à fait, c’est même une série OVeHrkill.

cyp Abonné

Le 13/10/2021 à 19h 30

#3

olt01 a dit:

La loi des séries ?

Peut être pas, l’argument donnée par OVH sur l’intensification des DDOS semble crédible (Microsoft vient également d’en subir un très gros) et pousse peut être les opérateur dans des mises à jour un peu précipité.

game1337 Abonné

Le 13/10/2021 à 19h 56

#4

Enfin que le site de suivi des incidents sois lui aussi tomber ne fait quand même pas très sérieux

anonyme_f525e46a95b50f94ea596fa0bc1b20fd

Le 13/10/2021 à 20h 08

#5

“Quand on vous dit de passer à IPv6”

Dit un site qui ne le supporte pas

SebGF Abonné

Le 13/10/2021 à 20h 22

#5.1

Cet incident devrait aussi aller dans le sens de ceux qui vantent une approche multi-cloud : n’importe quel hébergeur peut rencontrer un problème grave, il faut donc assurer une redondance à travers l’un de ses concurrents pour réduire les problèmes potentiels. Mais là aussi, cela dépendra du budget prévu et de votre capacité à tolérer une panne.

Tout est dit ici. Ne jamais mettre ses oeufs dans le même panier est une bonne pratique, tout comme il est essentiel de savoir quelle tolérance apporter à la panne versus les moyens qu’on se donne pour réduire le plus possible les risques.

Dans la pratique, hélas, le client va dire qu’il peut se permettre d’avoir X heures d’indisponibilité parce que sinon c’est trop cher, mais en cas de crash il faut remonter dans la seconde sinon c’est un scandale. Confère un meme qui tourne régulièrement dans les réseaux spécialisés avec le pot d’argent quasi vide puis quasi plein et comme légende : “security budget before a data breach / security budget after a data breach” (et sa variante avec un troisième pot largement plus gros : “data breach cost”).

Et vous avez bien fait de rappeler que plusieurs des gros acteurs ont eu des problèmes ces derniers temps. L’effet de loupe arrive vite à la moindre défaillance d’un hébergeur et on oublie à côté que la fiabilité est globalement très bonne et que personne n’est à l’abri d’un problème. Pour faire une métaphore, c’est comme le crash d’un avion. C’est extrêmement rare, mais sur-médiatisé lorsque ça arrive, ce qui a tendance à biaiser l’opinion alors que c’est un moyen de transport pourtant très sûr.

Shit happens comme on dit.

ping nextinpact.com
PING nextinpact.com(2606:4700:20::681a:e07 (2606:4700:20::681a:e07)) 56 octets de données

Ca ressemble pas à une IPV4 ce que je vois en résultat.

anonyme_f525e46a95b50f94ea596fa0bc1b20fd

Le 13/10/2021 à 21h 50

#5.2

SebGF

Cet incident devrait aussi aller dans le sens de ceux qui vantent une approche multi-cloud : n’importe quel hébergeur peut rencontrer un problème grave, il faut donc assurer une redondance à travers l’un de ses concurrents pour réduire les problèmes potentiels. Mais là aussi, cela dépendra du budget prévu et de votre capacité à tolérer une panne.

Tout est dit ici. Ne jamais mettre ses oeufs dans le même panier est une bonne pratique, tout comme il est essentiel de savoir quelle tolérance apporter à la panne versus les moyens qu’on se donne pour réduire le plus possible les risques.

Dans la pratique, hélas, le client va dire qu’il peut se permettre d’avoir X heures d’indisponibilité parce que sinon c’est trop cher, mais en cas de crash il faut remonter dans la seconde sinon c’est un scandale. Confère un meme qui tourne régulièrement dans les réseaux spécialisés avec le pot d’argent quasi vide puis quasi plein et comme légende : “security budget before a data breach / security budget after a data breach” (et sa variante avec un troisième pot largement plus gros : “data breach cost”).

Et vous avez bien fait de rappeler que plusieurs des gros acteurs ont eu des problèmes ces derniers temps. L’effet de loupe arrive vite à la moindre défaillance d’un hébergeur et on oublie à côté que la fiabilité est globalement très bonne et que personne n’est à l’abri d’un problème. Pour faire une métaphore, c’est comme le crash d’un avion. C’est extrêmement rare, mais sur-médiatisé lorsque ça arrive, ce qui a tendance à biaiser l’opinion alors que c’est un moyen de transport pourtant très sûr.

Shit happens comme on dit.

ping nextinpact.com
PING nextinpact.com(2606:4700:20::681a:e07 (2606:4700:20::681a:e07)) 56 octets de données

Ca ressemble pas à une IPV4 ce que je vois en résultat.

My bad j’aurais du vérifié il y a encore quelque mois il le supportait pas.

Freeben666 Abonné

Le 14/10/2021 à 09h 29

#5.3

anonyme_f525e46a95b50f94ea596fa0bc1b20fd

My bad j’aurais du vérifié il y a encore quelque mois il le supportait pas.

ça fait pourtant plus d’un an au moins que le site est dispo en IPv6

Cqoicebordel Abonné

Le 14/10/2021 à 18h 54

#5.4

SebGF

Cet incident devrait aussi aller dans le sens de ceux qui vantent une approche multi-cloud : n’importe quel hébergeur peut rencontrer un problème grave, il faut donc assurer une redondance à travers l’un de ses concurrents pour réduire les problèmes potentiels. Mais là aussi, cela dépendra du budget prévu et de votre capacité à tolérer une panne.

Tout est dit ici. Ne jamais mettre ses oeufs dans le même panier est une bonne pratique, tout comme il est essentiel de savoir quelle tolérance apporter à la panne versus les moyens qu’on se donne pour réduire le plus possible les risques.

Dans la pratique, hélas, le client va dire qu’il peut se permettre d’avoir X heures d’indisponibilité parce que sinon c’est trop cher, mais en cas de crash il faut remonter dans la seconde sinon c’est un scandale. Confère un meme qui tourne régulièrement dans les réseaux spécialisés avec le pot d’argent quasi vide puis quasi plein et comme légende : “security budget before a data breach / security budget after a data breach” (et sa variante avec un troisième pot largement plus gros : “data breach cost”).

Et vous avez bien fait de rappeler que plusieurs des gros acteurs ont eu des problèmes ces derniers temps. L’effet de loupe arrive vite à la moindre défaillance d’un hébergeur et on oublie à côté que la fiabilité est globalement très bonne et que personne n’est à l’abri d’un problème. Pour faire une métaphore, c’est comme le crash d’un avion. C’est extrêmement rare, mais sur-médiatisé lorsque ça arrive, ce qui a tendance à biaiser l’opinion alors que c’est un moyen de transport pourtant très sûr.

Shit happens comme on dit.

ping nextinpact.com
PING nextinpact.com(2606:4700:20::681a:e07 (2606:4700:20::681a:e07)) 56 octets de données

Ca ressemble pas à une IPV4 ce que je vois en résultat.

Hum, je me trompe peut-être, mais www.nextinpact.com (note les www) semble ne pas avoir d’IPv6.

fofo9012 Abonné

Le 15/10/2021 à 06h 19

#5.6

SebGF

Cet incident devrait aussi aller dans le sens de ceux qui vantent une approche multi-cloud : n’importe quel hébergeur peut rencontrer un problème grave, il faut donc assurer une redondance à travers l’un de ses concurrents pour réduire les problèmes potentiels. Mais là aussi, cela dépendra du budget prévu et de votre capacité à tolérer une panne.

Tout est dit ici. Ne jamais mettre ses oeufs dans le même panier est une bonne pratique, tout comme il est essentiel de savoir quelle tolérance apporter à la panne versus les moyens qu’on se donne pour réduire le plus possible les risques.

Dans la pratique, hélas, le client va dire qu’il peut se permettre d’avoir X heures d’indisponibilité parce que sinon c’est trop cher, mais en cas de crash il faut remonter dans la seconde sinon c’est un scandale. Confère un meme qui tourne régulièrement dans les réseaux spécialisés avec le pot d’argent quasi vide puis quasi plein et comme légende : “security budget before a data breach / security budget after a data breach” (et sa variante avec un troisième pot largement plus gros : “data breach cost”).

Et vous avez bien fait de rappeler que plusieurs des gros acteurs ont eu des problèmes ces derniers temps. L’effet de loupe arrive vite à la moindre défaillance d’un hébergeur et on oublie à côté que la fiabilité est globalement très bonne et que personne n’est à l’abri d’un problème. Pour faire une métaphore, c’est comme le crash d’un avion. C’est extrêmement rare, mais sur-médiatisé lorsque ça arrive, ce qui a tendance à biaiser l’opinion alors que c’est un moyen de transport pourtant très sûr.

Shit happens comme on dit.

ping nextinpact.com
PING nextinpact.com(2606:4700:20::681a:e07 (2606:4700:20::681a:e07)) 56 octets de données

Ca ressemble pas à une IPV4 ce que je vois en résultat.

Pas tout à fait :

ping www.nextinpact.com / api-v1.nextinpact.com …

PING k8s.nextinpact.com (51.159.27.198) 56(84) octets de données.
64 octets de 51-159-27-198.lb.fr-par.scw.cloud (51.159.27.198) : icmp_seq=1 ttl=55 temps=4.78 ms

mais effectivement

ping nextinpact.com

PING nextinpact.com(2606:4700:20::ac43:444b (2606:4700:20::ac43:444b)) 56 octets de données
64 octets de 2606:4700:20::ac43:444b (2606:4700:20::ac43:444b) : icmp_seq=1 ttl=55 temps=6.76 ms

et inpact-hardware ne répond jamais en v6

David_L Abonné

Le 15/10/2021 à 07h 40

#5.7

fofo9012

Pas tout à fait :

ping www.nextinpact.com / api-v1.nextinpact.com …

PING k8s.nextinpact.com (51.159.27.198) 56(84) octets de données.
64 octets de 51-159-27-198.lb.fr-par.scw.cloud (51.159.27.198) : icmp_seq=1 ttl=55 temps=4.78 ms

mais effectivement

ping nextinpact.com

PING nextinpact.com(2606:4700:20::ac43:444b (2606:4700:20::ac43:444b)) 56 octets de données
64 octets de 2606:4700:20::ac43:444b (2606:4700:20::ac43:444b) : icmp_seq=1 ttl=55 temps=6.76 ms

et inpact-hardware ne répond jamais en v6

Comme on a déjà répondu sur le sujet, on est en attente d’une évolution technique de Scaleway à ce sujet

fofo9012 Abonné

Le 15/10/2021 à 05h 46

#5.5

Ah oui bien vu, quel scandale !

traknar Abonné

Le 13/10/2021 à 20h 43

#6

Cet incident devrait aussi aller dans le sens de ceux qui vantent une approche multi-cloud : n’importe quel hébergeur peut rencontrer un problème grave, il faut donc assurer une redondance à travers l’un de ses concurrents pour réduire les problèmes potentiels. Mais là aussi, cela dépendra du budget prévu et de votre capacité à tolérer une panne.

Passer au multi-cloud n’est pas qu’un problème de budget. Le faire revient à se restreindre au plus petit dénominateur commun entre les fournisseurs. On se prive alors du bénéfice des milliard de dollars/euros investis annuellement dans la R&D par les hyperscalers.

De plus, le multi-cloud augmente la complexité des déploiements. Et l’expérience montre que plus de complexité va de pair avec moins de disponibilité et moins de sécurité.

TroudhuK Abonné

Le 13/10/2021 à 22h 02

#7

SIaelrod a dit:

“Quand on vous dit de passer à IPv6”

Dit un site qui ne le supporte pas

D’ailleurs concrètement, que veut dire “passer à l’IPv6”, au-delà de ne plus la bloquer de partout ? Pourquoi est-ce qu’on peut la bloquer d’ailleurs ?

SwissTico Abonné

Le 13/10/2021 à 22h 21

#7.1

Parce que:

Ce n’est pas compris dans les firmwares des routeurs chinois à deux balles que nous mettent à disposition les FAI dans certains pays, donc un coût énorme de les reprogrammer ou remplacer.

La flemme des techniciens d’apprendre (je parle des sociétés là, pas des FAI), et les former coûte cher.

C’est une deuxième couche à prendre en compte dans la sécurité (pare-feu, etc.), donc tout reconfigurer.

En résumé, ça coûte cher de passer à l’IPv6.

TroudhuK Abonné

Le 14/10/2021 à 06h 51

#7.2

SwissTico

Parce que:

Ce n’est pas compris dans les firmwares des routeurs chinois à deux balles que nous mettent à disposition les FAI dans certains pays, donc un coût énorme de les reprogrammer ou remplacer.

La flemme des techniciens d’apprendre (je parle des sociétés là, pas des FAI), et les former coûte cher.

C’est une deuxième couche à prendre en compte dans la sécurité (pare-feu, etc.), donc tout reconfigurer.

En résumé, ça coûte cher de passer à l’IPv6.

D’accord, je pensais que tout ça était en place depuis longtemps et qu’il ne tenait qu’à l’utilisateur de l’activer ou pas (en l’occurrence ici pour qu’une panne IPv4 passe inaperçue).

anonyme_f525e46a95b50f94ea596fa0bc1b20fd

Le 13/10/2021 à 22h 34

#8

TroudhuK a dit:

D’ailleurs concrètement, que veut dire “passer à l’IPv6”, au-delà de ne plus la bloquer de partout ? Pourquoi est-ce qu’on peut la bloquer d’ailleurs ?

Bah enfaite oui, car sur des machine pro, il existe des système intégré qui détecte les ip malicieuse, hors ces liste n’existe pas (ou sont très peu utilisée car les ipv6 sont souvent en dure dans les malware donc beaucoup d’entreprise désactive juste “dhcpv6 et RA ou prefix delegation”

Paul Muad'Dib

Le 13/10/2021 à 22h 35

#9

Je ne suis pas sûr d’avoir compris pourquoi l’incident à duré moins longtemps en IPv6 qu’en IPv4 (7 minutes vs 1h) et pourquoi il aurait été moins grave en cas de généralisation du premier ?

KMD55

Le 13/10/2021 à 22h 43

#10

Yakafokon, mais s’assurer d’avoir un rollback écrit et qui fonctionne avant de démarrer c’est assez recommandé

inextenza Abonné

Le 14/10/2021 à 08h 30

#10.1

Vu ce qui est décrit dans l’article, tu suggères quoi comme rollback différent de ce qu’ils ont fait (et d’ailleurs, vu la description des pannes, je trouve qu’ils ont été plutôt rapides) ?

Krystanos

Le 16/10/2021 à 21h 01

#10.2

inextenza

Vu ce qui est décrit dans l’article, tu suggères quoi comme rollback différent de ce qu’ils ont fait (et d’ailleurs, vu la description des pannes, je trouve qu’ils ont été plutôt rapides) ?

Bah justement. Ils avaient une procédure, qui fonctionnait, mais pas de bol sur un copier-coller.

Nulle part il était écrit qu’il n’y avait pas de procédure de rollback. Il y en avait sûrement une, qui a peut-être été exécutée, ou pas, car ils ont considéré que c’était plus problématique que de corriger le problème…

Quand ta REL dure 4 heures et ton rollback 8h, tu réfléchis avant de rollbacker en cas de problème…
Et parfois, on ne peut pas rollbacker…

C’est toujours une question de balance gain/coût/risque.

Inodemus Abonné

Le 13/10/2021 à 23h 11

#11

TroudhuK a dit:

D’ailleurs concrètement, que veut dire “passer à l’IPv6”, au-delà de ne plus la bloquer de partout ? Pourquoi est-ce qu’on peut la bloquer d’ailleurs ?

C’est pas la bloquer, c’est plutôt la supporter, et sur toute la chaîne du réseau. L’IPv6 est totalement incompatible avec l’IPv4 même si ma ressemblance du nom peut être trompeuse, ça revient donc à construire un deuxième réseau parallèle au premier, en dupliquant les équipements (soit matériellement, soit logiciellement) et les configurations.

C’est donc plus ou moins le même boulot que monter un réseau IPv4, le câblage en moins.

hwti Abonné

Le 13/10/2021 à 23h 55

#12

game1337 a dit:

Enfin que le site de suivi des incidents sois lui aussi tomber ne fait quand même pas très sérieux

C’est pour ça que certains l’hébergent chez un concurrent, pour qu’il reste accessible même en cas de soucis interne.

Naruto`kun Abonné

Le 14/10/2021 à 04h 53

#13

(quote:1907350:Paul Muad’Dib)
Je ne suis pas sûr d’avoir compris pourquoi l’incident à duré moins longtemps en IPv6 qu’en IPv4 (7 minutes vs 1h) et pourquoi il aurait été moins grave en cas de généralisation du premier ?

C’est un concours de circonstances.
Au moment de mettre les nouvelles règles dans le routeur ils ont d’abord mis les règles ipv6, puis celles de ipv4, sauf qu’en collant celles de ipv4, le caractère 4 c’est retrouvé a la ligne, donc le routeur fonctionnait en ipv6, mais n’avait pas de règles pour ipv4.

Donc ce cas la ipv6 aurait servi de roue de secours a internet. De la même manière que si l’erreur était arrivé sur la config ipv6, ipv4 aurait servi de backup.

swiper Abonné

Le 14/10/2021 à 06h 47

#14

Tout cela vient d’un copié coller mal passé. Ca me rappelle une gourde que j’avais commise chez un hébergeur où j’avais oublié d’ajouté “add” à la ligne d’ajout de vlan. Du coup, j’avais supprimé la quasi totalité des vlans sur un port trunk dans le DC… Autant dire que j’avais flingué les clients.

J’ai transpiré et me suis fait virer dans l’heure qui a suivie mais ce que je comprends c’est surtout que même si une opération est bien prévue (j’avais bien revu les commandes avant de les taper) il reste toujours une possibilité de foirer.

Vous dites qu’une heure c’est pas grand chose mais pour un site e-commerce, c’est énorme en fait. ce qui est d’ailleurs le plus important c’est les leçons que va tirer OVH de cet incident. Car dans mon ancienne boite, j’ai pas eu l’impression qu’en dehors de la panne, ils avaient fait une vraie remise en cause des process à mettre en place pour éviter ça.
Ils se sont rendus compte que les onduleurs n’étaient pas joignables pour couper la prise liée au routeur afin de relancer la dernière bonne configuration. L’accompagnement dans l’opération n’avait pas été présente suffisamment etc…

patos Abonné

Le 14/10/2021 à 08h 09

#14.1

Shit happens comme on dit.
Après, en France, te virer pour une erreur, ils perdent aux prudhommes..

Le problème n’est pas 1h c’est beaucoup ou pas assez, le problème c’est que si c’est dans le contrat, ben faut pas pleurer ^^; Si c’est hors contrat, on peut pleurer, avoir compensation (avec avocats…) dans une limite imbitable mais c’est tout. Shit happens…

David_L Abonné

Le 14/10/2021 à 07h 03

#15

swiper a dit:

Vous dites qu’une heure c’est pas grand chose mais pour un site e-commerce, c’est énorme en fait. ce qui est d’ailleurs le plus important c’est les leçons que va tirer OVH de cet incident.

Comme dit dans l’article, si ton activité est vitale au point de ne pas tolérer une panne d’une heure, la leçon à tirer c’est de revoir ton infrastructure si elle ne repose que sur un hébergeur (OVHcloud ou pas). Les PRA/PCA sont d’ailleurs là pour ça.

ErGo_404

Le 14/10/2021 à 09h 51

#15.1

Faire du multi cloud ça coûte cher (pas qu’en hébergement, surtout en temps humain), tu peux très bien avoir une activité pour laquelle c’est hyper complexe de mettre en place de genre d’infras tout en ayant besoin d’une bonne disponibilité pour assurer ton fonctionnement.

Est-ce que tu claquerais 120000€ de salaire annuel pour payer un mec à essayer de faire une infra aux petits oignons (qui ne sera jamais parfaite, entendons nous bien là dessus) pour un problème qui te fera perdre 20 000 euros ? Non. Est-ce que ça te fait quand même chier d’avoir perdu 20000€ de CA ? Oui probablement.

SebGF Abonné

Le 14/10/2021 à 11h 39

#15.2

ErGo_404

Faire du multi cloud ça coûte cher (pas qu’en hébergement, surtout en temps humain), tu peux très bien avoir une activité pour laquelle c’est hyper complexe de mettre en place de genre d’infras tout en ayant besoin d’une bonne disponibilité pour assurer ton fonctionnement.

Est-ce que tu claquerais 120000€ de salaire annuel pour payer un mec à essayer de faire une infra aux petits oignons (qui ne sera jamais parfaite, entendons nous bien là dessus) pour un problème qui te fera perdre 20 000 euros ? Non. Est-ce que ça te fait quand même chier d’avoir perdu 20000€ de CA ? Oui probablement.

Ben c’est exactement la réflexion proposée par David et l’article. Si ton activité est critique et que tu n’es pas en capacité de tolérer une heure de panne, tu mets les moyens derrière. Le multicloud est une possibilité, mais il peut y en avoir d’autre dépendant de comment l’activité est organisée. C’est là tout le travaille que l’architecture doit produire.

Si tu estimes que les moyens permettant d’assurer la haute disponibilité sont trop chers par rapport à la perte d’une heure d’activité, tu mets de l’eau dans ton vin et tolère celle-ci quand elle arrive (et se défouler sur le prestataire ne sert à rien dans ce cas là, sauf que c’est, hélas, le premier réflexe de la plupart des clients).

David_L Abonné

Le 14/10/2021 à 13h 14

#15.3

ErGo_404

Faire du multi cloud ça coûte cher (pas qu’en hébergement, surtout en temps humain), tu peux très bien avoir une activité pour laquelle c’est hyper complexe de mettre en place de genre d’infras tout en ayant besoin d’une bonne disponibilité pour assurer ton fonctionnement.

Est-ce que tu claquerais 120000€ de salaire annuel pour payer un mec à essayer de faire une infra aux petits oignons (qui ne sera jamais parfaite, entendons nous bien là dessus) pour un problème qui te fera perdre 20 000 euros ? Non. Est-ce que ça te fait quand même chier d’avoir perdu 20000€ de CA ? Oui probablement.

Une infra c’est des choix, il n’y en a jamais de parfait. Mais ce genre de dispositif c’est comme la sauvegarde ou les assurances. On peut vivre sans et regretter de devoir payer de temps en temps pour un petit problème. Le jour où la maison s’écroule pour une raison où un autre, on est quand même content de l’avoir.

deterson

Le 14/10/2021 à 07h 21

#16

99,99% de disponibilité ça fait 0.87h de downtime par an, soit 52 minutes, pas 3 jours et demi haha
on en est déjà très loin là…

th3squal

Le 14/10/2021 à 07h 54

#16.1

Oui loin des 3 jours dans l’exemple.

En revanche chez OVH :

Le WebCloud c’est 99.9% donc 8h45 d’indispo

Le Public Cloud/Hosted et autres, c’est 99.999%, la on ne devrait pas avoir plus de 5min15 d’indispo.

A voir ce qu’ils feront pour les public cloud, mais pour les “sites vitrines” ou les “sites de vente en ligne” qui sont hébergés sur du WebCloud a 50€/ans, je dirais qu’ils n’ont que ce qu’ils payent^^

gg40 Abonné

Le 14/10/2021 à 08h 22

#17

J’aime beaucoup Bortzmeyer, mais quand il dit : “l’ancienne version IPV4” ça me fait un peu tiquer

Quand on pourra faire de l’IP failover en IPV6 (chez OVH / SYS) on verra ensuite pour tout reconfigurer sur les serveurs

anonyme_f525e46a95b50f94ea596fa0bc1b20fd

Le 14/10/2021 à 10h 52

#18

ErGo_404 a dit:

Faire du multi cloud ça coûte cher (pas qu’en hébergement, surtout en temps humain), tu peux très bien avoir une activité pour laquelle c’est hyper complexe de mettre en place de genre d’infras tout en ayant besoin d’une bonne disponibilité pour assurer ton fonctionnement.

Est-ce que tu claquerais 120000€ de salaire annuel pour payer un mec à essayer de faire une infra aux petits oignons (qui ne sera jamais parfaite, entendons nous bien là dessus) pour un problème qui te fera perdre 20 000 euros ? Non. Est-ce que ça te fait quand même chier d’avoir perdu 20000€ de CA ? Oui probablement.

Ce que je comprend pas c’est comment ils ont pas un “raspberry pi” dans chaque infra qui tente de joindre les autres afin de détecté ces soucis quasi immédiatement (si le gas ou la femme) qui avais fait l’erreur avais eu un retours négatif quasi instantané, l’erreur aurait coupé l’accès que quelques minutes max).

note: solution simpliste peut être impossible a réaliser a leur échelles.

alex.d. Abonné

Le 14/10/2021 à 11h 25

#18.1

Si tu perds le lien, c’est qu’OSPF est déjà parti en vrille, donc il est déjà trop tard : tout ton réseau est planté.

hansi Abonné

Le 14/10/2021 à 17h 28

#19

Le gars rentre chez lui : “Maman, j’ai coupé l’internet !”
Et dire qu’il y a encore des cons pour faire la chasse aux terroristes… ;)=

Golffies

Le 15/10/2021 à 05h 48

#20

(quote:1907356:Naruto`kun)
Donc ce cas la ipv6 aurait servi de roue de secours a internet. De la même manière que si l’erreur était arrivé sur la config ipv6, ipv4 aurait servi de backup.

Si l’erreur était arrivée sur la config ipv6, plus probablement la panne serait simplement restée indolore et la presse n’en aurait pas parlé.

MoonRa

Le 15/10/2021 à 07h 29

#21

C’est tellement ridicule, arrogant et fallacieux d’appelé les gens “yakafokons”, genre leur avis ont aucune validité. OVH stack les erreurs, ce n’est pas sérieux a ce niveau, d’autant plus que ça tourne bien chez les concurrents…

SKN Abonné

Le 15/10/2021 à 12h 28

#21.1

Les concurents genre Facebook? AWS? Azure? qui ont tous eu de bons problèmes (réseau ou autre) sur les 2 dernières années mais ont très peu communiquer dessus?

J’était tombé sur un un petit listing (via la FRNOG je crois, j’essaierai de le retrouver à l’occase), moi même j’était pas au courant de la moitié, pourtant il y a eu pas mal de monde d’impacté..

oliv5 Abonné

Le 15/10/2021 à 08h 03

#22

(reply:1907749:MoonRa) Troll ?

Ce nom est certes péjoratif, mais il représente bien la situation.

OVHcloud coupé du monde (en IPv4) : retour sur une panne à l’échelle mondiale

PRA/PCA FTW !

Une erreur aux États-Unis fait tomber tout le réseau

Quand on vous dit de passer à IPv6

Un problème, ça peut arriver, quoi qu’en disent les yakafokons

Pour OVHcloud, le problème c’est l’image de marque

Tiens, en parlant de ça :

#Flock fait son cinéma

Huahu ahu ouin ouin ouiiin... Vous l'avez ?

Le fichier des empreintes digitales sera interconnecté avec huit autres fichiers

FAED y verse

Le ciblage publicitaire ne peut pas utiliser des données personnelles récupérées ailleurs

Schrems vs Meta, encore et encore

Sommaire de l'article

Introduction

Une erreur aux États-Unis fait tomber tout le réseau

Quand on vous dit de passer à IPv6

Un problème, ça peut arriver, quoi qu’en disent les yakafokons

Pour OVHcloud, le problème c’est l’image de marque

#Flock fait son cinéma

Le fichier des empreintes digitales sera interconnecté avec huit autres fichiers

Le ciblage publicitaire ne peut pas utiliser des données personnelles récupérées ailleurs

Windows 11 ajoute des publicités dans le menu Démarrer, comment les supprimer

Reddit : cas d’école de la pollution par les contenus générés par IA ?

Transhumanisme, long-termisme… comment les courants « TESCREAL » influent sur le développement de l’IA

Qualcomm dévoile son Snapdragon X Plus et trois variantes du modèle Elite

Transhumanisme, long-termisme… des idéologies aux racines eugénistes ?

Corrigée depuis deux ans, une faille Windows activement exploitée par des pirates russes

La CNIL fait le bilan de son année 2023, cinquième année après RGPD

#LeBrief : TikTok suspend sa version Lite, Ariane 6 debout, enquête sur Pegasus, l’Europe et la violence numérique aux femmes

Terrorgram, la fabrique de terroristes d’extrême-droite, à coups de mèmes et de shitposts

Fiabilité des disques durs HAMR de 30 To et plus : Seagate donne des chiffres

[Màj] Le Congrès des États-Unis vote la loi obligeant ByteDance à vendre TikTok

#LeBrief : Fedora 40, anniversaire Hubble, vidéosurveillance algorithmique à Cannes, Voyager 1, Android 15 bêta 1.1

Sur GitHub et GitLab, des commentaires détournés pour stocker des malwares

[FAQ] Notre antisèche sur l’informatique quantique

L’Université d’Oxford ferme le Future of Humanity Institute dirigé par Nick Bostrom

#LeBrief : Apple rachète le français Datakalab (IA), propagande de la Russie, fin de partie pour Roccat, Proton Mail vs dark web

Commentaires (41)