GitLab : erreur humaine et sauvegardes défaillantes entrainent la perte de 6h de données

Oups ?

GitLab se remet péniblement d’un accident qui a vu la disparition de nombreuses informations. Pendant six heures, des problèmes se sont succédé, suite à une mauvaise manipulation d'un administrateur.

GitLab, une alternative open source à GitHub, se remet péniblement d’un incident majeur dans ses bases de données. Un administrateur système a supprimé par erreur un dossier contenant 300 Go de données diverses : bugs, merge requests, métadonnées utilisateurs, commentaires, snippets et autres. Une action qui a pris place dans le cadre d'une lutte contre un phénomène détecté de spam.

Environ 5 000 projets ont été touchés

Si l’on connait en détails les raisons de cet accident, c’est que GitLab a choisi de jouer la carte de la transparence complète. Et si ce point est particulièrement appréciable, c’est que l’éditeur assume pleinement sa faute dans le déroulement de l’incident. Et pour cause : sur les cinq mécanismes mis en place pour gérer et restaurer les sauvegardes, aucun n’a fonctionné pleinement.

Les erreurs constatées par les administrateurs sont à la fois surprenantes et assez « amusantes ». On trouve pêle-mêle des sauvegardes qui ne se faisaient que toutes les 24 heures, des données sauvegardées à des emplacements inconnus, des informations parfois irrécupérables à cause d’erreurs dans la configuration, des snapshots Azure qui n’étaient activés que pour le serveur NFS, des sauvegardes qui n’ont pas du tout fonctionné avec les serveurs S3 (Amazon), une réplication des données générant des incohérences, des fichiers de quelques octets à peine...

Les problèmes ont commencé mardi soir. Ils se sont enchainés pendant environ six heures, GitLabs constatant au fur et à mesure que ses techniques de sauvegarde et de duplication ne fonctionnaient pas, ou alors très mal. Un véritable feuilleton puisque l'éditeur a ouvert pour l'occasion un flux vidéo en direct sur YouTube, suivi par des milliers de personnes.

GitLab indique que seuls 1 % des utilisateurs ont été touchés par le problème, ce qui représente précisément 707 comptes. En tout, 5 037 projets, 74 forks et 350 importations environ ont été supprimés. Environ 5 000 commentaires sont également perdus. Ces informations correspondent en fait aux données non prises en charge par la dernière sauvegarde, qui dataient de six heures auparavant.

La transparence d'un côté, l'étonnement de l'autre

Si la suppression malencontreuse n'avait laissé que 4,5 Go de données sur les 300 Go initiaux, presque tous ont pu finalement être restaurés hier soir après une longue lutte. Signalons par ailleurs que les données centrales des dépôts Git n’ont pas été touchées. GitLab indique en effet que seules des « métadonnées périphériques » ont été perdues « pendant une fenêtre de six heures ». Cependant, même si GitLab a montré une transparence exemplaire en ne cachant rien de ses problèmes et de sa propre responsabilité, les développeurs concernés pourraient ne pas être d’accord avec cette notion de « périphériques ».

Le fait qu’aucun des cinq mécanismes de sauvegarde et de réplication n’ait correctement fonctionné représente évidemment un sérieux problème. De fait, GitLab est à la fois félicité pour ses informations précises données aux utilisateurs et condamné pour ne pas avoir suffisamment testé ses propres outils. GitLab servant de carrefour pour la gestion de projets, la fiabilité et la confiance sont en effet primordiaux.

Actuellement, tous les services fonctionnent normalement, après une interruption d'environ 24 heures. GitLab assure que des mesures ont été prises et continueront de l’être pour que ce type d’incident ne se reproduise plus, y compris sur les mécanismes fautifs de sauvegarde.

Commentaires (89)

DUNplus Abonné

Le 02/02/2017 à 13h 06

Kernelcoffee a écrit :

Les systèmes moderne sont stable (j’ai pas reinstall un windows parce qu’il était mort depuis win 7)

Pour peu qu’on ai plusieurs ordi on peut sauvegarder les documents important

avec Dropbox ou BittorrentSync en plus du backup sur disque externe

+90% des jeux sont acheté/install via une plateforme du type steam qui syncro les sauvegardes

(+ tout mon taff est sur github/gitlab)

Alors tu sauvegarde tes projets sur gitlab ?

tutosfaciles48

Supprimer des fichiers comme ça à la main sans vérifier les sauvegardes … " />" />

FunnyD

Le 02/02/2017 à 13h 08

Ça fait amateur non ? par contre communiquer correctement, ça nous change.

Le 02/02/2017 à 13h 10

en me^me temps il on assurés

anonyme_b93219f691a6afd6966660cd49d7951e

Le 02/02/2017 à 13h 11

Petite pensée au 707 comptes dont certains ont perdu certainement beaucoup. GitLab s’en lave les mains: “Excusez-nous mais on ne peut rien pour vous.”

sephirostoy Abonné

En même temps, c’est rare qu’une erreur soit qualifiée de professionnelle.

Zekka Abonné

Le 02/02/2017 à 13h 13

Sur une rediffusion partielle de leur live, on pouvait voir les mecs sourire et rigoler en même temps qu’ils essayaient de réparer tout le merdier, même pas peur l’équipe " /> .

Anonyme_f7d8f7f164fgnbw67p

Le 02/02/2017 à 13h 16

Cacahuete586 a écrit :

Petite pensée au 707 comptes dont certains ont perdu certainement beaucoup. GitLab s’en lave les mains: “Excusez-nous mais on ne peut rien pour vous.”

En meme temps que peuvent-ils faire ?

gogo77

Le 02/02/2017 à 13h 17

Ça m’a bien niqué ma journée hier, j’étais sur le cul qu’un tel truc se produise. Mais chapeau pour la transparence, la communication en continu et la restauration en live sur youtube! J’avais jamais vu ça.

Bref ces mecs font un taf super pour proposer une vraie alternative à github ou bitbucket donc je leur laisse une chance parce que j’ai envie de croire qu’ils amélioreront leur système.

Patch Abonné

Le 02/02/2017 à 13h 18

#10

Zekka a écrit :

Sur une rediffusion partielle de leur live, on pouvait voir les mecs sourire et rigoler en même temps qu’ils essayaient de réparer tout le merdier, même pas peur l’équipe " /> .

En même temps ils vont pas se mettre à pleurer, ca ne changera rien…

GruntZ Abonné

Le 02/02/2017 à 13h 20

#11

Cacahuete586 a écrit :

Petite pensée au 707 comptes dont certains ont perdu certainement beaucoup. GitLab s’en lave les mains: “Excusez-nous mais on ne peut rien pour vous.”

Il faut lire les conditions d’utilisation : https://about.gitlab.com/terms/ §16

Au mieux, ils remboursent les 12 derniers mois … ce qui va pas faire lourd pour des comptes gratuits.

ayaredone

Le 02/02/2017 à 13h 22

#12

Après j’ai quand même envie de dire que l’utilisateur est responsable de ses données.

Est-ce que Gitlab prend contractuellement à sa charge la responsabilité des sauvegardes ?

Vser Abonné

Le 02/02/2017 à 13h 23

#13

En attendant, j’ai peur qu’il y ait de légers problèmes qui restent, je ne peux pas commenter sur une issue dont le sujet est que l’auteur n’arrive plus à commenter une issue… " />

Le 02/02/2017 à 13h 24

#14

Je n’ai pas dis le contraire, c’est juste qu’on voyait peu le stress de la situation sur leur visage “yololo tout va bien”, ça prêtait seulement à sourire.

Le 02/02/2017 à 13h 26

#15

Zekka a écrit :

Je n’ai pas dis le contraire, c’est juste qu’on voyait peu le stress de la situation sur leur visage “yololo tout va bien”, ça prêtait seulement à sourire.

Ils ne vont pas se fouetter ni se mettre des oignons sous les yeux pour paraitre tristes, non plus.

Sourire, attitude positive, toussa…

Arnaud3013 Abonné

Le 02/02/2017 à 13h 27

#16

Et pour les comptes floués, ils ont surement les data en local non?

qmarlats

Le 02/02/2017 à 13h 28

#17

C’est vrai que ça fait amateur comme erreur, mais franchement ils ont quand même vraiment pas eu de chance. " />

Si j’ai bien compris, les problèmes ont commencés à cause de quelqu’un qui se servait de Gitlab comme un CDN. Ça a surchargé leur base de données primaire, puis bloqué la réplication dans la base secondaire. Le gars de GitLab voulait effacer la base secondaire pour reprendre la réplication à zéro mais il s’est trompé et a effacé la primaire. Pas de chance, aucune de leurs sauvegardes ne fonctionnaient. Et comme si ça suffisait pas, dès qu’ils trouvent (un peu par chance) une sauvegarde fonctionnelle, ils doivent la copier et la copie est limitée à 5-6 Mo/s. Ils ont eu un enchaînement de malchance juste hallucinant. " />

Mais ils ont été exemplaires sur la transparence (non seulement ils communiquaient, mais en plus ils répondaient aux questions des gens). Et ils ont publié sur leur issues tracker ce qu’ils comptent faire pour que ça n’arrive plus et forcément vu l’ampleur de l’incident qu’ils ont eu, ils vont se mettre en mode parano. Donc perso ils sont pardonnés, ce genre de chose peut arriver (et c’est déjà arrivé à Github dans le passé).

keralan

#18

Ils étaient sous prozac pour gérer le stress…

tifounon

Le 02/02/2017 à 13h 29

#19

J’ai eu la même attitude lorsque j’ai bousillé 150 Go de données de projets divers (dont des contrats, sources, etc.) pour m’apercevoir aussi que les sauvegardes étaient mortes depuis 15 jours, et comme nous n’avons que 7 jours de rétention… " />

[MyLife]

Après avoir pris une soufflante en règle par mes chefs parceque c’était inadmissible de n’avoir que 7 jours de rétention, je leur ai rappelé que c’était aussi leur faute car ils n’avaient pas voulu investir dans un petit NAS à 5000 € (preuve par email).

Bizarrement, ce fut le silence radio après

[/MyLife]

Le 02/02/2017 à 13h 30

#20

Zekka a écrit :

Je n’ai pas dis le contraire, c’est juste qu’on voyait peu le stress de la situation sur leur visage “yololo tout va bien”, ça prêtait seulement à sourire.

Je ne vois toujours pas ce que ca change…

jackjack2

#21

Je pense qu’il faudrait préciser (titre + article) que le problème a touché Gitlab.com et non le projet Gitlab

Sinon, ouais, incroyable…

At 2017/01/31 11pm-ish UTC,

team-member-1 thinks that perhaps pg_basebackup is refusing to work due to the PostgreSQL data directory being present (despite being empty), decides to remove the directory.

After a second or two he notices he ran it on db1.cluster.gitlab.com, instead of db2.cluster.gitlab.com.

At 2017/01/31 11:27pm UTC,

team-member-1 - terminates the removal, but it’s too late. Of around 300 GB only about 4.5 GB is left.

Le 02/02/2017 à 13h 32

#22

-Erreur-

anonyme_751eb151a3e6ce065481d43bf0d18298

Le 02/02/2017 à 13h 34

#23

Les sauvegardes étaient trop libres " />

#24

Mais que ça change quoi? J’ai pas parlé de changer quelque chose.

Rire un peu de la situation ça va c’est possible encore ou non?

Kernald

#25

Quand le stream a été mis en place, ils y avait déjà passé plusieurs heures, et c’était la fin de journée pour l’équipe (la suppression accidentelle de la base primaire a été faite à 23h chez eux). Je sais pas toi, mais perso, quand je suis sur un problème depuis 6 ou 7h après ma journée de travail, j’ai du mal à rester stressé. Et puis bon, le plus gros était déjà passé.

tazvld Abonné

Le 02/02/2017 à 13h 41

#26

Ha ! les sauvegardes, ça marche jusqu’au jour où on en a besoin. J’ai l’impression que les mecs, là, ils ont aligné toutes la panoplie de la sauvegarde raté, quoique, il manque je trouve le coup de la défaillance matérielle, que l’on se rend compte que notre disque de sauvegarde était déjà mort.

Zekka a écrit :

Sur une rediffusion partielle de leur live, on pouvait voir les mecs sourire et rigoler en même temps qu’ils essayaient de réparer tout le merdier, même pas peur l’équipe " /> .

Tu sais, lorsque tu as perdu tout espoir, ils ne te restes plus qu’à rire de ton malheur. Je suis le premier à être plié de rire quand les merdes s’accumulent.

revker

Le 02/02/2017 à 13h 52

#27

C’est moche :/

Mr.Nox Abonné

Le 02/02/2017 à 13h 54

#28

Stopper la réplication et révoquer l’accès à celui les utilisants comme CDN n’aurait pas été mieux ?

Le 02/02/2017 à 13h 58

#29

tazvld a écrit :

Tu sais, lorsque tu as perdu tout espoir, ils ne te restes plus qu’à rire de ton malheur. Je suis le premier à être plié de rire quand les merdes s’accumulent.

D’après mon expérience de visionnage “D’unité spéciale pour les victime”, il ne faut surtout pas faire ça!

L’avocat de la défense dira que tu est consentant. :reflechie:

v1nce

Le 02/02/2017 à 14h 01

#30

C’est sans doute nerveux.

Ca m’est arrivé quand dans la même journée :

on a cartonné 2 fois ma voiture,

crash disque de mon poste,

multiplication des incidents avant mise en prod d’un projet important…

   

 

#31

Zekka a écrit :

Je n’ai pas dis le contraire, c’est juste qu’on voyait peu le stress de la situation sur leur visage “yololo tout va bien”, ça prêtait seulement à sourire.

Personnellement, lorsque je suis dans cette état, un peu “yolo”, c’est justement là que j’arrive a mieux géré pour sauver les meubles que juste avant lorsque j’étais roulé en boule dans un coins bloqué sur un détail inutil et de toute façon sans espoir. Il y a un moment où on accepte que de toute façon, on ne va pas pouvoir tout sauver, c’est à ce moment où on arrive à se libèrer des détails pour s’intéresser finalement à ce qui est le plus important.

Tarvos

Le 02/02/2017 à 14h 03

#32

J’ai un peut de mal a comprendre. Sous Win/Lin y’a des programmes de récupérations de données.

Pourquoi n’utilisent il pas ce genre de soft ? .

 

Est ce a cause des sauvegardes réseaux ? . Parce que j’imagine que si j’ai un serveur sur 1on1 / page perso chez Free / ou autres, doit yavoir moyen de lancer une recupe des données?

 

Le 02/02/2017 à 14h 05

#33

gem install wayback_machine_downloader

wayback_machine_downloader https://gitlab.com

mizuti

Le 02/02/2017 à 14h 09

#34

“out of five backup/replication techniques deployed none are working reliably or set up in the first place.”

Ils ont vraiment pas eu de chance " />

Charly32

#35

Drepanocytose a écrit :

Ils ne vont pas se fouetter ni se mettre des oignons sous les yeux pour paraitre tristes, non plus.

Sourire, attitude positive, toussa…

Patch a écrit :

Je ne vois toujours pas ce que ca change…

En effet, mais là on parle de communication de crise. Il ne faudrait pas que les clients, surtout ceux concernés par la perte de données, aient l’impression que les équipes prennent ça à la légère.

Je suis d’accord qu’il est important pour les équipes qu’elles arrivent à garder le moral dans une telle situation, et que faire la gueule/être stressé ne fera pas revenir les données, mais c’est une attitude valable en “back office”. L’idée du stream est bonne pour la transparence, mais il ne faudrait pas que ça nuise à leur image. 

Le 02/02/2017 à 14h 10

#36

Je suis pas sûr d’avoir tout bien compris de ce qu’il s’est passé, mais il me semble que au moment de la surcharge dû à cet utilisateur (qu’ils ont supprimé rapidement, mais le mal était déjà fait) et au spam, la réplication a pris du retard puis s’est bloqué, et ils n’ont pas réussi à la redémarrer. Et c’est à ce moment là que le gars de GitLab, en voulant supprimer la base de données secondaire, s’est trompé et a supprimé la primaire. Maintenant j’ai peut-être mal compris, tu peux vérifier par toi-même, tout est très détaillé sur leur blog (lien dans l’article).

Zerdligham

Le 02/02/2017 à 14h 11

#37

C’est après avoir ban qui de droit, et en essayant de remettre en place la réplication qu’ils ont supprimé le mauvais dossier. (en fait le bon dossier, mais sur la mauvaise machine)

Edit: Grillé

SNUT

Le 02/02/2017 à 14h 22

#38

La magie du cloud

Juju251 Abonné

Le 02/02/2017 à 14h 25

#39

Tarvos a écrit :

J’ai un peut de mal a comprendre. Sous Win/Lin y’a des programmes de récupérations de données.

Pourquoi n’utilisent il pas ce genre de soft ? .

 

Est ce a cause des sauvegardes réseaux ? . Parce que j’imagine que si j’ai un serveur sur 1on1 / page perso chez Free / ou autres, doit yavoir moyen de lancer une recupe des données?

 

Parce que le stockage en bases de données / en réseau quand tu as du stockage éclaté sur plusieurs prestataires / infras, c’est juste “un peu” plus compliqué que le stockage sur un disque dur sur un poste isolé.

plop97

Le 02/02/2017 à 14h 26

#40

En général chaque dev possède la copie complète en local donc ça paraît compliqué de tout perdrz

Le 02/02/2017 à 14h 27

#41

Juju251 a écrit :

Parce que le stockage en bases de données / en réseau quand tu as du stockage éclaté sur plusieurs prestataires / infras, c’est juste “un peu” plus compliqué que le stockage sur un disque dur sur un poste isolé.

Ah la la, ils auraient du prendre une time machine sur l’apple cloud… Les noobs.

Le 02/02/2017 à 14h 29

#42

Merci à toi et Qmarlats " />

Alyptica

Le 02/02/2017 à 14h 35

#43

A priori ce ne sont “que” les données sur une fenêtre de 6h qui sont perdues.

Les données de projet git (code, wiki) n’ont pas été impactées par cet incident.

lincruste_2_la vengeance

#44

Ils sont open jusqu’au bout, chapeau. Y’a pas mal de structures que leur exemple va motiver à vérifier leurs propres systèmes de sauvegardes.

PtaH

Le 02/02/2017 à 14h 38

#45

C’est clairement le genre de probleme qui ne pourrait jamais arriver dans le monde Open Source, parcequ’on sait qu’il y a des centaines de gens qui auditent attentivement le code et les process " />

" />

Le 02/02/2017 à 14h 41

#46

Bof tu t’adresse à des devs qui si c’est leur métier savent comment ça se passe. Quand c’est pété c’est pété, tu fais de ton mieux et puis c’est tout. Pleurer n’arrangera rien et les devs le savent.

Si tu montres ça à des managers peut être qu’ils ne comprendraient pas, mais le live ne leur était pas vraiment destiné. Il ne faut pas oublier aussi qu’on parle de comptes gratuits sur gitlab.com, les clients payants payent soit pour une licence pour héberger eux même une version entreprise, soit payent pour que gitlab les hébergent sur un serveur séparé (donc j’imagine qu’ils n’ont pas été touchés par cet incident). Tu peux te permettre de revoir tes exigences à la baisse quand tu ne lâche pas un rond alors que ces mecs travaillent comme des dingues sur leur produit. Gitlab.com est une sorte de vitrine et bien que les utilisateurs ne payent pas ils ont déjà une sacré qualité de service. J’y suis depuis un moment pour mes projets perso et au départ c’était très loin de ce qu’il y a maintenant. Ils avaient un pauvre serveur dédié qui peinait à fournir le service à tout le monde et ils essaient constamment d’améliorer.

#47

Par contre j’imagine que si la copie de la sauvegarde était limitée à 5-6 Mo/s c’était de la faute à Azure, du coup je me demande pourquoi ils restent chez eux… " /> En plus s’ils passaient chez AWS par exemple ils pourraient utiliser RDS (un équivalent doit sûrement exister chez GCE aussi).

Minikea

Le 02/02/2017 à 14h 47

#48

il semble qu’ils aient les deux, en redondance.

Le 02/02/2017 à 15h 06

#49

Le principe de la redondance normalement c’est que si une base de données tombe une autre prend le relais, pas que si une base de données tombe elle entraîne l’autre (indirectement) dans sa chute… " /> (Plus sérieusement merci de l’info je savais pas)

WereWindle

Le 02/02/2017 à 15h 11

#50

tazvld a écrit :

c’est à ce moment où on arrive à se libèrer des détails pour s’intéresser finalement à ce qui est le plus important.

“où diable ai-je laissé ce petit sac de cocaïne ?” ?

LostSoul Abonné

Le 02/02/2017 à 15h 27

#51

qmarlats a écrit :

Par contre j’imagine que si la copie de la sauvegarde était limitée à 5-6 Mo/s c’était de la faute à Azure, du coup je me demande pourquoi ils restent chez eux… " /> En plus s’ils passaient chez AWS par exemple ils pourraient utiliser RDS (un équivalent doit sûrement exister chez GCE aussi).

Visiblement ils ont aussi eu des soucis avec leur infra AWS …

anonyme_2f3903e95215529534670e36d84faaa5

Le 02/02/2017 à 15h 29

#52

GitLab pour héberger sur son propre serveur c’est très bien mais je vois pas trop l’intérêt de l’utiliser comme alternative à Github pour les dépôts publics open source, ce dernier étant bien plus complet (et fiable visiblement..).

Jarodd Abonné

Le 02/02/2017 à 15h 30

#53

Erreur humaine, communication au top. On peut regretter s’il y a eu des dégâts chez les clients, mais Gitlab a fait ce qu’il pouvait, dans une situation pas facile. Et ça va les inciter à s’améliorer, et corriger ces erreurs.

Le 02/02/2017 à 15h 38

#54

Les dépôts Git ne sont dans tous les cas pas touchés, c’est “juste” les données qui gravitent autour : tickets, merge requests…

Gromsempai Abonné

#55

Euh… ils n’ont pas perdu 300Go de données vu qu’il y avait un backup manuel qui a été fait 6h avant et qu’ils ont pu restaurer la base.

Effectivement ils ont perdu des commentaires / issues / etc (mais aucun code versionné) mais seulement sur cette fameuse fenêtre de 6h.

L’article sous entend qu’ils ont perdu presque la totalité des 300Go définitivement et qu’il ne reste que 4,7Go soit 99% des donnés mais que seulement 1% des utilisateurs sont touchés oO Incohérent non ?

Chiendelune

Le 02/02/2017 à 15h 42

#56

Tu n’as pas du trop connaître les DDOS/downtime de GitHub en 2015-2016. C’était une horreur qui durait plusieurs heures et qui revenait régulièrement. Bon on perdait pas de données, juste des journées de boulots :(

Concernant les fonctionnalités de GitLab.com pour les projets open-sources, on a quasiment voir toutes les fonctionnalités de GitHub avec en plus une plateforme de CI directement intégrée là où pour GitHub, il est nécessaire d’utiliser un service externe pour l’utiliser. C’est fluide, aussi simple que GitHub, et bien meilleure que d’autres solutions commerciales (Bitbucket, je pense à toi). 

#57

StackHeap a écrit :

GitLab pour héberger sur son propre serveur c’est très bien mais je vois pas trop l’intérêt de l’utiliser comme alternative à Github pour les dépôts publics open source, ce dernier étant bien plus complet (et fiable visiblement..).

C’est marrant je trouve Gitlab bien plus complet

Et je l’utilise sur Framagit

Speedy37

Le 02/02/2017 à 15h 56

#58

Bizarre les chiffres, ils parlaient d’une perte de 6h de data… 

As of time of writing, we’re restoring data from a six-hour-old backup of our database. This means that any data between 5:20pm UTC and 11:25pm UTC from the database (projects, issues, merge requests, users, comments, snippets, etc.) is lost by the time GitLab.com is live again.

anonyme_8db2db86e6e8bfd8080de99876638d13

Le 02/02/2017 à 16h 23

#59

Perso j’utilise Gogs depuis plusieurs mois, c’est le seul que mon raspberry était capable d’encaisser car gitlab était trop lourd pour lui. Et bien pour l’instant rien à redire c’est une tuerie, de plus je suis le maître de mon serveur ce qui est un plus pour les backups… " />

Le 02/02/2017 à 16h 26

#60

Trollalalala a écrit :

Perso j’utilise Gogs depuis plusieurs mois, c’est le seul que mon raspberry était capable d’encaisser car gitlab était trop lourd pour lui. Et bien pour l’instant rien à redire c’est une tuerie, de plus je suis le maître de mon serveur ce qui est un plus pour les backups… " />

" />

Installation prévue à court terme!

 

seb2411

#61

Au final, sur les 300 Go concernés par la commande de suppression, il ne restait plus que 4,5 Go. GitLab indique que seuls 1 % des utilisateurs ont été touchés par le problème, ce qui représente précisément 707 comptes. En tout, 5 037 projets, 74 forks et 350 importations environ ont été supprimés. Environ 5 000 commentaires sont également perdus.

Ils ont supprimé la base de donnée et restoré une sauvegarde qui avait était faite 6h avant. Ils n’ont pas perdu 300Go (qui est la taille totale des données) mais simplement les donnée crée durant ces 6 heures.

Le 02/02/2017 à 16h 31

#62

Chiendelune a écrit :

Tu n’as pas du trop connaître les DDOS/downtime de GitHub en 2015-2016. C’était une horreur qui durait plusieurs heures et qui revenait régulièrement. Bon on perdait pas de données, juste des journées de boulots :(

C’est toujours le cas en 2017 au passage. On a eu une coupure de 8H en debut d’année.

anonyme_1239fd635f3ad0729220d37e3113ae29

#63

On se retrouve quand même face au B.A.-BA du métier : s’assurer que les mécanismes de récupération de données fonctionnent bien comme attendu.

Le 02/02/2017 à 16h 38

#64

Tu ne devrais pas être déçu !La compilation par les sources est un peu délicate pour un non-initié sur un pi mais ils fournissent des binaires pour les systèmes debian et la doc du site est vraiment complète, la config se fait avec la doc également, franchement rien à redire ! " />

#65

ITWT a écrit :

On se retrouve quand même face au B.A.-BA du métier : s’assurer que les mécanismes de récupération de données fonctionnent bien comme attendu.

Et normalement on a des plans de test pour ce genre de chose, qui sont exécutés régulièrement :p

Alexyu

Le 02/02/2017 à 16h 47

#66

LostSoul a écrit :

Et normalement on a des plans de test pour ce genre de chose, qui sont exécutés régulièrement :p

Ca c’est la théorie, quand tu vends au client " />

Le 02/02/2017 à 17h 17

#67

StackHeap a écrit :

GitLab pour héberger sur son propre serveur c’est très bien mais je vois pas trop l’intérêt de l’utiliser comme alternative à Github pour les dépôts publics open source, ce dernier étant bien plus complet (et fiable visiblement..).

Et les repo privés? On a le droit de vouloir faire des projets pour soi sans souhaiter les exposer à la face du monde (ou alors pour une boîte qui ne souhaite pas forcément exposer tout son code)

Sinon je ne vois pas vraiment où Github est plus complet en plus les mecs de chez Gitlab sont assez proactifs sur l’évolution de leur produit alors que Github ça bouge pas vraiment.

Le gros plus de Gitlab pour moi c’est l’outil d’intégration continu intégré qui marche très bien. J’aime pas avoir 50 outils surtout sur des choses comme ça où ça a du sens de les regrouper.

Le 02/02/2017 à 17h 43

#68

Alexyu a écrit :

Ca c’est la théorie, quand tu vends au client " />

De fait, la preuve " />

Zylvain

Le 02/02/2017 à 18h 11

#69

Ca va me faire “plaisir” quand cela va arriver sur un iCloud ou un truc de style et que des personnes vont perdre beaucoup. Les gens réaliseront peut-être enfin que c’est totalement dingue de laisser toutes ces données dans le Cloud à la merci d’un seul prestataire et que cela ne remplace pas une sauvegarde faite soit même en parallèle.

CryoGen

Le 02/02/2017 à 18h 14

#70

Des plans de test toutes les 6 heures ?

Si j’ai bien tout compris, ils n’ont finalement perdu que 6h de données, donc c’est que la dernière bonne sauvegarde datait de 6h non ?

lossendae

Le 02/02/2017 à 18h 36

#71

C’est un repo git, tu perds pas tes données (avec gitlab, github, bitbucket…).

Cetera

Le 02/02/2017 à 18h 49

#72

Heureusement que ce sont des petits jeunes car les vieux trouvent que ce n’est pas si grave. Si cela avait été des petits vieux, on imagine les sauts de vomi de la part des petits jeunes sur ces vieux c.. qui n’y connaissent rien., Je me demande comment ils vont vieillir ces petits jeunes irréprochables..;-)

Leixia Abonné

Le 02/02/2017 à 19h 25

#73

5000€ le petit NAS? " />

Le 02/02/2017 à 20h 38

#74

le mot important, c’est “petit” " />

Folgore

Le 02/02/2017 à 22h 27

#75

A se demander quand meme si les gens suppriment leur projet une fois poussé …

Je pense que le pire ce sont ceux qui poussé leurs trucs en vue d’un formatage PC. Peux être des mois de code qui sont partie en fumée. Mais bon faut être fou d’accorder 100% de confiance a ces services en ligne. Moi je m’en tiens a 98%, les 2% c’est le zip en plus que je copie sur un autre disque dur, clé usb.

Le 02/02/2017 à 22h 59

#76

Leixia a écrit :

5000€ le petit NAS? " />

Oui, un ptit Syno 10 To " />

Le 02/02/2017 à 23h 11

#77

On a un un 2416RP+ au boulot et perso j’ai un DS1815+ chez moi, j’en ai pas eu pour 5000€ que ce soit au boulot ou chez moi " />

Après ça dépend des disques…

Le 03/02/2017 à 06h 34

#78

RS3614xs+ avec 12 HDD 2 To SATA

jpaul Abonné

Le 03/02/2017 à 08h 42

#79

Folgore a écrit :

A se demander quand meme si les gens suppriment leur projet une fois poussé …

Je pense que le pire ce sont ceux qui poussé leurs trucs en vue d’un formatage PC. Peux être des mois de code qui sont partie en fumée. Mais bon faut être fou d’accorder 100% de confiance a ces services en ligne. Moi je m’en tiens a 98%, les 2% c’est le zip en plus que je copie sur un autre disque dur, clé usb.

Pourtant il suffit de lire la news pour se rendre compte qu’aucune ligne de code n’a été perdue. “Seulement” la base de données (donc tout ce qui n’est pas du code : users, pull requests, paramétrages, commentaires …)

karma1911

Le 03/02/2017 à 08h 59

#80

Rien d’incohérent.. Encore une fois la DB touchée est celle qui s’occupe des commentaires, merges etc.. En gros, sur les 6h perdues, t’as 1% des utilisateurs qui ont dû être actifs et qui ont perdus les comments, merges, etc.. 

Perso je vois rien de déconnant là-dedans.

Quant à l’attitude “yolo” décriée par certains.. Retrouvez-vous dans une situation de crise semblable, et vous comprendrez tout à fait que se rouler en position foetale sous le bureau n’arrangera rien, le mal est fait, autant y aller coolos et tenter de trouver des solutions en étant positif. 

YamaLandia

Le 03/02/2017 à 09h 14

#81

ITWT a écrit :

On se retrouve quand même face au B.A.-BA du métier : s’assurer que les mécanismes de récupération de données fonctionnent bien comme attendu.

LostSoul a écrit :

Et normalement on a des plans de test pour ce genre de chose, qui sont exécutés régulièrement :p

ça m’a juste fait penser à ceci :&nbsphttp://www.commitstrip.com/fr/2016/09/05/do-we-have-a-back-up-in-the-audience " /> 

Le 03/02/2017 à 09h 18

#82

YamaLandia a écrit :

ça m’a juste fait penser à ceci :&#160http://www.commitstrip.com/fr/2016/09/05/do-we-have-a-back-up-in-the-audience " />

M’en rappelle de celui là !

MoonRa

Le 03/02/2017 à 11h 11

#83

Je suppose que les équipes qui ont perdu des données sur le serveur distant, les ont encore en locale. C’est un gros coup à l’image de l’entreprise, ceux qui s’en frottent les mains doivent être GitHub.

divide

Le 03/02/2017 à 11h 22

#84

Bof, pour les commits c’est pas dramatiques dans le mesure ou on commit d’abord en local avant d’uploader.

Xaelias

Le 05/02/2017 à 19h 44

#85

Mais gitlab c’est git. Tous les comptes impactés devaient avoir leur travail en local non?

Le 06/02/2017 à 01h 59

#86

jpaul a écrit :

Pourtant il suffit de lire la news pour se rendre compte qu’aucune ligne de code n’a été perdue. “Seulement” la base de données (donc tout ce qui n’est pas du code : users, pull requests, paramétrages, commentaires …)

Le 06/02/2017 à 08h 30

#87

La news a été modifiée depuis, donc je peux comprendre que mon commentaire semble bizarre maintenant, mais il y avait des incohérences ;)

Le 06/02/2017 à 15h 25

#88

Ouai mais mon point majeur c’est: donc en fait on s’en bat un peu les steaks?

L’incident a certes de l’importance. Mais l’impact reste extrêmement limité.

Le 07/02/2017 à 07h 26

#89

Oui et non.

 S’ils ont perdu les issues, ce sont plusieurs jours de planification/documetnation de sprint qui ont pu être perdu.

Dans l’absolu, ce n’est pas grave, ça dépend surtout de l’état d’esprit des chefs de projets et/ou dsi.

GitLab : erreur humaine et sauvegardes défaillantes entrainent la perte de 6h de données

Oups ?

Environ 5 000 projets ont été touchés

La transparence d'un côté, l'étonnement de l'autre

Tiens, en parlant de ça :

EUCS : la certification cloud européenne sous le feu des critiques en France

Chiens de faïence

L’Institut des normes de télécommunication de l’UE (ETSI) défie la Commission européenne

Irréductible gaulois, #oupas

Le « payer ou accepter » de Meta incompatible avec le RGPD pour le CEPD

Schrems vs Meta, une histoire sans fin

Sommaire de l'article

Introduction

Environ 5 000 projets ont été touchés

La transparence d'un côté, l'étonnement de l'autre

EUCS : la certification cloud européenne sous le feu des critiques en France

L’Institut des normes de télécommunication de l’UE (ETSI) défie la Commission européenne

Le « payer ou accepter » de Meta incompatible avec le RGPD pour le CEPD

Le CERN libère les données de la découverte du boson de Higgs

Le ministère de l’Intérieur mise sur l’américain TRM Labs pour traquer les flux illégaux de cryptos

#LeBrief : spectre du gamergate, TikTok Lite sous pression, Freebox Ultra vs Deus Ex Silicium, Pegasus en Pologne

Le Slip français se fait trouer : 1,5 million d’emails et des données de 696 144 clients dérobés ?

Après l’affaire XZ Utils, la sécurité des projets open source en question

Samsung dépasse les 10 Gb/s avec sa mémoire LPDDR5X

Élections européennes : Meta échoue à modérer des publicités de propagande pro-russe

#LeBrief : fuite chez le Slip Français, YouTube et les antipubs, Firefox 125, délit pour les deepfakes, trou noir « dormant »

VMware by Broadcom : une situation tendue, l’Europe s’en mêle

Comment la désinformation d’extrême-droite sert les intérêts russes en France

Mars Sample : retour pas si sûr…

#LeBrief : « traumatisme » du deepfake pornographique, Tesla licencie, Samsung repasse devant Apple, Musk vs finances X

Aux USA, la surveillance des communications d’étrangers sans mandat (FISA) fait débat

Apple autorise puis supprime un émulateur Game Boy sur iOS

Android 15 bêta : Wallet par défaut, sécurité des réseaux mobiles et Wi-Fi, bugs sur le NFC

Rapidité vs précision : deux experts nous expliquent les enjeux des GPU modernes sur les IA

#LeBrief : Beeper rachetée, Cyber Command USA, incident technique BFMTV, « destin énergétique » de l’Europe

#Flock : de Game of Shithrones au jeu des sept différences

[Édito] Respectez les sciences, bordel !

Une faille critique dans le langage Rust, Windows trinque

La CADA considère que le code source et les algorithmes de MIA devraient être rendus publics

Ubuntu 24.04 LTS se profile comme une version majeure, le tour des nouveautés

Loi SREN adoptée : comment la France va sécuriser et réguler l’espace numérique

« La vidéoprotection augmentée ne sera pas optimum au moment des JO »

#LeBrief : floutage DM Instagram, Apple vs espionnage, musique par IA avec Udio, Joe Biden vs Julian Assange

Commentaires (89)