Panne de Qwant : Éric Léandri nous explique les causes et les changements à venir

Qui avait mis l’interrupteur sur off ? 62
Accès libre
image dediée
Web
Sébastien Gavois

Éric Léandri, PDG et cofondateur de Qwant, revient avec nous sur la panne d'hier de son moteur de recherche. C'est un incident électrique qui a entrainé une mise en sécurité des baies... qui ont mis plusieurs heures à redémarrer. Il nous détaille également les pistes de réflexion pour éviter que cela ne se reproduise. 

Pour la deuxième fois en l'espace d'un mois, Qwant a été victime d'une indisponibilité de plusieurs heures. Le moteur de recherche dispose pour rappel de sa propre infrastructure, une condition indispensable selon son PDG et cofondateur, Éric Léandri, pour respecter la vie privée de ses utilisateurs.

L'occasion d'évoquer avec lui les solutions qui devraient être mises en place à l'avenir, mais aussi la communication de la société dans de pareils cas. Il nous confirme ainsi l'ouverture d'un blog où ces sujets seront évoqués, ainsi que les choix techniques effectués afin de garantir le respect de la vie privée. 

Qwant ne gère pas en direct le redémarrage de ses baies

« On a deux baies redondantes [...] elles sont vraiment extraordinaires quand elles marchent bien. Ce sont des baies Kaminario » nous détaille Éric Léandri. Elles sont « full flash », totalement chiffrées et compressées : « il y a deux ans c'était ce qu'il y avait de mieux au monde » affirme le dirigeant en guise de justification. 

Problème, Qwant n'a pas la main sur la remise en route de ses baies : « Quand il y a un plantage, c'est le fabricant (en Israël) qui gère le redémarrage des baies. Normalement ça prend dix à vingt minutes. Là on eu droit à sept heures après avoir mis à jour les deux baies ». Pourtant, Qwant nous affirme avoir « donné la main, très très (très) tôt dans la matinée » à Kaminario, mais ne l'avoir récupéré qu'à 14h45. 

Cela ne signifie pour autant pas que Kaminario peut faire ce qu'il veut sur les serveurs de Qwant : le fabricant peut voir quand il y a un impact sur ses baies, « mais sans nous il ne peut pas rentrer dans notre infrastructure » ajoute rapidement Éric Léandri. De plus, tout est monitoré et « rien ne peut sortir, aussi bien des vidéos que des données de crawl et d'index ».

Quand un incident électrique fait boule de neige

Quoi qu'il en soit, ce dimanche un incident électrique de « quelques secondes » est venu perturber la mécanique bien huilée : « Le premier souci était électrique sur l'une des deux baies. Problème, même si elles sont redondantes, c'est une grille. Tout ce qui se passe sur la première est copié sur la deuxième. Si la première se met en sécurité, la deuxième aussi ».

Or, les baies se mettent justement en sécurité quand il y a un problème électrique, notamment pour éviter des corruptions ou pertes de données. Quand les deux sont en sécurité, il faut les redémarrer nous détaille le dirigeant... et c'est justement « à ce moment-là que le problème est intervenu ».

Une panne différente de celle du mois dernier

Selon Qwant, une mise à jour de Kaminario s'est mal déroulée : « D'ailleurs, d'après nos logs, à 14h25 ils ont remis à jour leur software. Après cette mise à jour, tout a redémarré », mais l'opération a duré. « Pendant quatre heures [Kaminario] cherchait la panne, il pensait que c'était physique, sauf que ce n'était pas le cas, il n'y avait strictement rien sur aucune des baies ».

La situation est différente de celle du mois dernier où il avait fallu des heures simplement pour réussir à afficher que Qwant était en maintenance, selon Éric Léandri. Hier, « le message est arrivé parce que tout fonctionnait. Le site marchait. On aurait pu faire une version dégradée et la mettre en ligne si on avait voulu ».

Interrogé sur une éventuelle perte d'utilisateurs, ces derniers devant se retourner vers DuckDuckGo ou des acteurs tels que Bing/Google pendant la panne, le PDG nous rétorque qu'il n'en sait absolument rien pour le moment : « je le saurais ce soir ou demain » nous a-t-il simplement répondu.

À la recherche d'une autre solution technique

Dans tous les cas, « on ne va pas rester comme ça, ce n'est pas possible » ajoute le dirigeant. Des alternatives à Kaminario sont donc en train d'être examinées depuis hier : « on va mettre en œuvre d'autres technologies de flash qui ont l'avantage d'être complètement gérables par nos équipes ».

Cette panne aurait relancé au passage un vaste sujet en interne : open source ou propriétaire ? Le choix n'est pas encore arrêté : « soit de l'open source [...] soit quelque chose dans lequel on a la main dans l'ensemble de la technologie » explique Éric Léandri.

Vers une communication améliorée en cas de panne...

Nous avons ensuite questionné le PDG sur le peu de communication de Qwant face aux deux derniers incidents, surtout comparé à une société comme OVH multipliant les billets et les tweets, avec un « post mortem » détaillé une fois l'incident clôt (lire notre analyse). « J'achète et on va le mettre en place » lâche le cofondateur.

Lors de la précédente panne, un billet de blog avait été mis en ligne, mais il tenait plus d'un communiqué de presse qui avait été déjà largement diffusé dans les médias que d'une analyse technique concrète.

Concernant la panne d'hier, Kaminario promettait visiblement à Qwant un rétablissement sous quelques minutes, selon Éric Léandri : « on a passé des heures à les regarder les minutes » se justifie le dirigeant pour expliquer le peu d'information durant la journée d'hier.

De plus, le moteur de recherche était entièrement dépendant de son fournisseur de baies : « de notre côté tout marchait, sauf deux produits à l'intérieur de notre infrastructure ; ce n'est pas des choses faciles à expliquer ». Pourtant, cela ne semble pas non plus très compliqué de l'expliquer ainsi, quitte à revenir plus en détail sur la panne dans un second temps. 

Dans tous les cas, il n'y a eu que quatre tweets dans la journée d'hier pour une panne de plusieurs heures, ce qui est vraiment peu (un seul au moment de la panne à 9h28, deux après 14h et un dernier à 17h47) :

Twitter Qwant

... mais aussi des explications sur les choix techniques de Qwant

Qwant en profitera aussi pour donner des explications sur les raisons de certains choix techniques : « si aujourd'hui on peut garantir la sécurisation des données, garantir de ne pas être sous Freedom et Patriot Act, c'est parce qu'on fait notre infrastructure » affirme le PDG.

La société veut également détailler pourquoi elle ne se repose pas sur des solutions d'Amazon ou de Google, et pourquoi « elle ne le fera jamais ». Elle précisera aussi pourquoi, selon elle, ceux ne disposant pas de leur propre infrastructure ne peuvent pas garantir votre vie privée. La mise en ligne devrait être faite demain.

Parfois, « j'ai l'impression d'être le plus grand crétin du monde qui essaye de faire son infrastructure en même temps que son moteur de recherche » lâche le dirigeant. Il ajoute ensuite : « On ne peut pas faire de moteur de recherche dans le cloud d'un autre, on le sait on a essayé avec OVH. C'est très compliqué ».

Bref, selon Éric Léandri pour sortir du Freedom Act et « être tranquille », il n'y a pas le choix. Nous aurons évidemment l'occasion de revenir en détail sur les choix techniques de Qwant lorsque les explications seront mises en ligne.


chargement
Chargement des commentaires...