Internet Archive lance son extension Chrome pour retrouver les pages web introuvables

Internet Archive lance son extension Chrome pour retrouver les pages web introuvables

Y compris en cas de censure légale

Avatar de l'auteur
Sébastien Gavois

Publié dans

Internet

16/01/2017 2 minutes
7

Internet Archive lance son extension Chrome pour retrouver les pages web introuvables

Internet Archive lance son extension Chrome afin de proposer une alternative pour certains liens cassés sur Internet. En cas d'erreur 404 (et bien d'autres codes), elle va chercher une sauvegarde dans la Wayback Machine afin de la proposer à l'internaute.

En août de l'année dernière, Mozilla lançait un nouveau Test Pilot pour Firefox avec No More 404s. Le principe est simple : lorsque vous tombez sur une erreur 404, ce qui signifie que la page demandée n'existe pas ou plus, cet outil va piocher dans la Wayback Machine du site Archive.org afin d'en trouver une version sauvegardée, si elle existe bien évidemment.

Mais Firefox n'est pas le seul et il existe déjà de nombreuses alternatives du genre, que ce soit via la base de données d'Internet Archive ou bien via le cache de Google par exemple. Aujourd'hui, c'est au tour d'Internet Archive de lancer son extension officielle pour Chrome.

Une recherche automatisée dans la Wayback Machine

Elle « détecte les codes d'erreur 404, 408, 410, 451, 500, 502, 503, 504, 509, 520, 521, 523, 524, 525 et 526, et elle vérifie alors si une version archivée de l'URL demandée est disponible dans la machine Wayback » explique Internet Archive. Le cas échéant, l'extension affiche alors un message afin d'informer l'utilisateur, en lui laissant la possibilité de consulter cette copie archivée.

Les codes d'erreur HTTP ciblés sont relativement larges puisque cela va de l'incontournable 404 ou récent 451 pour la censure en ligne, en passant par les 52x qui sont des codes étendus pour Cloudflare. Pour rappel, la liste complète des codes HTTP et de leur signification est disponible par ici.

La question de la confidentialité et de l'historique de navigation 

Sur son blog, Internet Archive indique que « la confidentialité de nos utilisateurs est d'une importance cruciale » et ajoute que « nous essayons de ne pas enregistrer d'adresses IP ». L'organisme à but non lucratif affirme au passage que l'utilisation de cette extension « n'exposera pas votre historique de navigation ». Il travaille également avec Google afin d'ajouter une couche de protection supplémentaire via un serveur proxy.

Actuellement, Internet Archive revendique avoir sauvegardé plus 279 milliards de pages web différentes provenant de plus de 361 millions de sites, ce qui représente plus de 15 Po de stockage. 

Internet Archive extension Chrome

Écrit par Sébastien Gavois

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Une recherche automatisée dans la Wayback Machine

La question de la confidentialité et de l'historique de navigation 

Commentaires (7)


Une extension qui pourrait consommer en ressources en cas de 404 intenpestifs, c’est pratique mais en utilisation nomade ça doit être moyen de charger en ajax + afficher la page la plus récente existante..


L’idée est pas mal, ca a permettre à pa mal de monde d’accéder aux infos censurées.

Les “pirates” vont pouvoir retourner sur zone téléchargement <img data-src=" />


Sur Firefox cela existe depuis longtemps :https://addons.mozilla.org/fr/firefox/addon/get-archive/


Il y a surtout un testpilot spécifique pour les 404, j’pense même qu’il y avait eu une news sur NXi à ce propos.


Oui, elle est même indiquée dans le premier lien du 1er paragraphe de l’actu&nbsp;<img data-src=" />


j’ai lu moins qu’en diagonale <img data-src=" />


Ok, mais perso je préfère l’aspect manuel, “oh tiens, 404, ce n’était pas le cas avant, voyons voir… clic droit -&gt; Get Archive.org”. En plus y’a des 404 rigolotes ou utiles (sans même parler des autres erreurs). Mais bon, pour la fameuse Mme Michu ça peut le faire.