Un service d'archives du web chez Google ?

Problème : qui va archiver les sites d'archives ? 22
Le moteur Google s’orienterait il vers la constitution d’une mémoire du web ? Tout le laisse à penser si l’on en croit les dernières adresses web enregistrées par Google, avec variantes en .com et .net, collectées par Garett Rogersblog sur un blog de Zdnet.com :
archivesearchgoogle.com/net
archivesssearchgoogle.com/net
google-archive-search.com/net
google-archive.com/net
google-archives-search.com/net
google-archives.com/net
google-archivesearch.com/net
google-archivessearch.com/net
Ces adresses ne mènent à aucun site à ce jour, mais plusieurs hypothèses sont d’ores et déjà émises. Ou bien le moteur tient à enregistrer ces adresses pour éviter tout risque de parasitisme ou typosquatting web (voir quelques exemples paranoïaques). Ou bien, Google décidément inspiré par le monde des bibliothèques, veut lancer un service dédié aux documents anciens. À moins que ce ne soit une sorte d’archives du web, thèse la plus probable. À ce titre, Google stocke déjà la plupart des pages web référencées dans son cache, offrant une copie de secours bien pratique lorsqu’une page est perdue ou modifiée. Le moteur compterait-il exploiter cette base ?

inpact hardware

Face au caractère éphémère du web, plusieurs autres sites se sont spécialisés dans la constitution d’archives du web, dont l’incontournable Archive.org. Sa Wayback Machine, véritable mémoire du web, permet de remonter aux différentes étapes des sites depuis 1996. Elle sauvegarde tant bien que mal les textes et parfois les images de tous les sites du web (voilà qui ne nous rajeunit pas, pour l’ancêtre de Pcinpact.com, flashé un 4 septembre 2001).