Les archives françaises du Web s’ouvrent aux bibliothèques de province

Et même de l'outre-mer 10
En bref
image dediée
Crédits : Xavier Berne
Web
Xavier Berne

Le ministère de la Culture a publié ce matin un arrêté qui va faciliter l’accès aux archives françaises du Web. Alors qu’il était jusqu’ici obligatoire de se rendre à Paris, une vingtaine de bibliothèques de province et même de l’outre-mer pourront dorénavant proposer une consultation de ces précieuses sauvegardes à leurs utilisateurs – sous certaines conditions toutefois.

Depuis 2002, la Bibliothèque nationale de France (BNF) procède à des opérations d’archivage du Web, et ce au titre du « dépôt légal de l’internet ». L’institution dispose ainsi de robots qui parcourent et copient de manière automatisée des milliers de sites considérés comme français (c’est-à-dire en « .fr », ou bien dès lors que le nom de domaine a été réservé par une personne hébergée en France, à l’image de « nextinpact.com »). L’objectif ? Conserver un échantillon du Web, afin de permettre aux générations futures de savoir à quoi ressemblait l’internet français à une date précise.

En juin 2012, nous avions d’ailleurs eu l’occasion de visiter ce dépôt légal de l’internet à la BNF (voir notre reportage). À l’époque, l’institution affirmait avoir collecté pas moins de 16,5 milliards de fichiers, pour plus de 250 Téraoctets de données (soit 250 000 Gigas). Avec un accroissement annuel d’environ 60 à 80 Téras, la somme des pages archivées doit aujourd’hui avoisiner les 400 Téraoctets.

Une consultation des archives du Web qui n'était jusqu’ici possible qu'à Paris

Problème : la consultation de ces archives s’avère relativement complexe... D’une part parce que l’accès au dépôt légal de l’internet est limité aux chercheurs accrédités, c’est-à-dire aux seules personnes pouvant « justifier d'une recherche d'ordre universitaire, professionnel ou personnel, nécessitant le recours aux collections de la Bibliothèque de recherche ». D’autre part, il fallait jusqu’ici se rendre obligatoirement à la BNF, à Paris, pour pouvoir accéder à la salle informatique raccordée à la précieuse base de données de l’institution.

Crédits : BNF

Mais un arrêté publié ce matin au Journal Officiel va grandement faciliter l’accès au dépôt légal du Web, puisque de nombreux établissements de province (et même au-delà) sont désormais habilités à proposer eux aussi ce service.

Les bibliothèques municipales suivantes devraient ainsi permettre prochainement à leurs utilisateurs de consulter la base de la BNF, vraisemblablement toujours à la condition d’être accrédités :

  • Ajaccio
  • Amiens
  • Angers
  • Besançon
  • Bordeaux
  • Caen
  • Châlons-en-Champagne
  • Clermont-Ferrand
  • Dijon
  • Lille
  • Limoges
  • Lyon
  • Marseille
  • Montpellier
  • Nancy
  • Orléans
  • Poitiers
  • Rennes
  • Rouen
  • Toulouse
  • Strasbourg (bibliothèque nationale et universitaire)

Les départements et collectivités d’outre-mer sont également concernés par cet arrêté, puisque des habilitations ont été accordées à :

  • La Réunion (bibliothèque départementale)
  • La Guadeloupe (bibliothèque des services d'archives départementales)
  • La Guyane (ibliothèque des services d'archives départementales)
  • La Martinique (bibliothèque des services d'archives départementales)
  • Nouméa (bibliothèque territoriale de Bernheim)

Un accès en province pour les sites collectés par la BNF et l'INA 

La BNF n’est pas la seule institution à s’occuper en France du dépôt légal du Web. L’institut national de l’audiovisuel (INA) est en effet en charge de procéder à des collectes ciblées, cette fois sur les sites consacrés aux programmes TV et radio, aux Web TV, etc. L’arrêté publié ce matin prévoit donc que certaines bibliothèques municipales soient dorénavant autorisées à proposer l’accès à cette base :

  • Bordeaux
  • Clermont-Ferrand
  • Dijon
  • Grenoble (+ cinématèque)
  • Metz
  • Montpellier
  • Nancy
  • Nantes
  • Nice
  • Pessac
  • Poitiers
  • Rouen

Nous devrions revenir plus en détail sur cette évolution importante – notamment s’agissant de ses aspects techniques – dans le cadre d’un prochain article. En attendant, rappelons qu’il est possible de consulter librement et gratuitement des archives du Web grâce à la « WayBack Machine » d’Internet Archive (accessible à cette adresse). Vous pourrez ainsi remonter dans le temps et avoir accès à d’anciennes versions de Google, du site Internet de la présidence de la République, de PC INpact, etc.

archive elysee.fr

Le site Internet de la présidence de la République, tel qu'on pouvait le consulter le 2 février 2001.


chargement
Chargement des commentaires...