Les archives françaises du Web s’ouvrent aux bibliothèques de province

Les archives françaises du Web s’ouvrent aux bibliothèques de province

Et même de l'outre-mer

Avatar de l'auteur
Xavier Berne

Publié dans

Internet

07/10/2014 4 minutes
10

Les archives françaises du Web s’ouvrent aux bibliothèques de province

Le ministère de la Culture a publié ce matin un arrêté qui va faciliter l’accès aux archives françaises du Web. Alors qu’il était jusqu’ici obligatoire de se rendre à Paris, une vingtaine de bibliothèques de province et même de l’outre-mer pourront dorénavant proposer une consultation de ces précieuses sauvegardes à leurs utilisateurs – sous certaines conditions toutefois.

Depuis 2002, la Bibliothèque nationale de France (BNF) procède à des opérations d’archivage du Web, et ce au titre du « dépôt légal de l’internet ». L’institution dispose ainsi de robots qui parcourent et copient de manière automatisée des milliers de sites considérés comme français (c’est-à-dire en « .fr », ou bien dès lors que le nom de domaine a été réservé par une personne hébergée en France, à l’image de « nextinpact.com »). L’objectif ? Conserver un échantillon du Web, afin de permettre aux générations futures de savoir à quoi ressemblait l’internet français à une date précise.

 

En juin 2012, nous avions d’ailleurs eu l’occasion de visiter ce dépôt légal de l’internet à la BNF (voir notre reportage). À l’époque, l’institution affirmait avoir collecté pas moins de 16,5 milliards de fichiers, pour plus de 250 Téraoctets de données (soit 250 000 Gigas). Avec un accroissement annuel d’environ 60 à 80 Téras, la somme des pages archivées doit aujourd’hui avoisiner les 400 Téraoctets.

Une consultation des archives du Web qui n'était jusqu’ici possible qu'à Paris

Problème : la consultation de ces archives s’avère relativement complexe... D’une part parce que l’accès au dépôt légal de l’internet est limité aux chercheurs accrédités, c’est-à-dire aux seules personnes pouvant « justifier d'une recherche d'ordre universitaire, professionnel ou personnel, nécessitant le recours aux collections de la Bibliothèque de recherche ». D’autre part, il fallait jusqu’ici se rendre obligatoirement à la BNF, à Paris, pour pouvoir accéder à la salle informatique raccordée à la précieuse base de données de l’institution.

Crédits : BNF

Mais un arrêté publié ce matin au Journal Officiel va grandement faciliter l’accès au dépôt légal du Web, puisque de nombreux établissements de province (et même au-delà) sont désormais habilités à proposer eux aussi ce service.

 

Les bibliothèques municipales suivantes devraient ainsi permettre prochainement à leurs utilisateurs de consulter la base de la BNF, vraisemblablement toujours à la condition d’être accrédités :

  • Ajaccio
  • Amiens
  • Angers
  • Besançon
  • Bordeaux
  • Caen
  • Châlons-en-Champagne
  • Clermont-Ferrand
  • Dijon
  • Lille
  • Limoges
  • Lyon
  • Marseille
  • Montpellier
  • Nancy
  • Orléans
  • Poitiers
  • Rennes
  • Rouen
  • Toulouse
  • Strasbourg (bibliothèque nationale et universitaire)

Les départements et collectivités d’outre-mer sont également concernés par cet arrêté, puisque des habilitations ont été accordées à :

  • La Réunion (bibliothèque départementale)
  • La Guadeloupe (bibliothèque des services d'archives départementales)
  • La Guyane (ibliothèque des services d'archives départementales)
  • La Martinique (bibliothèque des services d'archives départementales)
  • Nouméa (bibliothèque territoriale de Bernheim)

Un accès en province pour les sites collectés par la BNF et l'INA 

La BNF n’est pas la seule institution à s’occuper en France du dépôt légal du Web. L’institut national de l’audiovisuel (INA) est en effet en charge de procéder à des collectes ciblées, cette fois sur les sites consacrés aux programmes TV et radio, aux Web TV, etc. L’arrêté publié ce matin prévoit donc que certaines bibliothèques municipales soient dorénavant autorisées à proposer l’accès à cette base :

  • Bordeaux
  • Clermont-Ferrand
  • Dijon
  • Grenoble (+ cinématèque)
  • Metz
  • Montpellier
  • Nancy
  • Nantes
  • Nice
  • Pessac
  • Poitiers
  • Rouen

Nous devrions revenir plus en détail sur cette évolution importante – notamment s’agissant de ses aspects techniques – dans le cadre d’un prochain article. En attendant, rappelons qu’il est possible de consulter librement et gratuitement des archives du Web grâce à la « WayBack Machine » d’Internet Archive (accessible à cette adresse). Vous pourrez ainsi remonter dans le temps et avoir accès à d’anciennes versions de Google, du site Internet de la présidence de la République, de PC INpact, etc.

 

 

archive elysee.fr

Le site Internet de la présidence de la République, tel qu'on pouvait le consulter le 2 février 2001.

Écrit par Xavier Berne

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Une consultation des archives du Web qui n'était jusqu’ici possible qu'à Paris

Un accès en province pour les sites collectés par la BNF et l'INA 

Fermer

Commentaires (10)




Les bibliothèques municipales suivantes devraient ainsi permettre

prochainement à leurs utilisateurs de consulter la base de la BNF,

vraisemblablement toujours à la condition d’être accrédités :





Pourquoi juste celles-ci ?

Il y a des bibliothèques municipales qui valent plus/mieux que d’autre ?

C’est décidé au pifomètre ?


oui surtout que c’est de la connexion a distance, du coup on n’a pas d’investissement a faire…


bon j’arrive ni a citer, ni a modifier.. faut une config speciale ?








momal a écrit :



bon j’arrive ni a citer, ni a modifier.. faut une config speciale ?





config minimale : GTX Titan pour gérer le guillemet flottant qui permet de citer. <img data-src=" />









Jean_Peuplus a écrit :



config minimale : GTX Titan pour gérer le guillemet flottant qui permet de citer. <img data-src=" />





nia nia nia j’ai fini par trouver… mais avant de recharger et de voir le guillemet, j’avais un autre systeme qui s’affichait, un bouton “Citer” qui ne faisait rien du tout.



Edith : Eh, ca va pas vos page 404 ??? une lettre Hadopi, vous etes dingues de me faire ca au taf, m’enfin…









momal a écrit :



nia nia nia j’ai fini par trouver… mais avant de recharger et de voir le guillemet, j’avais un autre systeme qui s’affichait, un bouton “Citer” qui ne faisait rien du tout.



Edith : Eh, ca va pas vos page 404 ??? une lettre Hadopi, vous etes dingues de me faire ca au taf, m’enfin…





Enooorme cette page 404 <img data-src=" />

<img data-src=" />









caesar a écrit :



Enooorme cette page 404 <img data-src=" />

<img data-src=" />





Moi je veux un cours de smiley avec Titia. Je vais continuer à me faire flasher par la hadopi des pages 404 de NXi alors. :-)



Vous faites bien d’en parler, c’est quoi l’intérêt par rapport à internet archive, qui archive aussi les sites francophones ?


C’est quand même le comble les archives internet non consultables par internet


<img data-src=" />







caesar a écrit :



Pourquoi juste celles-ci ?

Il y a des bibliothèques municipales qui valent plus/mieux que d’autre ?

C’est décidé au pifomètre ?



Bonjour,

Ce n’est pas décidé au pifomètre.&nbsp;Comme évoqué dans l’article l’archivage du web fait par la BnF s’effectue au titre du dépôt légal (avec un mode de collecte différent par rapport aux imprimés) . Or certaines bibliothèques en province ont également cette mission de dépôt légal (auprès des imprimeurs) et depuis quelques années participent au dépôt légal du web en faisant de la sélection de sites à archiver.

Ce sont ces bibliothèques qui sont concernées par cet accès aux archives de l’internet de la BnF, au titre du dépôt légal&nbsp;<img data-src=" />

Pour l’INA le fait qu’il y ait moins de bibliothèque s’explique par le fait que l’INA dispose déjà de pas mal d’antennes en province.





momal a écrit :



oui surtout que c’est de la connexion a distance, du coup on n’a pas d’investissement a faire…





Si quand même un peu car juridiquement c’est un peu pète couille, l’accès aux archives de l’internet est très encadré et c’est assez strict. Donc pour que les règles soient respectées il faut tout de même mettre en place quelques briques techniques, c’est pas aussi simple que ça en a l’air.<img data-src=" />



&nbsp;



yvan a écrit :



Vous faites bien d’en parler, c’est quoi l’intérêt par rapport à internet archive, qui archive aussi les sites francophones ?





Les techniques de collecte sont plus ou moins similaires mais les critères de collecte sont différents. Déjà car Internet Archive fait essentiellement de la collecte large et que la BnF fait de la collecte large mais aussi ciblée (thématique avec des sites sélectionnés par des bibliothécaires et des critères de collecte bien défini selon le thème) et les archives de la BnF ont un spectre plus “spécialisé” : l’internet francais et donc les archives de la BnF ont tendance à être plus complètes (à partir d’une certaine période du moins), les archives d’IA auront moins tendance à collecter en profondeur en général sur les sites francophones&nbsp;<img data-src=" />