Comment les archives françaises du Web vont se déployer dans les bibliothèques

Comment les archives françaises du Web vont se déployer dans les bibliothèques

Choco BNF

Avatar de l'auteur
Xavier Berne

Publié dans

Internet

13/10/2014 6 minutes
5

Comment les archives françaises du Web vont se déployer dans les bibliothèques

La semaine dernière, le ministère de la Culture a publié un arrêté autorisant une vingtaine de bibliothèques de province et d’outre-mer à proposer un accès aux « archives françaises du Web », alors que ceci n’était jusqu’ici possible qu’à Paris, dans les locaux de la BNF. Next INpact a pu s’entretenir avec Clément Oury, le chef du dépôt légal de l’internet, qui nous a donné davantage d’explications sur ce déploiement qui devrait s'étaler jusqu'en 2016.

24 heures sur 24, 7 jours sur 7, les robots de la Bibliothèque nationale de France (BNF) moissonnent la Toile afin d’archiver le « Web français ». Plus concrètement, ils copient régulièrement et de manière automatisée des milliers de sites considérés comme français (c’est-à-dire tous ceux en « .fr », ou dont le nom de domaine a été réservé par une personne hébergée en France, à l’image de « nextinpact.com »). Ce dispositif est tout à fait légal, puisque ces opérations rentrent dans le cadre du « dépôt légal de l’internet ». À l’image du dépôt légal traditionnel, qui s’applique notamment aux livres, le principe est de conserver un exemplaire, une trace du Web, afin de permettre aux générations futures de savoir à quoi ressemblait l’internet français à un moment T.

Un déploiement progressif en province et en outre-mer d'ici 2016

Mardi 7 octobre, le ministère de la Culture a publié un arrêté visant à faciliter grandement la consultation de ces archives. Pour y accéder, il n’y a aujourd’hui qu’une seule solution : se rendre à la BNF - donc à Paris - et « justifier d'une recherche d'ordre universitaire, professionnel ou personnel, nécessitant le recours aux collections de la Bibliothèque de recherche ». Mais dorénavant, avec cet arrêté, ce sont 21 bibliothèques de province qui sont habilitées à proposer elles aussi un accès à ce fonds réunissant plus de 460 Téraoctets de données (soit l’équivalent de 460 000 Go), ainsi que 5 établissements situés en outre-mer. Nous avions détaillé la liste complète des établissements concernés dans un précédent article.

bnf
Crédits : Xavier Berne (licence: CC by SA 3.0)

Cependant, tout ne sera pas effectif dans l’immédiat. Loin de là même. « Le déploiement des accès distants aux archives du web sera progressif » nous a ainsi expliqué Clément Oury, le chef du service du dépôt légal de l’internet. Un contrat de performance signé entre la BNF et le ministère de la Culture fixe comme objectif trois établissements raccordés d’ici la fin de l’année, huit en 2015 et quinze en 2016. L’institution a en fait besoin d’un peu de temps pour accompagner les bibliothèques dans cette transition, et surtout aider à la formation du personnel.

 

La médiathèque Émile Zola de Montpellier est la première à pouvoir profiter du dispositif. Et pour la suite ? « L’ordre de déploiement sera déterminé afin de desservir en premier les établissements s’étant impliqués de longue date dans la coopération avec la BNF autour de l’archivage du Web, tout en assurant une diversité territoriale » affirme Clément Oury. Pour autant, il ne s’agit que d’objectifs, et il n’y a rien d’obligatoire pour les bibliothèques concernées. « La BNF a vocation à offrir l’accès à tous les établissements listés. Cependant, si certains d’entre eux ne souhaitent pas bénéficier de ce service, ils ne seront pas contraints de mettre en place l’accès distant. »

Les ordinateurs des bibliothèques se connecteront au réseau de la BNF

D’un point de vue technique, l’accès sera donné « depuis un ou plusieurs postes de l’établissement concerné : ce ne sont pas des postes fournis ou appartenant à la BNF. En revanche, ces postes doivent auparavant avoir été authentifiés. Un nombre limité de postes aura droit à donner accès aux archives du Web » explique le numéro un du dépôt légal de l’internet.

 

Grâce à Internet, les postes authentifiés pourront ensuite se connecter au réseau de la BNF. « La connexion aux services de la BNF lancera un navigateur virtuel, sur une session hébergée à la BNF » poursuit Clément Oury, pour qui cette solution présente différents avantages :

  • « Elle réduit la charge technique pesant sur les bibliothèques : elles doivent simplement disposer d’un navigateur récent ;
  • comme la session est exécutée sur un serveur BNF, la BNF est en mesure de fournir toutes les applications et plug-ins nécessaires à la consultation des archives ;
  • ce système interdit tout téléchargement de données, dans le respect du Code de la propriété intellectuelle. »

Niveau coûts, l’institution reste discrète. Clément Oury indique simplement que les établissements en région doivent fournir le ou les ordinateurs permettant d’accéder aux archives du Web, tandis que « les développements informatiques pour mettre en place l’accès distant ainsi que les licences pour les systèmes de virtualisation » sont pris en charge par la BNF.

archives dépôt légal bnf
Crédits : BNF

Malgré un effort d'ouverture au public, l'accès aux archives demeure très restreint

Derrière ce déploiement, se cache « avant tout un enjeu de décentralisation » selon Clément Oury : il s’agit en effet de « permettre de donner un accès distant aux collections depuis l’ensemble du territoire métropolitain et d’outre-mer ». Mais « c’est aussi un engagement de la BNF vis-à-vis d’établissements qui se sont impliqués de longue date (dès 2004 pour certains) à la sélection de contenus Web pour archivage, notamment à l’occasion des scrutins électoraux ». Les bibliothèques participent en effet au processus de sélection des sites méritant davantage d’être archivés (s’agissant de comptes Facebook ou Twitter par exemple).

 

L’institution songe également à doper la fréquentation de ses collections, même si elle dit n’avoir aucun objectif chiffré à ce jour. À titre d’illustration, la BNF indiquait en 2012 qu’il y avait environ 50 consultations publiques par mois, dont la plupart duraient une heure ou plus (voir à cet égard notre dossier : Dans les coulisses du dépôt légal de l'internet).

 

Ce chiffre relativement faible s’explique par le fait que l’accès aux archives du Web est limité aux « chercheurs dûment accrédités » selon l’article R132-23-2 du Code du patrimoine. Si la BNF a interprété ce texte en réclamant aux visiteurs de justifier « d'une recherche d'ordre universitaire, professionnel ou personnel », il appartiendra dorénavant à chaque bibliothèque de province ou d’outre-mer d’en faire de même. « Ce sera aux établissements en région de définir les conditions d’accréditation des "chercheurs" » confirme ainsi Clément Oury. 

Écrit par Xavier Berne

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Un déploiement progressif en province et en outre-mer d'ici 2016

Les ordinateurs des bibliothèques se connecteront au réseau de la BNF

Malgré un effort d'ouverture au public, l'accès aux archives demeure très restreint

Commentaires (5)


Sinon, il y a archive.org, accessible à tous et bien plus complet :)


On aura le droit à l’oubli dans leurs moteurs de recherche&nbsp;<img data-src=" />&nbsp;?


Rofl je poste un long commentaire et le site plante quand j’envoie.

Bon ben un café et je reposterai après …

&nbsp;




Ce chiffre relativement faible s’explique par le fait que l’accès aux archives du Web est limité aux «&nbsp;chercheurs dûment accrédités&nbsp;» selon l’article R132-23-2&nbsp;du Code du patrimoine.





On a une idée du pourquoi de cette volonté de bloquer l’accès à la culture ?

(outre un protectionnisme partisan et corporatiste dont je n’oserais taxer notre législateur, cela va sans dire)


OMG, toutes les vieilles conversation Caramail vont pouvoir être consulté. Le Gorafi l’avait prédit ! <img data-src=" />