Vous n'avez pas encore de notification

Page d'accueil

Options d'affichage

Abonné

Actualités

Abonné

Des thèmes sont disponibles :

Thème de baseThème de baseThème sombreThème sombreThème yinyang clairThème yinyang clairThème yinyang sombreThème yinyang sombreThème orange mécanique clairThème orange mécanique clairThème orange mécanique sombreThème orange mécanique sombreThème rose clairThème rose clairThème rose sombreThème rose sombre

Vous n'êtes pas encore INpactien ?

Inscrivez-vous !

Les archives françaises du Web s’ouvrent aux bibliothèques de province

Et même de l'outre-mer
Internet 3 min
Les archives françaises du Web s’ouvrent aux bibliothèques de province
Crédits : Xavier Berne

Le ministère de la Culture a publié ce matin un arrêté qui va faciliter l’accès aux archives françaises du Web. Alors qu’il était jusqu’ici obligatoire de se rendre à Paris, une vingtaine de bibliothèques de province et même de l’outre-mer pourront dorénavant proposer une consultation de ces précieuses sauvegardes à leurs utilisateurs – sous certaines conditions toutefois.

Depuis 2002, la Bibliothèque nationale de France (BNF) procède à des opérations d’archivage du Web, et ce au titre du « dépôt légal de l’internet ». L’institution dispose ainsi de robots qui parcourent et copient de manière automatisée des milliers de sites considérés comme français (c’est-à-dire en « .fr », ou bien dès lors que le nom de domaine a été réservé par une personne hébergée en France, à l’image de « nextinpact.com »). L’objectif ? Conserver un échantillon du Web, afin de permettre aux générations futures de savoir à quoi ressemblait l’internet français à une date précise.

 

En juin 2012, nous avions d’ailleurs eu l’occasion de visiter ce dépôt légal de l’internet à la BNF (voir notre reportage). À l’époque, l’institution affirmait avoir collecté pas moins de 16,5 milliards de fichiers, pour plus de 250 Téraoctets de données (soit 250 000 Gigas). Avec un accroissement annuel d’environ 60 à 80 Téras, la somme des pages archivées doit aujourd’hui avoisiner les 400 Téraoctets.

Une consultation des archives du Web qui n'était jusqu’ici possible qu'à Paris

Problème : la consultation de ces archives s’avère relativement complexe... D’une part parce que l’accès au dépôt légal de l’internet est limité aux chercheurs accrédités, c’est-à-dire aux seules personnes pouvant « justifier d'une recherche d'ordre universitaire, professionnel ou personnel, nécessitant le recours aux collections de la Bibliothèque de recherche ». D’autre part, il fallait jusqu’ici se rendre obligatoirement à la BNF, à Paris, pour pouvoir accéder à la salle informatique raccordée à la précieuse base de données de l’institution.

Crédits : BNF

Mais un arrêté publié ce matin au Journal Officiel va grandement faciliter l’accès au dépôt légal du Web, puisque de nombreux établissements de province (et même au-delà) sont désormais habilités à proposer eux aussi ce service.

 

Les bibliothèques municipales suivantes devraient ainsi permettre prochainement à leurs utilisateurs de consulter la base de la BNF, vraisemblablement toujours à la condition d’être accrédités :

  • Ajaccio
  • Amiens
  • Angers
  • Besançon
  • Bordeaux
  • Caen
  • Châlons-en-Champagne
  • Clermont-Ferrand
  • Dijon
  • Lille
  • Limoges
  • Lyon
  • Marseille
  • Montpellier
  • Nancy
  • Orléans
  • Poitiers
  • Rennes
  • Rouen
  • Toulouse
  • Strasbourg (bibliothèque nationale et universitaire)

Les départements et collectivités d’outre-mer sont également concernés par cet arrêté, puisque des habilitations ont été accordées à :

  • La Réunion (bibliothèque départementale)
  • La Guadeloupe (bibliothèque des services d'archives départementales)
  • La Guyane (ibliothèque des services d'archives départementales)
  • La Martinique (bibliothèque des services d'archives départementales)
  • Nouméa (bibliothèque territoriale de Bernheim)

Un accès en province pour les sites collectés par la BNF et l'INA 

La BNF n’est pas la seule institution à s’occuper en France du dépôt légal du Web. L’institut national de l’audiovisuel (INA) est en effet en charge de procéder à des collectes ciblées, cette fois sur les sites consacrés aux programmes TV et radio, aux Web TV, etc. L’arrêté publié ce matin prévoit donc que certaines bibliothèques municipales soient dorénavant autorisées à proposer l’accès à cette base :

  • Bordeaux
  • Clermont-Ferrand
  • Dijon
  • Grenoble (+ cinématèque)
  • Metz
  • Montpellier
  • Nancy
  • Nantes
  • Nice
  • Pessac
  • Poitiers
  • Rouen

Nous devrions revenir plus en détail sur cette évolution importante – notamment s’agissant de ses aspects techniques – dans le cadre d’un prochain article. En attendant, rappelons qu’il est possible de consulter librement et gratuitement des archives du Web grâce à la « WayBack Machine » d’Internet Archive (accessible à cette adresse). Vous pourrez ainsi remonter dans le temps et avoir accès à d’anciennes versions de Google, du site Internet de la présidence de la République, de PC INpact, etc.

 

 

archive elysee.fr

Le site Internet de la présidence de la République, tel qu'on pouvait le consulter le 2 février 2001.

10 commentaires
Avatar de caesar INpactien
Avatar de caesarcaesar- 07/10/14 à 13:51:05

Les bibliothèques municipales suivantes devraient ainsi permettre
prochainement à leurs utilisateurs de consulter la base de la BNF,
vraisemblablement toujours à la condition d’être accrédités :

Pourquoi juste celles-ci ?
Il y a des bibliothèques municipales qui valent plus/mieux que d'autre ?
C'est décidé au pifomètre ?

Avatar de momal INpactien
Avatar de momalmomal- 07/10/14 à 13:58:36

oui surtout que c'est de la connexion a distance, du coup on n'a pas d'investissement a faire...

Avatar de momal INpactien
Avatar de momalmomal- 07/10/14 à 13:59:16

bon j'arrive ni a citer, ni a modifier.. faut une config speciale ?

Avatar de Jean_Peuplus INpactien
Avatar de Jean_PeuplusJean_Peuplus- 07/10/14 à 14:01:15

momal a écrit :

bon j'arrive ni a citer, ni a modifier.. faut une config speciale ?

config minimale : GTX Titan pour gérer le guillemet flottant qui permet de citer. :transpi:

Avatar de momal INpactien
Avatar de momalmomal- 07/10/14 à 14:44:14

Jean_Peuplus a écrit :

config minimale : GTX Titan pour gérer le guillemet flottant qui permet de citer. :transpi:

nia nia nia j'ai fini par trouver... mais avant de recharger et de voir le guillemet, j'avais un autre systeme qui s'affichait, un bouton "Citer" qui ne faisait rien du tout.

Edith : Eh, ca va pas vos page 404 ??? une lettre Hadopi, vous etes dingues de me faire ca au taf, m'enfin...

Édité par momal le 07/10/2014 à 14:45
Avatar de caesar INpactien
Avatar de caesarcaesar- 07/10/14 à 15:01:01

momal a écrit :

nia nia nia j'ai fini par trouver... mais avant de recharger et de voir le guillemet, j'avais un autre systeme qui s'affichait, un bouton "Citer" qui ne faisait rien du tout.

Edith : Eh, ca va pas vos page 404 ??? une lettre Hadopi, vous etes dingues de me faire ca au taf, m'enfin...

Enooorme cette page 404 :love:
:incline:

Avatar de Guyom_P INpactien
Avatar de Guyom_PGuyom_P- 08/10/14 à 08:29:50

caesar a écrit :

Enooorme cette page 404 :love:
:incline:

Moi je veux un cours de smiley avec Titia. Je vais continuer à me faire flasher par la hadopi des pages 404 de NXi alors. :-)

Avatar de yvan Abonné
Avatar de yvanyvan- 08/10/14 à 13:31:20

Vous faites bien d'en parler, c'est quoi l'intérêt par rapport à internet archive, qui archive aussi les sites francophones ?

Avatar de SunneX INpactien
Avatar de SunneXSunneX- 08/10/14 à 13:32:28

C'est quand même le comble les archives internet non consultables par internet

Avatar de Seb_Corgan INpactien
Avatar de Seb_CorganSeb_Corgan- 13/10/14 à 15:17:57

:D

caesar a écrit :

Pourquoi juste celles-ci ?
Il y a des bibliothèques municipales qui valent plus/mieux que d'autre ?
C'est décidé au pifomètre ?

Bonjour,
Ce n'est pas décidé au pifomètre. Comme évoqué dans l'article l'archivage du web fait par la BnF s'effectue au titre du dépôt légal (avec un mode de collecte différent par rapport aux imprimés) . Or certaines bibliothèques en province ont également cette mission de dépôt légal (auprès des imprimeurs) et depuis quelques années participent au dépôt légal du web en faisant de la sélection de sites à archiver.
Ce sont ces bibliothèques qui sont concernées par cet accès aux archives de l'internet de la BnF, au titre du dépôt légal :chinois:
Pour l'INA le fait qu'il y ait moins de bibliothèque s'explique par le fait que l'INA dispose déjà de pas mal d'antennes en province.

momal a écrit :

oui surtout que c'est de la connexion a distance, du coup on n'a pas d'investissement a faire...

Si quand même un peu car juridiquement c'est un peu pète couille, l'accès aux archives de l'internet est très encadré et c'est assez strict. Donc pour que les règles soient respectées il faut tout de même mettre en place quelques briques techniques, c'est pas aussi simple que ça en a l'air.:D

 

yvan a écrit :

Vous faites bien d'en parler, c'est quoi l'intérêt par rapport à internet archive, qui archive aussi les sites francophones ?

Les techniques de collecte sont plus ou moins similaires mais les critères de collecte sont différents. Déjà car Internet Archive fait essentiellement de la collecte large et que la BnF fait de la collecte large mais aussi ciblée (thématique avec des sites sélectionnés par des bibliothécaires et des critères de collecte bien défini selon le thème) et les archives de la BnF ont un spectre plus "spécialisé" : l'internet francais et donc les archives de la BnF ont tendance à être plus complètes (à partir d'une certaine période du moins), les archives d'IA auront moins tendance à collecter en profondeur en général sur les sites francophones :chinois:

Il n'est plus possible de commenter cette actualité.