La Bibliothèque nationale de France sauvegarde le web électoral de 2012

Le devoir de mémoire en campagne 18
Comme en 2002 et 2007, la Bibliothèque nationale de France (BNF) effectue cette année une collecte des sites internet impliqués dans les campagnes présidentielles et législatives. Des milliers de pages vont être conservées, ainsi que de nombreux contenus, afin d'entretenir une trace de la vie politique française. Nouveauté de l’année 2012 : les réseaux sociaux feront eux aussi l’objet d’une sauvegarde.

bibliothèque nationale de france bnf 

Sauvegarde du web et des réseaux sociaux

Comme le précise la BNF dans un communiqué, cette collecte vise à archiver « toutes les publications en ligne ayant un rôle à jouer dans la campagne ». Sont ainsi concernés tous les « sites des candidats, des partis et des groupes de soutien, mais aussi [les] sites d’analyse, de presse ou de militants » (PC INpact fait ainsi partie des sites régulièrement capturés par la BNF). En termes de contenus, ce sont tous les documents où « le discours politique et militant se diffuse » qui sont conservés, et plus particulièrement les « blogs, vidéos officielles ou parodiques diffusées sur des plates-formes de partage »... 

Contrairement aux éditions précédentes, les principaux réseaux sociaux font également l’objet d’une sauvegarde. Contactée par PC INpact, la BNF a déclaré que Facebook, Twitter, Google+, Pinterest et Flickr étaient notamment étudiés. Dans le détail, seuls « les comptes des utilisateurs impliqués dans la campagne sont concernés », ce qui restreint le champ de sauvegarde de l’établissement public. Rentrent ainsi dans cette catégorie les « comptes officiels, soutiens importants, médias, militants particulièrement actifs, etc. ». La BNF précise néanmoins que « ces comptes doivent impérativement être publics pour pouvoir être collectés ». 

De 8 000 à 10 000 sites archivés entre janvier et juillet 2012

Pour assurer une telle opération, la BNF utilise depuis plusieurs années des techniques d’archivage à grande échelle. Plus précisément, « une équipe de bibliothécaires de la BNF ainsi que plusieurs bibliothèques partenaires sélectionnent des sites selon une typologie adaptée au projet électoral, dont les collectes couvrent six mois, du 23 janvier au 23 juillet ». Ils sont épaulés par « des robots destinés à la fois à parcourir [des] liens et à collecter les contenus eux-mêmes », qui prennent le relais en effectuant la copie et le stockage des données. Ces robots dépendent du département des services informatiques de la BNF, et sont donc entièrement internalisés.

Cette année, ce sont de « 8 000 à 10 000 sites » qui devraient être collectés. À titre d’illustration, lors de l’opération de 2007, le projet avait conduit à l’archivage de « plus de 5 800 sites ou parties de sites », ce qui représentait alors « un ensemble de 63 millions de fichiers, soit 3,4 téraoctets de données ». Une quarantaine d’agents avaient été mobilisés sur six mois pour mener à bien une telle opération.

Garder une trace de la vie politique française

L’intérêt de cette collecte est de pouvoir conserver telles quelles ces pages de sites impliqués dans les élections présidentielles et législatives, dans la mesure où celles-ci se trouvent souvent modifiées ou supprimées après le scrutin. Étant donné que la BNF « recueille depuis le XIXe siècle les tracts et matériels de promotion électorale sous forme papier », ce dispositif de sauvegarde s'apparente clairement à un prolongement de la mission de l’établissement public.

La BNF conserve ainsi une trace de la « vie politique nationale mais aussi [de] la façon dont les enjeux politiques s’inscrivent dans un territoire ». La collecte locale se révèle toute aussi importante que celle de l'élection présidentielle, puisque « les sites des candidats aux législatives, des sections locales des partis et de la presse régionale sont archivés aux côtés de ceux des organes centraux ».

Après l’opération de sauvegarde, « les sites, pages et documents archivés sont consultables en bibliothèque de recherche », c’est-à-dire à la bibliothèque François Mitterrand, à Paris. Intervenant dans le cadre du dépôt légal de l’internet, la BNF permet d’ores et déjà au public de « se replonger dans l’Internet de 2002, 2007 ou 2010, afin de revoir les sites tels qu’ils apparaissaient à l’époque ».
Par Xavier Berne Publiée le 23/04/2012 à 09:14
Publicité