Google n'est pas le seul à numériser les livres. La BnF, la Bibliothèque nationale de France, n'est pas en reste, puisque son programme de numérisation prévoit en 2010 la mise à « disposition du public via sa bibliothèque en ligne (Gallica 2) près de 400 000 documents imprimés, simultanément disponibles en mode image et texte, ce qui représente plus de 45 millions de pages ».
Gallica 2, la bibliothèque numérique de la BnF
Gallica 2, la bibliothèque en ligne de la BnF, a ouvert ses portes en octobre dernier. Successeur logique de Gallica, bibliothèque virtuelle créée en 2000, Gallica 2 est actuellement en version bêta, et propose aux internautes un moteur de recherche évolué, ainsi qu'un espace personnel afin de stocker ses propres documents.
Selon la BnF, Gallica 2 occupera de manière définitive la place de Gallica l'année prochaine, « lorsque toutes les fonctionnalités seront opérationnelles et que l'ensemble des documents de l'ancienne version auront été versés dans la nouvelle » précise la Bibliothèque française.
Pour la Bibliothèque nationale, la numérisation n'a rien d'une nouveauté. Dès le début des années 90, l'établissement public a commencé à faire ses gammes en numérisant une partie de ses livres. Mais technologie oblige, ce n'est que récemment que la plus grande bibliothèque de France a passé la vitesse supérieure, comme elle l'a expliqué récemment : « Les rapides évolutions technologiques et la baisse des coûts permettent aujourd’hui un changement d’échelle dans le traitement des collections. Dès 2006, la BnF s’est lancée dans une numérisation de masse de ses fonds patrimoniaux. »
10 milliards de documents archivés
En sus de ces millions de pages numérisées, la BnF archive depuis 2004 le contenu du Web, de 1996 à nos jours. Forte de ces trois années de collectes intensives, la BnF cumule à ce jour 110 Téraoctets de données, soit près de 10 milliards de documents.
Tout ce travail de numérisation et d'archivage est d'une importance capitale aux yeux de la BnF, notamment pour les patrimoines français et européen. À l'heure où Google numérise lui aussi massivement les livres du monde entier, et en premier lieu ceux des universités américaines, la BnF souhaite être présente dans le paysage de la toile.
« La révolution numérique crée de nouveaux outils qui renouvellent les enjeux de la collecte et de la conservation du patrimoine. Collecter les nouvelles données numériques, numériser les supports traditionnels, conserver et organiser l'ensemble de ces collections sont autant d'étapes qui concourent à la mission fondamentale de la BnF, la transmission du patrimoine au public. »
100 000 documents par an, contre 5000 auparavant
300 000 documents supplémentaires seront donc disponibles dans les trois prochaines années, à un rythme annuel de 100 000 documents. Un rythme rapide, comparé aux 5 à 6000 documents numérisés chaque année jusqu'en 2005.
La BnF note que les premiers résultats seront visibles dès mars 2008, sachant que 8000 documents seront ensuite rajoutés chaque mois à la base de données. Auparavant, dès janvier 2008, Gallica 2 aura quasi intégralement transféré les documents de Gallica. Mais il faudra attendre fin 2008 pour que cette dernière disparaisse totalement, au profit de Gallica 2.
Gallica 2, la bibliothèque numérique de la BnF

Selon la BnF, Gallica 2 occupera de manière définitive la place de Gallica l'année prochaine, « lorsque toutes les fonctionnalités seront opérationnelles et que l'ensemble des documents de l'ancienne version auront été versés dans la nouvelle » précise la Bibliothèque française.
Pour la Bibliothèque nationale, la numérisation n'a rien d'une nouveauté. Dès le début des années 90, l'établissement public a commencé à faire ses gammes en numérisant une partie de ses livres. Mais technologie oblige, ce n'est que récemment que la plus grande bibliothèque de France a passé la vitesse supérieure, comme elle l'a expliqué récemment : « Les rapides évolutions technologiques et la baisse des coûts permettent aujourd’hui un changement d’échelle dans le traitement des collections. Dès 2006, la BnF s’est lancée dans une numérisation de masse de ses fonds patrimoniaux. »
10 milliards de documents archivés
En sus de ces millions de pages numérisées, la BnF archive depuis 2004 le contenu du Web, de 1996 à nos jours. Forte de ces trois années de collectes intensives, la BnF cumule à ce jour 110 Téraoctets de données, soit près de 10 milliards de documents.

« La révolution numérique crée de nouveaux outils qui renouvellent les enjeux de la collecte et de la conservation du patrimoine. Collecter les nouvelles données numériques, numériser les supports traditionnels, conserver et organiser l'ensemble de ces collections sont autant d'étapes qui concourent à la mission fondamentale de la BnF, la transmission du patrimoine au public. »
100 000 documents par an, contre 5000 auparavant
300 000 documents supplémentaires seront donc disponibles dans les trois prochaines années, à un rythme annuel de 100 000 documents. Un rythme rapide, comparé aux 5 à 6000 documents numérisés chaque année jusqu'en 2005.
La BnF note que les premiers résultats seront visibles dès mars 2008, sachant que 8000 documents seront ensuite rajoutés chaque mois à la base de données. Auparavant, dès janvier 2008, Gallica 2 aura quasi intégralement transféré les documents de Gallica. Mais il faudra attendre fin 2008 pour que cette dernière disparaisse totalement, au profit de Gallica 2.