Plusieurs éditeurs ont décidé d’attaquer Internet Archive devant la Cour de district de New York. Les membres de l’Association of American Publishers (AAP) accusent le site de piratage. Explications.
« Sans la moindre licence ni paiement des auteurs ou éditeurs, Internet Archive scanne les livres imprimés, les télécharge illégalement sur ses serveurs et en distribue des copies dans leur intégralité via des sites Web accessibles au public. En quelques clics, tout internaute peut alors télécharger ces fichiers protégés par des droits d'auteur ». Hachette Book Group, Harper Collins, John Wiley & Sons, Penguin Random House et Oppenheim + Zebrak passent ainsi à l’attaque.
Dans la plainte disponible sur cette page, accompagnée de nombreuses autres pièces, les requérants déplorent l’ampleur de ces atteintes. Plus de 1,3 million de livres seraient proposés sur l’Open Library (bibliothèque libre ou ouverte). Un service qui, selon eux, n’a rien à voir avec les bibliothèques en ligne, mais au contraire viole la loi sur le droit d'auteur à une échelle industrielle. Des infractions « intentionnelles et systématiques », faites de copies miroir de millions d'œuvres sous copyright, parfois encore commercialisées. La « gratuité est un concurrent insurmontable » assènent-ils.
Internet Archive, Kim Dot Com, même combat ? La procédure intervient alors qu’IA a pris une décision radicale le 24 mars dernier : le déploiement d’une bibliothèque nationale d’urgence pour fournir des livres numérisés aux étudiants et au public. Un espace ouvert jusqu’au 30 juin (ou jusqu’à la fin de l’état d’urgence national décrété aux États-Unis), alors que les bibliothèques physiques et les écoles ont depuis fermé, en sus des mesures de quarantaines.
Une bibliothèque nationale d’urgence qui fait sursauter auteurs et éditeurs
« Cette bibliothèque [en ligne] rassemble tous les livres de la Phillips Academy Andover, du Marygrove College, ainsi qu'une grande partie des collections de l'Université de Trent outre plus d'un million d'autres livres donnés par d'autres bibliothèques à des lecteurs du monde entier », détaille l’initiative dans un communiqué.
Elle serait la réponse faite « aux dizaines de demandes des enseignants (…) pour répondre aux besoins des salles de classe en raison des fermetures ». Toujours d’après le communiqué officiel, des lecteurs et étudiants ont certes accès aux derniers best-sellers et autres titres populaires sur des services payants, mais non « aux livres qui n'existent qu’en version papier, inaccessibles depuis les étagères de leur bibliothèque ». Et Internet Archive d’inciter tous ceux qui le peuvent d’acheter des livres « idéalement en soutenant votre librairie locale ». À défaut, « Amazon ou Better World Books peut avoir des copies en format papier ou numérique ».
Dans la foire aux questions, il est spécifié que les auteurs peuvent exiger la suppression de leur livre. 72 heures plus tard au maximum, leur demande serait traitée.
Une crise mondiale « pour faire avancer une idéologie » ?
« Nous sommes choqués que l'Internet Archive utilise l'épidémie de Covid-19 comme excuse pour dépasser la loi sur le droit d'auteur, et ce faisant, nuire aux auteurs, dont beaucoup sont déjà en difficulté » réagit de son côté la Guilde des Auteurs. « IA utilise une crise mondiale pour faire avancer une idéologie du droit d'auteur qui viole la loi fédérale actuelle et nuit à la plupart des auteurs ». Et celle-ci de dénoncer également la présence de livres très récents dans le catalogue.
L’Association of American Publishers ne dit pas autre chose. « La plainte ne repose pas sur une diffusion occasionnelle d'un titre rare ou en fin de vie dans des circonstances limitées, ni sur quoi que ce soit d’autorisé ou issu du domaine public. Elle cible au contraire le fait qu’IA sollicite et recueille des camions de livres sous copyright afin de les copier et les rendre disponibles sans autorisation, dénigrant volontairement leur valeur commerciale ».
L’AAP, qui représente outre-Atlantique les principaux éditeurs de livres, de revues et d'éducation, considère qu’aucune des exceptions n’est opposable : prêt en bibliothèque, éducation, « fair use », règle de l’épuisement des droits, rien dans le Digital Millennium Copyright Act qui puisse justifier ce « vol ».
« IA s'est autoproclamé comme bibliothèque, alors qu’en réalité ce n’est rien d'autre qu'un opérateur de site Web qui envoie des millions de livres en Chine pour numérisation illégale, puis prête ces ouvrages sous forme d'ebooks à quiconque visite leur site - le tout en violation flagrante du droit d'auteur » embraye la Guilde, constatant qu’Internet Archive a supprimé le système de liste d’attente qui limitait la diffusion des œuvres auprès des utilisateurs, afin d’ouvrir les vannes.
Avis beaucoup plus pondéré de John Bergmayer, de l’organisation Public Knowledge. Il juge « décevant de voir des maisons d'édition adopter une telle approche ». Pour le directeur juridique, « ce prêt numérique contrôlé est clairement une utilisation équitable en vertu du droit d'auteur ».
Et celui-ci de considérer cette bibliothèque parfaitement légitime, dans les circonstances de la pandémie. « À une époque où tant de personnes dépendent d'Internet et des ressources électroniques pour le travail, l'éducation et la recherche, une approche plus collaborative entre bibliothèques, archives et maisons d'édition serait la bienvenue ».
Des milliers de livres scannés chaque jour
Dans la plainte (au paragraphe 49), les éditeurs affirment avoir réagi rapidement pour assurer l’accessibilité des œuvres pendant le confinement. Ils n’hésitent pas à égratigner le modèle d’IA. Selon les documents fiscaux consultés, le service aurait engrangé 150 millions de dollars de revenus « ces dix dernières années ». Il s’est lancé dans cette opération de numérisation depuis 2006. Une manière de répondre aux DRM, dont la violation équivaut à une contrefaçon.
La plainte épluche, pour la dénoncer, l’offre de livres depuis cette « bibliothèque ». Il est certes possible d’acheter les ouvrages, mais le premier lien proposé dirige sur Better World Books, contrôlé par une « coquille vide » sous contrôle de Brewster Kahle, fondateur d’IA. « Il est notable de relever qu’IA ne fournit aucun lien vers les éditeurs de livres ou la page des auteurs ».
Non sans insistance, elle dénie au site le statut de bibliothèque accréditée ou d’œuvrer dans le secteur de l'éducation. Une « pure fiction » selon les éditeurs, qui capture à l’appui, montrent la présence de thrillers, romans à l’eau de rose, d’ouvrages ludiques, etc. Bref, des contenus pas vraiment taillés pour un usage scolaire.
Capture extraite de la plainte
Elle relève encore qu’IA s’appuie sur des scanners Scribe, chacun en capacité de numériser 300 pages en 5 minutes. Elle compte sur sept centres régionaux de numérisation et onze satellites aux États-Unis, au Canada et au Royaume-Uni, avec plusieurs scanners à chaque endroit. Le même document affirme qu’Internet Archive a embauché des petites mains dans d’autres pays comme aux Philippines ou en Chine, sans compter les contributeurs volontaires. « À pleine capacité, le site peut numériser jusqu’à 3 000 livres en une seule journée, selon son archiviste et éditeur de logiciel, Jason Scott ».
Les fichiers sont stockés sur ses serveurs principaux à San Francisco, accompagnés des métadonnées pour être ensuite rendus disponibles sous de multiples formats (.pdf, ePub, fichier Txt et même au format audio).
La plainte dénie au site le statut d’hébergeur, les œuvres étant selon les éditeurs, mises en ligne par Internet Archive. Elle assure aussi que trop souvent, IA a ignoré les demandes de retrait (« take down ») émises par les auteurs. Finalement, les éditeurs demandent à titre principal qu’Internet Archive se voie enjoint de cesser ces pratiques et supprimer l’ensemble des reproductions illicites et condamné à des dommages et intérêts, non encore chiffrés.