Aux yeux de la Commission d’accès aux documents administratifs (CADA), les acteurs publics qui fournissent au public des documents scannés au format PDF contreviennent à la loi Numérique de 2016. La CNIL vient d’en faire les frais.
Vous souvenez-vous de la mise en ligne des premières déclarations d’intérêts des parlementaires, en 2014 ? La plupart des documents diffusés par la Haute Autorité pour la transparence étaient en fait des versions scannées de formulaires remplis au stylo, ce qui rendait impossible toute extraction automatisée des informations contenues dans ces fichiers.
Résultat, l’association Regards Citoyens avait dû solliciter l’aide de milliers d’internautes pour ressaisir tous les renseignements alors fournis par les députés et les sénateurs...
Malheureusement pour nous, nous avons goûté au même type de déconvenue il y quelques semaines. Dans le cadre d’une demande « CADA », la CNIL nous a transmis l’une de ses délibérations sous forme de document scanné. Pour en reprendre des extraits, pas d’autre solution que de tout retranscrire. Dommage quand on sait que ce fameux document a bien dû être édité à la base sur un logiciel de traitement de texte !
Les formats non réexploitables sont interdits par la loi Numérique
Notre saisine de la Commission d’accès aux documents administratifs étant déjà enclenchée au moment où nous avons reçu ce PDF (la CNIL a mis près de trois mois à nous l’envoyer), nous avons informé l’institution que nous maintenions notre demande d’avis, sur le fondement du nouvel article L300-4 du Code des relations entre le public et l’administration.
Introduit par la loi Numérique, cet article prévoit en effet que « toute mise à disposition » (communication individuelle, diffusion...) effectuée dans le cadre du droit d’accès aux documents administratifs doit se faire « dans un standard ouvert, aisément réutilisable et exploitable par un système de traitement automatisé » – conformément aux principes de l’Open Data.
Après avoir ausculté notre dossier, la CADA a considéré le 5 avril dernier que « la mise en ligne de documents administratifs numérisés sous format PDF image ne permet ni la réutilisation et ni l'exploitation des données fournies par un système de traitement automatisé ».
L’autorité indépendante estime ainsi qu’en cas de demande de documents administratifs, les dispositions de la loi Numérique « font obligation à l'administration d'en fournir une copie en format ouvert, aisément réutilisable et exploitable par un système de traitement automatisé dès lors qu'elle en dispose déjà ou qu'elle est susceptible d'en disposer à l'issue d'une opération de transfert, de conversion ou de reproduction courante ».
Autrement dit, cette obligation prévaut si l’administration a conservé le fichier de traitement de texte original, mais aussi si elle l’a supprimé (à condition qu’une reconversion soit possible).
Un sérieux avertissement à l'attention des administrations
Dans le cas présent, la CNIL a ainsi été enjointe à nous communiquer sa fameuse délibération dans un format compatible avec les standards de l’Open Data. Ce qu’a fait l’institution en diffusant ce jour une nouvelle version de sa délibération sur le site Légifrance.
- Voir la délibération de la CNIL (PDF/en version consultable sur Légifrance)
- Voir l’avis de la CADA (PDF)
Cet avis de la CADA n’a pas de valeur contraignante pour les administrations. Il devrait néanmoins servir d’aiguillon, et pourrait permettre à certains demandeurs d’obtenir plus facilement des documents dans un format ouvert et aisément réutilisable. On se souviendra en ce sens de la première « ouverture » de l'algorithme d'Admission Post-Bac, sous forme de scan, quelques jours seulement après la promulgation de la loi Numérique...
Le PDF déjà déconseillé par Etalab
La mission Etalab, qui accompagne les administrations dans leur marche vers l’Open Data, demande de longue date aux acteurs publics d’ouvrir leurs données « dans des formats ouverts (Exemple : CSV, JSON, XML, RDF...) qui permettent la réutilisation sans restriction d’accès ni de mise en œuvre, par opposition à un format fermé ou propriétaire ». Dans l’hypothèse où cela ne serait pas possible, l’institution recommande de « rechercher autant que possible le véritable format d’origine, et pas, par exemple, le PDF, développé pour le confort de lecture, qui circule usuellement ».