Nouvelles obligations d’Open Data « par défaut » : mode d’emploi

Nouvelles obligations d’Open Data « par défaut » : mode d’emploi

Base-moi

Avatar de l'auteur
Xavier Berne

Publié dans

Droit

08/10/2018 8 minutes
25

Nouvelles obligations d’Open Data « par défaut » : mode d’emploi

Depuis hier, les administrations d’au moins cinquante agents ou salariés sont tenues de mettre en ligne, en Open Data, de nouvelles données publiques. Next INpact revient sur cette réforme programmée par la loi Numérique au travers d’une série de questions/réponses.

Concrètement, quelles sont les nouvelles obligations posées par la loi Numérique ?

Dorénavant, en vertu de l’article L312-1-1 du Code des relations entre le public et l’administration, les administrations doivent mettre en ligne :

  • Les « bases de données » qu'elles « produisent ou qu'elles reçoivent ».
  • Leurs données « dont la publication présente un intérêt économique, social, sanitaire ou environnemental ».

Les acteurs publics concernés sont par ailleurs tenus de mettre à jour ces fichiers « de façon régulière », ce qui signifie qu’il devrait y avoir actualisation progressive des jeux de données.

De plus, l’article L312-1-3 du « CRPA » impose aux administrations de publier sur Internet « les règles définissant les principaux traitements algorithmiques utilisés dans l'accomplissement de leurs missions lorsqu'ils fondent des décisions individuelles ».

Pour toutes les données mises à disposition dans le cadre de ces nouvelles obligations, les administrations doivent recourir à « un standard ouvert, aisément réutilisable et exploitable par un système de traitement automatisé ». En clair, pas question de mettre en ligne des fichiers PDF absolument inexploitables sur le plan technique (comme en 2014, pour les premières déclarations d’intérêts des parlementaires). Les acteurs publics sont ainsi appelés à favoriser la réutilisation de ces informations publiques, en optant pour des formats compatibles avec l’Open Data.

Typiquement, qu’est-ce qui devrait ainsi être mis en ligne ?

Laure Lucchesi, la directrice de la mission Etalab, nous explique que l’ADEME devrait par exemple publier « d’importantes données sur la gestion des déchets à partir de la base SINOE », ainsi que des données de la « base Carbone » sur les diagnostics de performance énergétique. La « liste de l'ensemble des écoles de conduite françaises avec, entre autres, leur taux de réussite » est également attendue.

Fin 2016, la Commission d’accès aux documents administratifs (CADA) avait de son côté prévenu l’administration fiscale qu’il lui faudrait mettre en ligne une partie de sa base documentaire NAUSICAA.

La notion de « base de données » apparaît toutefois comme extrêmement vaste. On pourrait par exemple imaginer qu’il faille sur cette base ouvrir l’intégralité des mails échangés par les agents d’une administration (les « correspondances » étant des documents administratifs communicables par principe, après occultation notamment des données personnelles).

Quant aux règles relatives aux algorithmes, la logique est un peu différente dans la mesure où il ne s’agit pas d’imposer la publication de fichiers d’ores et déjà détenus par les administrations. Pour beaucoup d’acteurs publics, il faudra en effet préparer ces documents expliquant comment un de leur programme informatique vient s’immiscer dans le dossier de certains usagers. Et ensuite, le mettre en ligne.

Autant dire que de très nombreux acteurs publics sont concernés, au premier rang desquels Pôle emploi, les Allocations familiales et la Direction générale des finances publiques. Aides sociales, bourses scolaires, montant de certains impôts (sur le revenu par exemple), affectation de fonctionnaires, attribution des organes en transplantation cardiaque... Une multitude de décisions administratives sont aujourd’hui prises à l’aide d’algorithmes.

Quelles sont les administrations concernées ?

Toutes les administrations (au sens large) sont concernées : ministères, communes, écoles, hôpitaux, autorités administratives de type Hadopi ou CNIL, etc. Ces obligations d’ouverture s’appliquent également aux « personnes de droit privé » chargées d'une mission de service public, telles la SNCF.

Gros bémol toutefois : les institutions disposant de moins de cinquante agents ou salariés (en équivalents temps plein) sont exclues du dispositif. Idem pour les collectivités territoriales de moins de 3 500 habitants.

Y a-t-il des dérogations ?

Ces obligations ne s’appliquent que pour les données d’ores et déjà « disponibles sous forme électronique ». Il n’est ainsi pas question d’obliger les administrations à numériser des piles de documents qui n’existeraient que sur support papier.

D’autre part, les administrations n’ont pas à diffuser de données dont l’ouverture porterait atteinte à certains secrets légaux (exactement comme dans le cadre du droit d’accès aux documents administratifs). Cela concerne notamment la « vie privée » – donc les données personnelles –, le secret de la défense nationale, le secret médical, le secret des affaires, etc.

Tout ce qui touche aux « délibérations du gouvernement », à la « sûreté de l'État », au déroulement des procédures judiciaires ou bien encore à la « sécurité des systèmes d'information des administrations » restera par ailleurs conservé à l’abri des regards du public. Cette liste est cependant loin d’être exhaustive (voir les article L311-5 et L311-6 du CRPA).

Autre exception à noter : le gouvernement a fait voter en début d’année un amendement introduisant une sorte de dérogation à la transparence des algorithmes utilisés dans le cadre de Parcoursup, le successeur d’Admission Post-Bac.

Pourquoi le législateur a-t-il imposé ces obligations aux administrations ?

Si l’on se replonge dans l’étude d’impact du projet de loi Numérique, on peut lire que le législateur souhaitait « augmenter le volume de documents administratifs mis en ligne par les administrations » dans un triple objectif :

  1. « Accroître la transparence des autorités publiques »
  2. « Améliorer les services publics »
  3. « Stimuler le développement de nouvelles activités économiques »

Les données publiées en Open Data étant réutilisables librement et gratuitement, la société civile peut en effet s’en emparer pour prendre connaissance de nouvelles informations publiques, pour développer des applications pour smartphone, etc. Différentes externalités positives sont ainsi attendues.

Cette réforme était également présentée comme un vecteur de simplification pour les administrations. En effet, tout document mis en ligne n’a plus à être communiqué au(x) citoyen(s) qui le solliciterait dans le cadre d’une « procédure CADA ».

À quoi doit-on s’attendre ?

Même la mission Etalab le reconnaît : « la date du 7 octobre n’est pas une date butoir », mais « une étape supplémentaire dans la longue marche vers l’ouverture des données publiques ». Comprenez : le mouvement qui s’enclenche risque d’être très long à être pleinement appliqué.

Le 12 septembre dernier, au salon de la data de Nantes, le vice-président de l’association Open Data France, Mounir Belhamiti, annonçait par ailleurs que seules 308 collectivités territoriales avaient commencé à ouvrir leurs données. Un chiffre de très mauvais augure au regard des plus de 4 000 villes, départements, régions... concernés par la loi Numérique.

Autre difficulté :  avec ce dispositif, seules les administrations sont à la manœuvre. Ce sont elles qui détermineront notamment quelles sont leurs données présentant « un intérêt économique, social, sanitaire ou environnemental ». Le citoyen, qui n’a bien souvent pas connaissance des informations détenues par les acteurs publics, devra d’une certaine manière se contenter de ce qui lui sera proposé.

Les expériences passées font d’ailleurs craindre le pire à ce sujet. Depuis 2005, les principales administrations sont par exemple censées avoir un répertoire recensant les « principaux documents » publics qu’elles produisent ou détiennent (statistiques, rapports, codes sources, etc.) – un peu sur le modèle des fameuses données à intérêt économique, etc.

Avec la loi Numérique, les fichiers figurant au sein de ces listes doivent être diffusés en Open Data depuis le 7 octobre 2017. Problème : dans la plupart des cas, soit ces répertoires n’existent pas, soit ceux-ci sont réduits à peau de chagrin (voir notre enquête).

Dernier problème : il n'existe aucune liste des administrations d'au moins 50 agents ou salariés concernées par la loi Numérique.

Que peut faire le citoyen ?

Aucune sanction n’étant prévue par la loi Numérique, le citoyen n’a malheureusement pas beaucoup d’options devant lui...

La principale faculté qui lui est offerte par les textes demeure de demander la diffusion des documents ou données dont il souhaite la mise en ligne, par le biais d’une « procédure CADA » (voir notre guide pratique). Cela suppose toutefois que l’usager sache que tel fichier est détenu par telle administration...

Faute d’obtenir gain de cause passé un délai d’un mois, la Commission d’accès aux documents administratifs peut être saisie, ou, par la suite, le juge administratif.

C’est d’ailleurs ce que Next INpact a fait il y a quelques mois, face à plusieurs ministères qui rechignaient à appliquer leurs premières obligations d’Open Data « par défaut », en vigueur depuis le 7 avril 2017. En principe, tout document administratif communiqué individuellement par voie électronique doit dorénavant être mis en ligne par la suite. Mais là aussi, cette réforme – à première vue plutôt simple à mettre en œuvre – reste pour l’heure guère respectée.

Il faut désormais espérer que les administrations, sensibilisées jusqu’à récemment par la mission Etalab, jouent enfin le jeu de l’Open Data « par défaut » ou « par principe ».

Écrit par Xavier Berne

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Concrètement, quelles sont les nouvelles obligations posées par la loi Numérique ?

Typiquement, qu’est-ce qui devrait ainsi être mis en ligne ?

Quelles sont les administrations concernées ?

Y a-t-il des dérogations ?

Pourquoi le législateur a-t-il imposé ces obligations aux administrations ?

À quoi doit-on s’attendre ?

Que peut faire le citoyen ?

next n'a pas de brief le week-end

Le Brief ne travaille pas le week-end.
C'est dur, mais c'est comme ça.
Allez donc dans une forêt lointaine,
Éloignez-vous de ce clavier pour une fois !

Fermer

Commentaires (25)


Pourquoi j’ai la nette impression que toute cette transparence “par défaut” n’est que de la poudre de perlimpinpin ? <img data-src=" />


Est-ce lemailloten vente sur la boutique Officiel de l’Élisée qui te faire dire ça ? <img data-src=" />


On ne pourra pas dire qu’on était pas prévenu <img data-src=" />








RuMaRoCO a écrit :



Est-ce lemailloten vente sur la boutique Officiel de l’Élisée qui te faire dire ça ? <img data-src=" />





<img data-src=" />, 55€ un tee-shirt en coton ? <img data-src=" />



Oui mais intégralement fabriqué en France (de la conception, au fil en passant l’assemblage).

Si on en croit le site du fabricant.



Le problème serait peut-être plus de payer un T-shrit made in Bangladesh ou china à plus de 5€ …



Mais oui moi aussi cela ma fait tiquer également.&nbsp;


Pour revenir sur le sujet moi c’est le point 3 :

&nbsp;«&nbsp;Stimuler le développement de nouvelles activités économiques&nbsp;»



Qui m’interpelle. Là on parle pleinement d’activité commerciale, non ?&nbsp;



Ce n’est pas un peu hypocrite par rapport aux réactions vues lorsque justement un acteur économique utilise des données publiques ?&nbsp;

&nbsp;


Oui, et ?



(merci les edits sauvages…) Si tu parles du cas sur Twitter avec les affiliations politiques présumées, ça n’a juste rien à voir.




Le 12&nbsp;septembre dernier, au salon de la data de Nantes, le

vice-président de l’association Open Data France, Mounir Belhamiti,

annonçait par ailleurs que seules 308&nbsp;collectivités territoriales

avaient commencé à ouvrir leurs données. Un chiffre de très mauvais

augure au regard des plus de 4&nbsp;000&nbsp;villes, départements, régions…

concernés par la loi Numérique.





Marrant mais ce point me parait quel que peu sous-estimé concernant les communes.

Pour travailler régulièrement avec des collectivités de toutes tailles, je constate souvent la possibilité d’accès libre et réutilisable de leurs infos administratives (PLU, délibérations municipales, informations sur risques majeurs, etc…), ces données étant accessibles depuis bien avant la loi Numérique (cette dernière n’ayant qu’entériner une pratique existant depuis longtemps au sein des communes).

&nbsp;

A vrai dire, je n’ai jamais rencontré de commune qui ne mettait pas ses infos accessibles à tous. Certaines sont manquantes mais les principales sont toujours dispo.








RuMaRoCO a écrit :



Oui mais intégralement fabriqué en France (de la conception, au fil en passant l’assemblage).

Si on en croit le site du fabricant.



Le problème serait peut-être plus de payer un T-shrit made in Bangladesh ou china à plus de 5€ …



Mais oui moi aussi cela ma fait tiquer également.





On est aussi d’accord sur les plus de 5€ (allez, 10 max) pour un tee-shirt made in là-bas…

Ou 70€ voir 130€ un maillot de foot qui coûte moins de 3€ à produire <img data-src=" />



&nbsp;Petite question : est-ce que ça veut dire que les&nbsp; cartes IGN ou SHOM seront désormais considéré comme de l’OpenData, et donc utilisable pour enrichir OpenStreetMap ?








RuMaRoCO a écrit :



Oui mais intégralement fabriqué en France (de la conception, au fil en passant l’assemblage).

Si on en croit le site du fabricant.





<img data-src=" />

On parle d’un T-shirt là.

55 euros pour deux bouts de tissus assemblés qui doit prendre max 6 min à faire (je suis très large, surtout quand on voit la vitesse à laquelle les couturières vont).

Et même avec une heure de travail dessus, au prix du travail horaire en France, on n’atteindrait toujours pas les 55 euros.



C’est un peu comme “le slip français”: ils tentent de nous faire croire que 35 euros pour un slip fabriqué en France, c’est acceptable. <img data-src=" />

&nbsp;

&nbsp;



“A vrai dire, je n’ai jamais rencontré de commune qui ne mettait pas ses infos accessibles à tous. Certaines sont manquantes mais les principales sont toujours dispo.“En fait, la nouveauté essentielle est que les données ouvertes&nbsp;doivent organisées pour pouvoir être réutilisées : agrégées, requêtées, et garantissant un minimum d’interopérabilité. On ne parle donc ni de .pdf, ni de .docx, mais de base de données structurées respectant les standards&nbsp;quand ils existent.&nbsp;Peu de collectivités savent le faire…








js2082 a écrit :



C’est un peu comme “le slip français”: ils tentent de nous faire croire que 35 euros pour un slip fabriqué en France, c’est acceptable. <img data-src=" />



C’est pas “comme” Le Slip Francais, c’est Le Slip Francais tout court. Ce sont eux les fournisseurs de l’Elysée.









Patch a écrit :



C’est pas “comme” Le Slip Francais, c’est Le Slip Francais tout court. Ce sont eux les fournisseurs de l’Elysée.





Je ne vois pas la même entreprise sur le site.

D’un coté, on a le slip français, de l’autre, le fabricant Lemahieu.



Tu ne les confondrais pas par hasard?









js2082 a écrit :



Je ne vois pas la même entreprise sur le site.

D’un coté, on a le slip français, de l’autre, le fabricant Lemahieu.



Tu ne les confondrais pas par hasard?



Les 2 travaillent ensembles pour certains modèles, du coup j’étais sûr que c’était la même boîte…



Je ne cherche pas à défendre, mais il y a au moins l’argument que même les matières premières sont français (fils ; tissus etc.)








adrieng a écrit :



&nbsp;Petite question : est-ce que ça veut dire que les&nbsp; cartes IGN ou SHOM seront désormais considéré comme de l’OpenData, et donc utilisable pour enrichir OpenStreetMap ?





Pour l’IGN :

http://www.ign.fr/institut/activites/lign-lopen-data



Et la licence :

http://www.etalab.gouv.fr/licence-ouverte-open-licence



Donc je dirais que oui. Après c’est un institut séparé, je ne sais pas si c’est concerné par “les administrations”.









js2082 a écrit :



<img data-src=" />

On parle d’un T-shirt là.

55 euros pour deux bouts de tissus assemblés qui doit prendre max 6 min à faire (je suis très large, surtout quand on voit la vitesse à laquelle les couturières vont).

Et même avec une heure de travail dessus, au prix du travail horaire en France, on n’atteindrait toujours pas les 55 euros.



&nbsp;

55 euros c’est un prix élevé, mais pas trop cher pour des t-shirts fabriqués en France avec du coton filé en France etc. C’est vraiment difficile d’avoir un t-shirt imprimé fait en France avec des matières premières d’origine locale pour moins de 40 euros.

On a mené cette recherche en tant qu’association et, vraiment, c’est impossible. Il faut aussi compter la marge (qui ne correspond pas au bénéfice net).



Pour info, pour fabriquer un t-shirt tubulaire, il faut autant de machines que de tailles au départ, ensuite, la coupe, puis la couture, qui ne prend pas, effectivement, beaucoup de temps. Il y a aussi la question de l’impression (calibrage des couleurs et calage des machines), et celle du transport, puis du stockage. Bref c’est un poil plus complexe.



Pareil pour les slips, c’est compliqué à fabriquer, les st-shirts moins, certes.









Vpaillard a écrit :



“A vrai dire, je n’ai jamais rencontré de commune qui ne mettait pas ses infos accessibles à tous. Certaines sont manquantes mais les principales sont toujours dispo.“En fait, la nouveauté essentielle est que les données ouvertes&nbsp;doivent organisées pour pouvoir être réutilisées : agrégées, requêtées, et garantissant un minimum d’interopérabilité. On ne parle donc ni de .pdf, ni de .docx, mais de base de données structurées respectant les standards&nbsp;quand ils existent.&nbsp;Peu de collectivités savent le faire…&nbsp;

&nbsp;



Et je parierais qu’encore moins savent exactement de quoi il s’agit !



Quels logiciels sont utilisés par les administrations pour l’open data ? Ça serait con que chaque administration fasse son propre appel d’offre de leur côté et obtiennent un logiciel différent et tous les soucis de maintenance qui vont avec.


C’est très probablement ce qui se passe : chacun son truc…


+1

De nombreuses mairies donnaient des PDF rescannés.

Pour les cartes je sais que le jeux de données étaient offerts gratuitement. L’intermédiaires faisaient le travail de standardisation entre toutes les villes et vendaient ça Apple, Google & Mappy.


Ça rentre bien dans le périmètre des “administrations” concernées par la loi Numérique, sauf que de mémoire, ces deux institutions peuvent demander des redevances sur certains jeux de données.

Dans tous les cas, je ne sais pas si des cartes rentrent dans la catégorie des “bases de données” ou même plus largement des “données”. Donc soit essayer de leur demander ce qu’il en est, sinon tenter une bonne vieille demande CADA :)


Je n’arrive pas à détricoter les textes législatifs, mais de mémoire, les établissements ayant plus de 25% de recette propres dans leur budget (la part issue de leur activité commerciale, par opposition à la part financée par l’état) ont le droit de demander des redevances (sous réserve que celles-ci ne couvrent que le coup de production). C’est le cas de l’IGN qui est à environ 30% de recettes propres, mais pas du SHOM. Il me semble que Météo France est aussi au-dessus de ce seuil.

Ensuite, il existe des tas d’exceptions plus ou moins difficiles à juger, comme le secret de la défense nationale etc. Il est probable qu’une part des activités de l’IGN et du SHOM soient couvertes par cela.



Ensuite, techniquement, une carte, c’est une image, donc on pourrait peut-être ergoter du fait qu’il faille considérer que c’est une base de donnée ou pas (si on est honnête, il faut). Par contre, les données sources (qui sont celles qui intéresseraient vraisemblablement le plus OSM), plus moyen d’ergoter, c’est sans aucune ambiguïté des bases de données.








darkweizer a écrit :



On est aussi d’accord sur les plus de 5€ (allez, 10 max) pour un tee-shirt made in là-bas…

Ou 70€ voir 130€ un maillot de foot qui coûte moins de 3€ à produire <img data-src=" />









js2082 a écrit :



<img data-src=" />

On parle d’un T-shirt là.

55 euros pour deux bouts de tissus assemblés qui doit prendre max 6 min à faire (je suis très large, surtout quand on voit la vitesse à laquelle les couturières vont).

Et même avec une heure de travail dessus, au prix du travail horaire en France, on n’atteindrait toujours pas les 55 euros.



C’est un peu comme “le slip français”: ils tentent de nous faire croire que 35 euros pour un slip fabriqué en France, c’est acceptable. <img data-src=" />





On appelle ça communément du “marketing” <img data-src=" />