De nouvelles données juridiques de Légifrance en Open Data

De nouvelles données juridiques de Légifrance en Open Data

JORF, décisions du Conseil constitutionnel, de la CNIL...

Avatar de l'auteur
Xavier Berne

Publié dans

Droit

21/07/2014 3 minutes
7

De nouvelles données juridiques de Légifrance en Open Data

Comme s’y était engagé Jean-Marc Ayrault lorsqu’il était Premier ministre, la Direction de l'information légale et administrative (DILA) vient de mettre à disposition, gratuitement et sous licence ouverte, cinq jeux de données juridiques dont certains s’avèrent particulièrement importants, puisqu’ils contiennent les codes, lois et arrêtés publiés au Journal Officiel, ou bien encore les décisions du Conseil constitutionnel ou de la CNIL.

data.gouv.fr

 

Depuis le mois dernier, la réutilisation de certaines des données juridiques diffusées sur le site Légifrance est officiellement gratuite. Il s’agissait de la concrétisation d’un des engagements du gouvernement Ayrault en faveur de l’Open Data, puisque ces informations publiques (textes de loi, codes, jurisprudence...) étaient jusqu’ici soumises au paiement d’une redevance dès lors qu’il s’agissait d’en faire autre chose qu’une simple consultation.

 

Mais après s’être pris les pieds dans le tapis au moment de l’ouverture des onze jeux de données concernés par cette évolution de la règlementation, la Direction de l'information légale et administrative (DILA) a finalement mis à disposition ses données sur le portail national « data.gouv.fr ». Cela a tout d’abord commencé avec les bases LEGI (Codes, lois et règlements dans leur version consolidée), KALI (Conventions collectives nationales) et CIRCULAIRES.

Cinq nouveaux jeux de données, trois manquent encore à l'appel

Vendredi, cinq jeux de données supplémentaires ont été ajoutés sur data.gouv.fr, toujours sous licence ouverte :

  • JORF : lois, ordonnances, décrets, arrêtés,... publiés au Journal Officiel depuis 1990
  • CONSTIT : ensemble des décisions du Conseil constitutionnel,
  • CNIL : ensemble des délibérations de la CNIL,
  • ASSOCIATIONS : déclarations de création, de modification ou de dissolution des associations régies par la loi de 1901, des associations syndicales de propriétaires et des fondations d’entreprises,
  • DÉPOTS DES COMPTES ANNUELS DES ASSOCIATIONS.  

En attendant que les trois jeux de données restants soient mis à disposition de la même manière (il manque la base JADE sur les décisions de la justice administrative, la base CASS-INCA pour les arrêts de la Cour de Cassation, ainsi que la base CAPP pour les arrêts des cours d'appel et des tribunaux de première instance de l’ordre judiciaire), notons que ce nouveau pas en avant a été salué sur Twitter par l’association Regards Citoyens ou bien encore par la ministre Najat Vallaud-Belkacem.  

Écrit par Xavier Berne

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Cinq nouveaux jeux de données, trois manquent encore à l'appel

Fermer

Commentaires (7)




Direction de l’information légale et administrative (DILA) vient de mettre à disposition, gratuitement et sous licence ouverte, cinq jeux de données juridiques dont certains s’avèrent particulièrement importants, puisqu’ils contiennent les codes, lois et arrêtés publiés au Journal Officiel, ou bien encore les décisions du Conseil constitutionnel ou de la CNIL.



Heu, sauf erreur de ma part, toutes ces données sont des données publiques issues d’entités publiques donc par principe réutilisables librement dès leur publication.

La seule contrainte pour celui qui veut les réutiliser est qu’en vertu de l’article 12 de la loi du 17 juillet 1978, les informations publiques ne doivent pas être altérées, leur sens ne doit pas être dénaturé et les sources et dates de leur dernière mise à jour doivent être mentionnées.



Ce qui n’enlève pas son mérite à la CADA, puisqu’elle facilite grandement ce droit du citoyen en rendant plus visibles ces données. <img data-src=" />








Citan666 a écrit :



Heu, sauf erreur de ma part, toutes ces données sont des données publiques issues d’entités publiques donc par principe réutilisables librement dès leur publication.

La seule contrainte pour celui qui veut les réutiliser est qu’en vertu de l’article 12 de la loi du 17 juillet 1978, les informations publiques ne doivent pas être altérées, leur sens ne doit pas être dénaturé et les sources et dates de leur dernière mise à jour doivent être mentionnées.



Ce qui n’enlève pas son mérite à la CADA, puisqu’elle facilite grandement ce droit du citoyen en rendant plus visibles ces données. <img data-src=" />







Le décret du 7 août 2002 (récemment modifié, comme expliqué dans l’article) prévoyait une redevance pour la réutilisation, notamment commerciale, de ces données, car la DILA constitue des bases, qui sont régulièrement mises à jour. La redevance vient en principe compenser le coût de mise à disposition. L’institution nous indiquait d’ailleurs que son manque à gagner serait environ de 300 000 euros par an, de mémoire.









Xavier.B a écrit :



Le décret du 7 août 2002 (récemment modifié, comme expliqué dans l’article) prévoyait une redevance pour la réutilisation, notamment commerciale, de ces données, car la DILA constitue des bases, qui sont régulièrement mises à jour. La redevance vient en principe compenser le coût de mise à disposition. L’institution nous indiquait d’ailleurs que son manque à gagner serait environ de 300 000 euros par an, de mémoire.





Au temps pour moi, ça m’apprendra à survoler l’article.<img data-src=" />



A voir si les sociétés éditrices de codes INpactent leurs prix de vente s’ils n’ont plus cette redevance à payer, et si oui dans quelle mesure.




En attendant que les trois jeux de données restant soient mis à disposition de la même manière (il manque la base JADE sur les décisions de la justice administrative, la base CASS-INCA pour les arrêts de la Cour de Cassation, ainsi que la base CAPP pour les arrêts des cours d’appel et des tribunaux de première instance de l’ordre judiciaire)





Les condamnation hadopi seront-elle dedans?








Lorka.Tinou a écrit :



A voir si les sociétés éditrices de codes INpactent leurs prix de vente s’ils n’ont plus cette redevance à payer, et si oui dans quelle mesure.





Le prix pour la mise à disposition de l’ensemble des codes et leur actualisation pendant un an devait coûter moins de 3 000 euros/an de mémoire, pour un éditeur comme Dalloz c’est une goûte d’eau par rapport au coût que doit représenter l’impression, le travail scientifique consistant à rassembler la jurisprudence sous les articles, la distribution, etc.



Perso j’ai été jeter un coup d’œil à ces données qui sont désormais accessibles gratuitement, je ne sais pas si l’open data fonctionne toujours selon ces normes techniques mais j’ai trouvé que c’était un merdier indescriptible. Déjà il n’est pas possible de télécharger seulement un Code ou une loi, on est obligé de se taper le téléchargement de la totalité de la base de données compressée qui doit faire dans les 700 Mo, puis la décompresser, la décompression prenant trois plombes puisqu’il y a genre 3 fichiers par article de chaque code ou de chaque loi…



Donc déjà, à chaque fois qu’une nouvelle loi ou un nouveau décret est publié, il faut se retaper le téléchargement de la BDD, la décompression, et comparer avec sa propre BDD pour trouver où sont les modifications…



Ensuite tout est au format .XML avec, comme je l’ai dit, deux ou trois fichiers par article (un fichier contenant les informations sur l’article, un fichier contenant le texte de l’article, etc). Le tout a l’air très mal documenté donc bon courage pour s’y retrouver.



Bon après j’y connais pas grand chose en manipulation de fichiers XML, peut-être qu’il y a des façons simples de manipuler cette masse astronomique de fichiers XML mis à jour régulièrement, mais en tant qu’utilisateur de PHP/MySQL ça m’a pas l’air très pratique.



Pourquoi dans l’adresse d’un site francais organisation s’ecrit organization?

http://www.data.gouv.fr/fr/organization/premier-ministre





du coup on pourrait ecrire

organization/prime-minister



<img data-src=" />