La commission des lois du Sénat vient d’adopter un amendement visant à interdire la diffusion de décisions de justice en Open Data, dès lors que subsistera un « risque de ré-identification » des personnes. Une mission jugée « impossible » il y a quelques mois par l'Assemblée nationale.
Alors que le Barreau de Paris a décidé la semaine dernière de lancer des poursuites pour « typosquatting » à l’encontre de la start-up Doctrine (voir notre article), la commission des lois du Sénat examinait ce matin le projet de loi de réforme de la justice, dont l’article 19 traite justement de l’ouverture des décisions rendues par les juridictions civiles et administratives.
Le texte, porté par la ministre de la Justice, Nicole Belloubet, vient en ce sens revoir et compléter la réforme impulsée par la loi Numérique de 2016 – mais restée pour l’heure lettre morte, faute notamment de décret d’application.
Une obligation de prévenir « tout risque de ré-identification »
En l’état, la « loi Lemaire » prévoit que tous les jugements, qu’ils soient définitifs ou non, soient « mis à la disposition du public à titre gratuit » après avoir fait l’objet « d’une analyse du risque de ré-identification des personnes ». L’idée : que cette vague de transparence ne se fasse pas au détriment de la vie privée des justiciables.
Le gouvernement souhaite cependant faire disparaître ces « analyses de risque ». Un peu comme l’avait demandé le Sénat l’année dernière, l’exécutif voudrait qu’en lieu et place, « les éléments permettant d'identifier les personnes physiques mentionnées dans [toute] décision » soient obligatoirement « occultés ».
D’après l’étude d’impact de la Chancellerie, cela signifie qu’il y aurait effacement des nombreux indices relatifs aux individus visés par les jugements (noms, prénoms, numéros de téléphone, adresses, identifiants bancaires, informations cadastrales...), mais aussi à « l'ensemble des professionnels de justice » : magistrats, greffiers, etc.
Des dispositions déjà rejetées par l’Assemblée nationale
Ce pas en direction de la Haute assemblée n’a toutefois pas convaincu les élus de la commission des lois. Ce matin, ces derniers ont voté un amendement des rapporteurs visant à durcir davantage encore ce nouveau régime d’ouverture.
Concrètement, il s’agirait de préciser que les modalités de mise en Open Data des décisions de justice « garantissent le respect de la vie privée des personnes mentionnées dans [chaque] décision » d'une part, et « préviennent » d'autre part « tout risque de ré-identification des magistrats, des fonctionnaires de greffe, des parties et de leur entourage et de toutes les personnes citées dans la décision ».
Un sacré tour de vis, destiné à « éviter tout risque d’exploitation inappropriée de ces données » selon les rapporteurs, François-Noël Buffet (LR) et Yves Détraigne (UC).
Ces dispositions furent toutefois rejetées une première fois à l’Assemblée nationale, au printemps dernier. La rapporteure du projet de loi RGPD, Paula Forteza, avait expliqué qu’il serait « impossible » d’empêcher « tout risque de réidentification » de l’ensemble des personnes citées dans les jugements et arrêts, « sauf à effacer des parties entières des décisions avant leur diffusion au public, ce qui les rendrait illisibles et inexploitables ». Pour la députée LREM, « la prévention de la réidentification doit constituer une obligation de moyens, et non de résultat ».
Or même si le Palais Bourbon en revenait à la copie gouvernementale au fil de la navette parlementaire, c’est malgré tout une large obligation de résultat qui se profile puisqu’il devra y avoir occultation de tous « les éléments permettant d’identifier les personnes physiques mentionnées dans [une] décision ». Ce qui n’est d’ailleurs même pas le cas aujourd’hui, le site Légifrance révélant des noms de magistrats et d'avocats notamment.
Opposition à la pseudonymisation des copies délivrées par les greffes
Dans son étude d’impact, le gouvernement expliquait avoir délibérément choisi de « protéger » les données personnelles de « l'ensemble des professionnels de justice, (...) du fait de la différence de visée et de portée entre la délivrance aux tiers de la copie d'une décision de justice et sa réutilisation dans le cadre de l'Open Data ».
Au motif que l’essentiel des décisions de justice avait « désormais vocation à être diffusé en ligne », l’exécutif proposait dans le même temps un tour de vis sur la délivrance de copies de jugements (sur demande individuelle).
Le projet de loi Belloubet prévoyait en effet que les greffes occultent les « éléments permettant d’identifier les parties et les tiers mentionnés dans la décision », tout du moins « si leur divulgation est de nature à porter atteinte à la sécurité ou au respect de la vie privée de ces personnes ou de leur entourage ».
La commission des lois du Sénat a toutefois fait disparaître ces dispositions, au motif que « des limitations à la publicité sont déjà prévues pour les débats et pour les jugements en certaines matières plus sensibles pour les personnes et leur vie privée ».
Les parlementaires ont en revanche rejeté deux amendements de la sénatrice Jacky Deromedi (LR), laquelle souhaitait que le Conseil national des barreaux soit destinataire de l’ensemble des décisions de justice, « à titre gratuit et sous forme électronique, dans leur version intégrale, c’est-à-dire qu’aucun élément ne soit occulté ». L’institution aurait ensuite été chargée de mettre ces jugements et arrêts à disposition des avocats uniquement.
Travaux en cours à la Cour de cassation
Alors que les débats se poursuivront d’ici quelques jours en séance publique, puis ultérieurement à l’Assemblée nationale, la Cour de cassation travaille de son côté depuis plusieurs mois à des solutions de « pseudonymisation » des décisions de justice.
À ce jour, 180 000 décisions abreuvent chaque année les bases de données « Jurinet » et « Jurica », tenues par la plus haute juridiction de l’ordre judiciaire. « Cependant, sur ces 180 000 décisions, moins de 15 000 sont diffusées en Open Data et sur le site Légifrance », reconnaît l’institution. « La cause : chaque décision doit être relue pour s’assurer que toutes les mentions identifiantes ont été anonymisées. »
Alors que près de 4 millions de décisions de justice pourraient (à terme) être proposées en Open Data chaque année, la Cour de cassation s’apprête à recourir à plusieurs « entrepreneurs d’intérêt général » afin d’avancer sur ce délicat chantier de la pseudonymisation.
La juridiction souhaite ainsi développer des « algorithmes de pseudonymisation automatique des données ». Elle espère en ce sens que « l’amélioration des techniques de reconnaissance automatique » permettra de « passer d’une approche par règles des termes à anonymiser à une approche par apprentissage automatique (preuves de concept déjà développées sur l’identification de la structure des décisions de justice, leur thème et les éléments à occulter) ».
Il est également prévu que des « algorithmes visant à limiter le risque de réidentification et le nombre de décisions “mal” pseudonymisées » soient développés.