Accidents : le contenu des PV dorénavant exploité à des fins statistiques

Accidents : le contenu des PV dorénavant exploité à des fins statistiques

Les accidents de la mer

Avatar de l'auteur
Xavier Berne

Publié dans

Droit

02/01/2018 5 minutes
33

Accidents : le contenu des PV dorénavant exploité à des fins statistiques

Afin d’améliorer les statistiques liées à la sécurité routière, le gouvernement vient d’autoriser la création d’un traitement composé des nombreuses informations contenues dans les procès-verbaux dressés par les forces de l’ordre : nom du conducteur, circonstances de l’accident, mais aussi « données de santé » ou même profession.

Comme chaque année, l’exécutif profite du calme des fêtes pour publier de – très – nombreux textes au Journal officiel. Le 27 décembre dernier, Édouard Philippe et son ministre de l’Intérieur, Gérard Collomb, ont ainsi signé un décret qui permet dorénavant à l’Observatoire national interministériel de la sécurité routière (ONISR) de collecter les données issues des PV dressés par les gendarmes et policiers lors d’accidents de la circulation routière.

Dans l’objectif de mieux analyser « l'accidentalité » locale comme nationale, et améliorer « l'évaluation des politiques de sécurité routière sur la longue durée », l’institution se voit autorisée à exploiter ces informations, qui ne seront pas anonymisées.

La CNIL en appelle à une « vigilance particulière » du fait de l’absence d’anonymisation

Peuvent notamment être enregistrées et exploitées, au titre de ce nouveau traitement :

  • État civil (nom, nom d'usage, prénom, sexe, date et lieu de naissance)
  • Adresse postale
  • Numéro et état de validité du permis de conduire
  • Numéro d’immatriculation du véhicule
  • Infractions constatées au Code de la route
  • « Informations sur la profession, la police d'assurance ou le comportement des personnes impliquées dans l'accident, l'ensemble des circonstances de cet accident et du déplacement à l'occasion duquel il a eu lieu, et les constatations faites à cette occasion »
  • « Données de santé »
  • Résultats des épreuves de dépistages d’alcoolémie ou de stupéfiants

Ces très nombreuses données ne pourront être exploitées qu’à des fins statistiques. Le décret interdit en ce sens toute recherche ou extraction d’informations visant à identifier une personne enregistrée dans ce nouveau traitement – et ce « de façon automatisée ou non ». Autrement dit, il ne devrait par exemple pas être possible pour un agent habilité de rechercher tous les accidents dans lesquels un individu en particulier a été impliqué.

« Les informations collectées (...) ne seront pas utilisées, dans le cadre des traitements envisagés, pour prendre des décisions à l'égard des personnes concernées » souligne ainsi la Commission nationale de l’informatique et des libertés (CNIL), dans sa délibération relative à ce décret.

Des données transmises « en clair » via TransPV

La gardienne des données personnelles se montre toutefois inquiète de « l'absence d'anonymisation ou de pseudonymisation des procès-verbaux collectés ».

L’autorité administrative indépendante explique que l’ONISR et ses observatoires départementaux et régionaux sont censés disposer avec ce décret de « l'ensemble des procès-verbaux des accidents de la circulation routière », « dans leur version numérisée ». Ces documents transitent « sous format PDF » par le biais du dispositif existant TransPV, « mis en œuvre par l'AGIRA (Association pour la gestion des informations sur le risque en assurance) ». Un outil qui permettait jusqu’ici aux seuls assureurs de recevoir les PV dressés par les services de police et de gendarmerie.

Tout en reconnaissant que cette situation lui semble « envisageable » compte tenu des « difficultés matérielles » liées à une purge des données nominatives figurant dans les masses de PV dressés par les forces de l'ordre, la CNIL prévient que « le choix aujourd'hui effectué devra être réévalué dès que les conditions d'établissement des procès-verbaux ou d'accès à leur contenu par le biais du dispositif TransPV AGIRA auront évolué ».

L’institution s’appuie par ailleurs sur cet élément pour prôner une « vigilance particulière », quant à la désignation et l'habilitation des agents pouvant accéder à ces données « à raison de leurs attributions et dans la limite du besoin d'en connaître ».

Dans son avis, qui date d’avril 2017, la commission constate en outre que les données de TransPV sont « transmises en clair ». Un point fâcheux selon la gardienne des données personnelles, qui en appelait ainsi les pouvoirs publics à prendre des mesures de sécurité appropriées, « telles que le chiffrement des données échangées par un algorithme réputé fort afin de garantir la confidentialité ».

La CNIL n’a en revanche pas contesté que les données collectées puissent être conservées pendant dix ans, étant donné « qu'une meilleure compréhension de l'accidentalité suppose de pouvoir analyser les accidents sur une durée relativement longue, en particulier dans les départements et régions à faible accidentalité ».

La base des vitesses maximales autorisées se fait toujours attendre

Avec ce décret, le gouvernement d’Édouard Philippe donne le coup d’envoi d’une réforme annoncée par Manuel Valls à l’issue du Comité interministériel de la sécurité routière d’octobre 2015 (mesure C19).

Force est toutefois de constater que certaines des mesures annoncées à cette occasion n’ont pas été respectées : la précédente majorité ambitionnait notamment de « bâtir à échéance de deux ans » une base de données des vitesses maximales autorisées sur l’ensemble du territoire. Ce méga-fichier devait être mis gratuitement à la disposition du public, pour éviter notamment que certains utilisateurs de GPS ou de systèmes d’aide à la navigation ne soient induits en erreur par un appareil non mis à jour.

Cette réforme est certes actée par la loi Numérique de 2016, mais son décret d’application manque toujours à l’appel...

Écrit par Xavier Berne

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

La CNIL en appelle à une « vigilance particulière » du fait de l’absence d’anonymisation

Des données transmises « en clair » via TransPV

La base des vitesses maximales autorisées se fait toujours attendre

Fermer

Commentaires (33)


Si ça ne doit servir qu’à des statistiques, une bonne partie des types d’info demandées n’a aucun sens…


“il ne devrait par exemple pas être possible pour un agent habilité de rechercher tous les accidents dans lesquels un individu en particulier a été impliqué”. Bon usage du conditionnel.

Car si la base de données contient bien tout ce qui y est indiqué, faut pas avoir un doctorat en informatique pour faire une recherche dedans, du tri par colonnes et des regroupements patronymiques.


ça dépend ce qui est donné à l’agent comme outil pour exploiter.

Si c’est juste une interface sur laquelle on peut faire des recherches sur les accidents par région/route/type mais pas de possibilité de recherche par le nom/assurance/n°permis/immatriculation, ça marche.








ChtiClem a écrit :



ça dépend ce qui est donné à l’agent comme outil pour exploiter.

Si c’est juste une interface sur laquelle on peut faire des recherches sur les accidents par région/route/type mais pas de possibilité de recherche par le nom/assurance/n°permis/immatriculation, ça marche.





Comme dit au dessus, c’est une base de données, et par définition on peut/pourra faire toutes les requêtes que l’on veut.



Je vois pas l’intérêt d’avoir le nom/plaque d’immatriculation et même adresse complète, la ville suffirait…



Enfin, ça pourra toujours servir aux assurances&nbsp;<img data-src=" />









WereWindle a écrit :



Si ça ne doit servir qu’à des statistiques, une bonne partie des types d’info demandées n’a aucun sens…





Exact : le nom n’a rien à faire dans le fichier, il ne permet pas d’identifier un individu de manière fiable sur un plan statistique, juste de pouvoir soupçonner une personne portant le même nom.



Le numéro d’immat de véhicule n’a pas beaucoup d’intérêt sauf justement pour retrouver le nombre de fois qu’un véhicule est présent dans la base.

Pour avoir de l’intérêt il doit être recoupé automatiquement avec une base sur les caractéristiques du véhicule (état du contrôle technique, marque/modèle, âge, puissance moteur, …)



Pour mesurer l’accidentalité, vraiment? Quel est le lien entre les pv et les accidents?



&nbsp;


ben c’est peut-être ce qu’ils veulent savoir ?

tous les Lyonnais de 44 ans ayant eu plus de 5 PV pour excès d’acoolémie ou de vitesse causent 14% des accidents alors qu’ils ne représentent que 6% de la population ?

( eu les Lyonnais, les 44 ans etc .. ne sont la que pour l’illustration <img data-src=" /> )


Un PV, c’est pas forcément une amende….

A chaque accident un PV est dressé pour relater officellement ce qu’il s’est passé.


Certains accidents de la route sont suivi d’un procès verbal par les forces de l’ordre. C’est obligatoire dès qu’il y a un blessé ou un mort.



Après, on est bien d’accord que les statistiques ne seront que partielles.








dirtyvader a écrit :



A chaque accident un PV est dressé pour relater officellement ce qu’il s’est passé.





Non, pas à chaque accident.



J’ai pas eu le courage de lire l’avis de la CNIL (ce serait bien qu’ils mettent une section TL;DR à la fin), mais c’est quoi les “difficultés matérielles liées à une purge des données nominatives figurant dans les masses de PV dressés par les forces de l’ordre” ?



Alors déjà, automatiser un masquage de ces données sur les pdf avant transmission, ça doit pas non plus être la mer à boire, mais en plus, j’imagine que quelqu’un (ou quelque chose) va se farcir la mise en base des données de ces pdf, non ? Et dans ce cas, c’est pas compliqué de ne pas mettre en base les données nominatives. C’est quoi cette excuse en carton pour justifier la collecte centralisée de ce genre de données ?



Et ce vœu pieu de la CNIL, qui espère qu’une fois ces “difficultés matérielles” surmontées, ces données nominatives ne seront plus collectées… Je les imaginais moins naïfs, à la CNIL.



Moi je trouve pas ça “envisageable” que l’Observatoire national interministériel de la sécurité routière dispose de mon Etat Civil et de mes données de santé, c’est pas mon toubib.


Les statistiques présentées sont réalisables sans mettre en clair le nom et le prénom dela personne. Ces données n’ont aucune valeur pour la statistique.



C’est là qu’on se rend compte que le prétexte de la statistique est fausse, et qu’il s’agit bel et bien d’un fichage de la population. On commence par le contenu des PV, et comme ça passe sans problème (à part quelques exégètes amateurs qui font gueuler mais que personne n’écoute), il y aura ensuite d’autres fichiers, pour [notre sécurité|faire des stats].



Mais pourquoi râlerait-on&nbsp; ? On est si bien, dans une casserole à la température idéale pour se faire chauffer les cuisses <img data-src=" />


Je ne suis pas totalement d’accord.

La nom/prenom couplé à l’immat permet d’identifier la récidive et donc déterminer que (par exemple), une personne contrôlée en état alcoolémie plus de 2 fois dans la même année grille plus de feu rouge que le reste de la population.

Alors que l’immat seule ne veut rien dire vu que x personnes peuvent utiliser la voiture (femme/mari/enfants etc…)



Je rentre pas dans le débat vie privée / anonymisation / fichage etc… D’un point de vue purement statistique bisounours je peux clairement trouver un intérêt “fort” à la présence des données personnelles.








Jarodd a écrit :



Les statistiques présentées sont réalisables sans mettre en clair le nom et le prénom dela personne. Ces données n’ont aucune valeur pour la statistique.



C’est là qu’on se rend compte que le prétexte de la statistique est fausse, et qu’il s’agit bel et bien d’un fichage de la population. On commence par le contenu des PV, et comme ça passe sans problème (à part quelques exégètes amateurs qui font gueuler mais que personne n’écoute), il y aura ensuite d’autres fichiers, pour [notre sécurité|faire des stats].



Mais pourquoi râlerait-on  ? On est si bien, dans une casserole à la température idéale pour se faire chauffer les cuisses <img data-src=" />







ce sont les pv d’accidents, pas les pv d’excès de vitesses ou de feu rouge grillé (sauf si ça a finit en accident)



Tu peux avoir le même degré de finesse en remplaçant les données perso par un “hash” de ces données. Ca permet de différencier les individus sans pour autant pouvoir les identifier.



par exemple remplacer “nom, nom d’usage, prénom” par user_id

avec user_id = hash4096bits(nom+“:”+nom d’usage+“:”+prénom).



idem pour immatriculation et numéro de permis

pour la date de naissance: 01/mm/yyyy (le jour est forcé à 01)

etc.


“Ces très nombreuses données ne pourront être exploitées qu’à des fins

statistiques. Le décret interdit en ce sens toute recherche ou

extraction d’informations visant à identifier une personne enregistrée

dans ce nouveau traitement&nbsp;– et ce «&nbsp;de façon automatisée ou non&nbsp;».

Autrement dit, il ne devrait par exemple pas être possible pour un

agent habilité de rechercher tous les accidents dans lesquels un

individu en particulier a été impliqué.”


Une loi peut-être mis à jour après en fonction des événements.


Ce serait un premier pas bienvenu, mais après c’est possible de dé-anonymiser (ex: si on a les infos d’un des accidents d’une personne donnée).


C’est le sel qu’on rajoute à des données poivrées pour éviter le travers, non?








Toorist a écrit :



Je ne suis pas totalement d’accord.

La nom/prenom couplé à l’immat permet d’identifier la récidive et donc déterminer que (par exemple), une personne contrôlée en état alcoolémie plus de 2 fois dans la même année grille plus de feu rouge que le reste de la population.

Alors que l’immat seule ne veut rien dire vu que x personnes peuvent utiliser la voiture (femme/mari/enfants etc…)



Je rentre pas dans le débat vie privée / anonymisation / fichage etc… D’un point de vue purement statistique bisounours je peux clairement trouver un intérêt “fort” à la présence des données personnelles.





Justement, si tu veux faire des stats comme cela nous est présenté, tu n’as pas besoin des infos nominatives. Mais comme tu dis, ces infos permettent de faire des stats sur les personnes. C’est donc du flicage, et non des statistiques.

&nbsp;





darkbeast a écrit :



ce sont les pv d’accidents, pas les pv d’excès de vitesses ou de feu rouge grillé (sauf si ça a finit en accident)





Je n’ai pas dit le contraire.









eglyn a écrit :



Comme dit au dessus, c’est une base de données, et par définition on peut/pourra faire toutes les requêtes que l’on veut.



Je vois pas l’intérêt d’avoir le nom/plaque d’immatriculation et même adresse complète, la ville suffirait…



Enfin, ça pourra toujours servir aux assurances <img data-src=" />





Je ne suis pas DBA mais il est possible de donner accès à certaines tables ou à des vues retournant un résultat selon ce que l’on demande dans un périmètre donné. Mais en tout cas c’est la solution la plus élégante. Une éventuelle interface (non retenue à première vue) peut ensuite se brancher sur des objets (vues, procédures stockées, …) pour mettre en forme les résultats retournés.





Dans son avis, qui date d’avril 2017, la commission constate en outre que les données de TransPV sont « transmises en clair ». Un point fâcheux selon la gardienne des données personnelles, qui en appelait ainsi les pouvoirs publics à prendre des mesures de sécurité appropriées, « telles que le chiffrement des données échangées par un algorithme réputé fort afin de garantir la confidentialité ».





Bon Xavier, il faudrait savoir ce que tu veux. Tu fais régulièrement des articles pour rappeler le manque de transparence dans les administrations et maintenant qu’il y en a, ça va toujours pas.

Faut se décider namého ! <img data-src=" />



Plus sérieusement, pour la partie sur l’anonymisation, n’importe quel prestataire peut leur pondre une moulinette automatisée. Nous avons dû le faire à maintes reprises dans le retail par exemple, pour utiliser des jeux de production sur les environnements hors prod en corrompant les données personnelles pour éviter de pouvoir identifier formellement une personne tout en ayant des jeux cohérents (autre que “Toto1 Toto2 rue toto 59000 Totoland”…). Ces moulinettes s’appliquent sur les référentiels clients, les commandes clients possédant leurs noms et adresses, la fidélité, etc.


On est donc d’accord que le DBA, moyennant un bon resto, peut accéder aux données perso ?


Faut y aller mollo avec l’administration française : ils ont découvert les bases de données il n’y a pas longtemps, laissons leur encore une bonne décennie pour qu’ils apprennent ce qu’est un hash <img data-src=" />


Si après ils se rendent compte que les médicaments sont plus presents que ce que l’ont pense, etagisent en consequence…








Ami-Kuns a écrit :



Une loi peut-être mis à jour après en fonction des événements.





Oui, d’où l’intérêt de ne pas mettre n’importe quoi dans la liste de données.





Ces très nombreuses données ne pourront être exploitées qu’à des fins statistiques



Jusqu’à la prochaine loi (voire décret?) ajoutant un cas d’utilisation à ces données (lutte contre le terrorisme, alerte enlèvement?)


Si on interdit au DBA les accès en exécution à certains programmes et que le gestionnaire de droits du système empêche aussi au développeur d’exécuter n’importe quel code sur n’importe quel objet de la base de données, cela fait trois restos. Faudrait théoriquement augmenter ton budget. Mais je rêve.


Non je ne suis pas d’accord.

Les infos nominatives permettent de faire des recoupement pour la réalisation des stats par profil et conducteur et non pas par voiture. La publication de ces informations personnelles une fois les stats compilées n’est pas utile elle.

Si c’est infos sont utilisées uniquement dans un but statistiques, ce n’est pas du flicage.



Mais comme je l’ai dit dans mon premier post, on est d’accord que c’est une analyse bisounours basée sur ce qui est annoncé et pas l’utilisation “réelle” de ces données.








Toorist a écrit :



Non je ne suis pas d’accord.

Les infos nominatives permettent de faire des recoupement pour la réalisation des stats par profil et conducteur et non pas par voiture. La publication de ces informations personnelles une fois les stats compilées n’est pas utile elle.

Si c’est infos sont utilisées uniquement dans un but statistiques, ce n’est pas du flicage.



Mais comme je l’ai dit dans mon premier post, on est d’accord que c’est une analyse bisounours basée sur ce qui est annoncé et pas l’utilisation “réelle” de ces données.





Surtout que pour faire du “flicage” il suffit d’aller taper dans la base déjà existante des procès verbaux d’accidents….









wanou2 a écrit :



Surtout que pour faire du “flicage” il suffit d’aller taper dans la base déjà existante des procès verbaux d’accidents….





Du coup je suis allé chercher rapido des infos sur cette base, tu penses bien à celle de l’INRETS créée en 2007 ? Pas réussi à savoir:




  • à qui elle est accessible et comment (que des flics fassent du flicage, cela s’entend. Que les moyens de flicage soient éparpillés partout, cela s’entend moins)

  • la nature des données contenues

  • les traitements effectués sur ces données.

    Effectivement c’est peut-être déjà un peu la même chose que pour l’ONISR&nbsp; , mais si quelqu’un a des infos dessus, ça peut être intéressant.



    Enfin bref, j’ai du mal à comprendre comment la CNIL peut laisser passer un truc comme ça, qui piétine allégrement les principes (pertinence des données, droits des personnes, sécurité des données) de sa Loi Informatique et Libertés



    &nbsp;









WereWindle a écrit :



Si ça ne doit servir qu’à des statistiques, une bonne partie des types d’info demandées n’a aucun sens…





Bah oui et non et contrairement à ce qui est présenté, je trouve que le nom, l’age apporte pas mal d’éléments à un niveau local / régional.

A partir d’un nom au niveau d’une région ou d’une localité, il est possible de savoir si statistiquement les causes d’accidentologie sont issue de facteur familliaux, (en partant du postulat que les gens d’un même sous-ensemble géographique sont souvent issue de la même famille, même si cela tends à être moins le cas).

Le code postal va également dans ce sens, s’agit-t-il d’un problème lié à une autoécole / centre d’examen ou encore d’un secteur routier à risque pour des éléments non connu. Le numéro d’immatriculation doit permettre de savoir si la cause de ‘petit accident’ multiple existe et arrive à cause du conducteur ou non.&nbsp;



Sans forcément servir à nommer tel famille, tel personne ou tel société. Je trouve que c’est intéressant d’un point de vue statistique et d’analyse des causes d’accidentologie de se poser ce genre de question, plutôt que d’être dans le répressif et cibler systématiquement l’alcool ou la vitesse. Des comportements sociologique transmis entre les membres d’un groupe individue sont pertinent.



Après oui, il a toujours possibilité de faire mieux sur l’anonymisation de certaines données.

&nbsp;Mais je pense qu’une partie des données présentes sont retrouvable par différents moyens (tribunaux, journaux, …) et quelqu’un de patient arriverais à reconstruire la même choses (partiellement au moins) à partir de donnée publié.



Bienvenus dans le flicage automatisé mais pas encore en même temps, de tous les “délinquants” du stationnement local et/ou brutal, qui s’ignorent.

&nbsp;Et haro sur la CNIL pour son autorisation naïve à ne pas comprendre que toute Base de Données bien administrée, peut devenir une arme de destruction massive de la liberté de chacun à voyager sereinement car le French Big Brother de la Sécurité Automobile va tout savoir de votre “bagnole” et autres &nbsp;informations personnelles &nbsp;sans nécessités.

Et quant les “nouveaux gendarmes auxiliaires de la statistique routière, se seront fait les dents avec des logiciels du type “Project 2016”, alors plus personne n’échappera à la “rapacité financière ” de nos gouvernements.

&nbsp;Automobilistes français il va vous falloir vous habituer aux rackets routiers permanents.

Vous n’aviez qu’à voter aux dernières élections.&nbsp;