L'Administrateur général des données présente son premier rapport et ses chantiers à venir

L’Administrateur général des données présente son premier rapport et ses chantiers à venir

Un chief et des lettres

Avatar de l'auteur
Xavier Berne

Publié dans

Droit

21/01/2016 6 minutes
1

L'Administrateur général des données présente son premier rapport et ses chantiers à venir

Considérant plus d’un an après sa prise de fonction que de nombreux freins continuent d’entraver la circulation des données au sein de l’État, l’Administrateur général des données (AGD) Henri Verdier prévoit de lancer plusieurs chantiers d’envergure. Au programme : un projet de cartographie collaborative des données de l’État, la conception de systèmes informatiques prévoyant « l’extractibilité » de leurs données, etc.

Remis fin décembre au gouvernement, le premier rapport de l’Administrateur général des données n’a été rendu public que jeudi 21 janvier (PDF) – ce qui fait mauvaise figure dès lors qu’il est question d’ouverture des données publiques... Une fois passé ce détail, rappelons que l’AGD est chargé depuis sa nomination, en septembre 2014, de coordonner « l'action des administrations en matière d'inventaire, de gouvernance, de production, de circulation et d'exploitation des données par les administrations ».

En instituant cette nouvelle fonction au sein de l’État, le gouvernement se donnait pour ambition d’améliorer l’efficacité des politiques publiques, la qualité des services rendus aux citoyens, et espérait même pouvoir réaliser quelques économies. Comment ? Grâce aux données et aux techniques d’analyse prédictive – parfois appelées datasciences. Le rapport d’Henri Verdier nous apprend que tout cela s’est notamment concrétisé par :

  • Le développement d’un modèle de prédiction des vols de voiture à l’échelle d’un département (en l’occurrence celui de l’Oise), constitué « de plus de 600 variables géographiques et socio-économiques ainsi que d’autres indicateurs tels que la météo et l’occurrence de vols les jours précédents ». L’objectif de cet outil élaboré en lien avec les services de sécurité intérieure est d’arriver à une « allocation optimale » des patrouilles de police et de gendarmerie.
  • « La bonne boîte », un service en ligne qui permet aux demandeurs d’emploi d’envoyer des candidatures spontanées dans des entreprises qui n’ont pas encore publié d’annonce, mais dont il est fort probable qu’elles recrutent prochainement. « En utilisant des données économiques décrivant l’entreprise et notamment l’historique des embauches, le modèle permet de prédire dans chaque secteur et dans chaque département la probabilité qu’une entreprise embauche dans les six prochains mois », explique l’AGD. Fonctionnant pour l’instant pour les seuls départements de l'Ile-de-France, de Lorraine et des Pays de la Loire, cet outil est accessible gratuitement sur l’Emploi Store de Pôle Emploi (voir ici).
  • Une analyse détaillée de la consommation d’électricité des bâtiments publics, dans l’optique d’optimiser la stratégie d’achat de l’État.

Ces premiers résultats sont jugés « encourageants » par Henri Verdier et son équipe, constituée de quatre « datascientists ». Ils devraient être plus conséquents l’année prochaine puisque l’Administrateur général des données a lancé l’été dernier un appel d’offres en direction des entreprises spécialisées dans les datasciences, et qui auront vocation à intervenir en fonction des besoins des ministères.

Outre ces réalisations pratiques, l’AGD revient longuement dans son rapport sur les freins à la circulation des données au sein de l’administration. « Focalisé sur la fiabilité, la sécurité et la maîtrise des coûts, [l’État] a négligé l’interopérabilité, l’accessibilité et la capacité d’usage, et a donc toléré une culture de silos, des divergences de formats avec des qualités excessives ou au contraire dégradées, une sous-traitance excessive et une perte globale de souveraineté et d’autonomie sur ses propres données » affirme sans ambages Henri Verdier.

Les barrières sont multiples : méconnaissance des données publiques disponibles, systèmes d’information inadaptés, administrations peu favorables aux logiques de coopération et de partage des données, etc. L’Administrateur général des données en arrive à la conclusion que l’État « n’est pas encore prêt à saisir tout le potentiel [des] données ».

L’AGD ouvre les chantiers pour les mois et années à venir

Celui qui est également le nouveau numéro un de la Direction interministérielle au numérique (DINSIC) propose dès lors d’ouvrir « de premiers chantiers permettant de premières et substantielles améliorations de cette situation ».

Henri Verdier annonce tout d’abord qu’il lancera dans le courant de l’année 2016 « un projet de cartographie collaborative ouvert à toutes les administrations qui souhaiteront y participer et en bénéficier ». Ce travail de recensement ne se limitera pas aux seuls documents administratifs détenus par les acteurs publics (rapports, études...), puisqu’il vise à établir une liste complète des données disponibles dans les systèmes d’information de l’État.

Deuxièmement, la DINSIC va « intégrer la capacité à extraire et utiliser les données dans les critères d’examen des projets informatiques de l’État ». Le rapport explique qu’il s’agit de préparer « l’extractibilité » des données de l’administration « by design ». Ce vaste chantier sera mené en lien avec les projets existants, et notamment ceux liés à la stratégie dite d’État plateforme (France Connect, APIentreprises...).

rapport agd dinsic

Pour faciliter la fastidieuse suppression des informations personnelles contenues dans des données publiques (tout du moins quand cette anonymisation est possible), un pôle d’expertise sera mis en place. Il aura notamment pour mission de fournir aux administrations un « kit d’anonymisation » open source. « Ce pôle devra inclure une meilleure maîtrise des questions liées à l’anonymisation des données, non pas uniquement sous l’angle juridique, mais également sous l’angle technique (capacité d’automatiser l’anonymisation à grande échelle). Il assurerait une veille technologique sur les questions d’anonymisation relatives aux différents types de données (tables données de réseau, données géolocalisées, etc.). » L’AGD envisage d’autre part l’élaboration d’un « pack de conformité » avec la CNIL.

Écrit par Xavier Berne

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

L’AGD ouvre les chantiers pour les mois et années à venir

Commentaires (1)


Ah ! La bonne boîte est en ligne ! Hâte de voir les retours, mais en phase de test ça s’annonçait prometteur.