Les députés veulent que le code source et l’algorithme du successeur d’APB soient publics

Les députés veulent que le code source et l’algorithme du successeur d’APB soient publics

Le scanner de la guerre

Avatar de l'auteur
Xavier Berne

Publié dans

Droit

14/12/2017 6 minutes
20

Les députés veulent que le code source et l’algorithme du successeur d’APB soient publics

L’Assemblée nationale a adopté, mercredi 13 décembre, un amendement destiné à ce que le code source, l’algorithme et le cahier des charges de la future plateforme « Parcoursup » soient communiqués de droit aux citoyens qui en feraient la demande.

Les ratés d’Admission Post-Bac, ce programme qui décidait il y a quelques mois encore de l’affectation de centaines de milliers d’étudiants, sont plus que jamais présents dans les esprits. Certains se souviennent notamment que le ministère de l’Éducation nationale avait transmis, en octobre 2016, l’algorithme d’APB sur support papier à l’association Droits des lycéens...

Le député Cédric Villani (LREM) a ainsi profité de l’examen du projet de loi « relatif à l’orientation et à la réussite des étudiants » pour proposer d’étendre la transparence sur « Parcoursup », qui devrait remplacer APB à partir de la rentrée prochaine.

Une transparence qui relève d'une « exigence démocratique », selon le gouvernement

« Il importe que l’occasion soit saisie du remplacement d’APB pour rendre les codes sources publics, sous une forme analysable, de façon à contribuer à garantir [la] transparence des règles d’affectation des élèves, et la correspondance entre les règles affichées et le code informatique », faisait valoir le mathématicien au travers d’un amendement.

Si, depuis le vote de la loi Numérique, les « codes sources » sont officiellement reconnus comme des documents administratifs communicables de droit au citoyen, sur demande, l’élu souhaite que les pouvoirs publics aillent plus loin s’agissant de Parcoursup. À ses yeux, l’effort de transparence « doit inclure la publication du cahier des charges synthétique du traitement et celle de l’algorithme lui-même, en supplément des codes sources du logiciel ».

Chargée de se pencher sur le cas d’APB, la mission Etalab relevait en début d’année que ce dispositif était constitué d’un « système complexe, composé de plusieurs modules et interfaces ». Le tout comporte pas moins de 35 fichiers, organisés autour de deux algorithmes : l’un pour le classement, l’autre pour l’affectation.

apb etalab
Crédits : Rapport de la mission Etalab sur APB

L’amendement de Cédric Villani prévoit ainsi que devienne communicable, au titre du droit d’accès aux documents administratifs (et sous six mois après la promulgation de la loi) :

  • Le code source des traitements automatisés utilisés pour le fonctionnement de la plateforme Parcoursup
  • L’algorithme du traitement
  • Le cahier des charges du traitement, « présenté de manière synthétique »

Fait plutôt rare, cet amendement a été repris et soutenu dans l’hémicycle par le rapporteur, Gabriel Attal. « Il s’agit de fixer un cadre clair garantissant la transparence du code informatique de la nouvelle plateforme Parcoursup » a fait valoir l’intéressé. « On se souvient qu’il avait été assez difficile d’obtenir la transparence sur le code d’APB : il avait fallu un certain temps avant que les gestionnaires de la plateforme diffusent le code, et la manière dont celui-ci avait été rendu public n’avait pas été totalement satisfaisante puisqu’elle n’avait pas permis aux différents acteurs de tirer profit de cette information. »

Sur le banc du gouvernement, la ministre de l’Enseignement supérieur a émis un avis favorable, considérant que ce pas en faveur de plus de transparence relevait d’une « exigence démocratique ». Frédérique Vidal a également souligné que cet effort avait été réclamé par la Commission nationale de l’informatique et des libertés (CNIL).

Le 30 août, la gardienne des données personnelles a effectivement mis en demeure le gouvernement de proposer, sous trois mois, « une procédure effective de traitement des demandes de droit d’accès garantissant la transmission aux personnes des informations permettant de connaître et de contester la logique qui sous-tend le traitement APB ».

Nuance entre droit de communication et diffusion

Soulignons toutefois que la possibilité de demander la communication de documents administratifs ne signifie malheureusement pas toujours que les services sollicités se plient facilement aux requêtes des citoyens... Certains se souviendront probablement du combat mené par Adrien Fabre, jusque devant le tribunal administratif, pour obtenir le code source du logiciel de calcul de l’impôt sur le revenu (voir notre article).

La mission Etalab avait ainsi préconisé dans son rapport sur APB que le ministère publie de lui-même, « sans attendre une nouvelle demande de communication, le code source de la dernière version d’APB et les données non-réidentifiantes associées ». Elle plaidait dans le même temps pour une mise à disposition du fameux code source « sur un système de gestion de version décentralisé (par exemple git) au moyen d’une plateforme ouverte au public ». « La documentation existante doit être partagée », ajoutait l’institution chargée d’accompagner les administrations dans l’ouverture de leurs données publiques.

Si l’amendement adopté hier par les députés ne prévoit pas de diffusion automatique du code source, de l’algorithme et du cahier des charges de Parcoursup, la loi Numérique pourrait toutefois contraindre les pouvoirs publics à mettre directement à disposition certains de ces fichiers.

À compter du 7 octobre 2018, les administrations d’au moins 50 agents ou salariés (ce qui concerne donc a priori les ministères de l’Éducation nationale et de l’Enseignement supérieur) devront diffuser sur Internet les « règles définissant les principaux traitements algorithmiques » servant à prendre des décisions individuelles.

Autre mécanisme ouvert par la loi Numérique : si un citoyen demande puis obtient des documents liés à Parcoursup après avoir fait valoir son droit d’accès aux documents administratifs, les ministères concernés seront tenus de les mettre à la disposition de tous, sur Internet. Au nom du principe d'Open Data dit « par défaut », tout fichier communiqué individuellement par mail doit être systématiquement mis en ligne.

Seul hic, ces dispositions restent pourtant ignorées de certaines administrations (ce qui nous a récemment conduit à saisir le Conseil d’État, et même pour un cas un peu plus différent, la Commission d’accès aux documents administratifs).

20

Écrit par Xavier Berne

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Une transparence qui relève d'une « exigence démocratique », selon le gouvernement

Nuance entre droit de communication et diffusion

Le brief de ce matin n'est pas encore là

Partez acheter vos croissants
Et faites chauffer votre bouilloire,
Le brief arrive dans un instant,
Tout frais du matin, gardez espoir.

Commentaires (20)


Algorithme un mot bien étrange pour une sélection <img data-src=" />



Parcoursup est développé en interne, ou par des prestataires ?


Seul hic, ces dispositions restent pourtant ignorées de certaines administrations

(ce qui nous a récemment conduit à saisir le Conseil d’État, et même pour un cas un peu

plus différent, la Commission d’accès aux documents administratifs).



bref….y-a encore du chemin !




  • entre “ce qu’il faudrait faire”, ET “ce qui est fait…vraiment” = piou !!! <img data-src=" />


j’arrive pas avec ce nom, ça me rappelle trop ABP = Adblock Plus <img data-src=" />


pareil ! <img data-src=" />

ils auraient dû pu trouver un autre nom, non ? <img data-src=" />


Amusant de voir l’évolution du numérique en France depuis l’arrive d’un jeune président. C’est plaisant de voir enfin mon pays se tourner vers ce monde. Pourtant avec le minitel on a été le premier pays connecté, dommage que l’évolution - v1 -&gt; v2 trop longue - de “ cette boite carrée avec un écran ” n’est pas été poursuivis.

&nbsp;


Attention : entre les paroles et les actes il peut y avoir un énorme fossé.

De précédentes affaires (dont celles citées dans l’article) le prouvent.



Sans être pessimiste, j’ai peur que cela soit surtout de la communication, même si certains députés sont certainement sincères dans leur démarche (Villani ?).



Je ne comprends toujours pas qu’en 2017, presque 2018, cela ne soit pas systématique et qu’il faille déposer un amendement…

Tout code source d’une plateforme publique devrait être diffusé publiquement, sauf si cela remet en cause la sécurité nationale et/ou l’anonymat d’individus.


Il faut cesser de faire cela au cas par cas.




La Loi(*) doit poser le principe que l'on peut accéder au code source des logiciels utilisés par l'administration (dont la Justice) et que par exception (décret ?) , le code source n'est pas accessible.       






 Et même dans ce dernier cas, il pourrait être fait une distinction avec les softs de "sécurité absolue" devant rester strictement confidentiel, et les softs sensibles mais pouvant être audités (par des experts tenus à une obligation de confidentialité).     





*= les textes sur la CADA sont déjà pas loin de le permettre: (merci Marc)

https://www.nextinpact.com/news/98062-le-code-source-dun-logiciel-administration-document-communicable.htm

http://www.assemblee-nationale.fr/14/amendements/3318/CION_LOIS/CL534.asp


Je ne vois pas trop l’intérêt d’avoir le code source d’un algorithme si l’on ne dispose pas des données d’entrée, qui elle ne seront jamais rendue publiques (sauf à être anonymisées?)


C’est une bonne remarque, l’algorithme va avoir une décision qui dépend non seulement des demandes de la personne mais aussi des autres personnes en concurrence.



En plus, j’ai compris qu’il y aurait des décisions humaines qui allaient entrer dans le processus, contrairement à APB.



Mais c’est toujours bon de comprendre comment cela se passe.




la mission Etalab relevait en début d’année que ce dispositif était constitué d’un « système complexe, composé de plusieurs modules et interfaces »





Voici le code source.



select from (select from candidats order by dbms_random.value) where rownum &lt; nMaxPlaces;



De rien.


Un peu plus sérieusement, pour APB. Un des problèmes étant que certains essayaient de forcer la main en ne mettant qu’un seul choix, cela ne marche pas et se sont donc retrouvés sur le carreau.


Ayant fait partie de ceux qui se sont retrouvé sur le carreau post bac justement, j’ai dit merci à la formation professionnelle. Surtout que le bac que j’ai fait ne m’a pas intéressé au final (et je m’en suis rendu compte en terminale), merci les conseillers d’orientation…



Et avec le recul, je ne le regrette pas.


Je ne comprends pas tout.

Ayant été dans les premiers à utiliser le système APB (donc plein de bugs et moins développé), j’ai trouvé ce système génial.

Beaucoup moins de dossier a envoyé, un traitement surement plus efficace des demandes de la part des administrations (qui ne se retrouvent pas avec des tonnes de lettres), une réponse rapide et claire.

Je n’ai pas eu mon premier voeux, mais probablement le second, je n’avais plus qu’à me déplacer à mon université pour signer les papiers.



On nous avais clairement dit aussi qu’une sélection était faites en fonction des notes, des lettres de motivation et des CVs.



Bref, comme l’a dit le dév principal d’APB, le problème n’est pas la plateforme, mais les critères d’entrées à l’université et le nombre de places. Bref, si on ne change pas ça, rien ne changera….


Je suis le seul a penser a AdBlock Plus en premier a la lecture du titre ? <img data-src=" />








vincz777 a écrit :



Je ne vois pas trop l’intérêt d’avoir le code source d’un algorithme si l’on ne dispose pas des données d’entrée, qui elle ne seront jamais rendue publiques (sauf à être anonymisées?)





Si les données sont nécessairement un plus, l’étude de l’algo d’APB avait permis de trouver qu’il y avait des discriminations faites en fonction de critères qui, pour certains, n’étaient pas prévus par la réglementation (distinction sur élève en métropole ou non qui déterminée une priorité plus grande dans l’attribution, parce que je ne sais plus si celui qui était en métropole était prioritaire sur celui qui n’y était pas ou inversement).



Dans l’idéal, il faut les deux.



Si tu avais lu les commentaires…


Si je me souviens bien, les étudiants hors-metropoles étaient prioritaires sur les autres.

Après cela peut s’expliquer sur la difficulté pour trouver des études hors de la métropole, mais il faudrait que ce soit clair et acté.








TheMyst a écrit :



Si je me souviens bien, les étudiants hors-metropoles étaient prioritaires sur les autres.

Après cela peut s’expliquer sur la difficulté pour trouver des études hors de la métropole, mais il faudrait que ce soit clair et acté.





Ah mais clairement, il ne s’agissait pas pour le “développeur” d’une volonté de biaiser le système, mais simplement d’un choix dans la discrimination des paramètres (il aurait pu tout aussi bien décider d’inverser la priorité).



Ceci prouve néanmoins et comme tu l’indiques, qu’il est impératif que les critères de discrimination soient accessibles, car sans aucune volonté de fausser le système, le “développeur” va faire des arbitrages qui feront que son algo ne sera pas neutre.



Ce qui me gêne dans le tirage au sort c’est que l’exécution de l’algorithme n’est pas reproductible, pour vérifier que le résultat présenté est bien obtenu avec celui-ci. Quoi de plus facile de dissimuler des passe-droits à la discrétion du ministère dans ce système invérifiable.



“Système complexe” … 35 fichiers ! Voudrait-on nous dissuader d’y jeter un oeil ? Parce que 35 fichiers c’est franchement pas grand chose (à priori).