Au Sénat, une proposition de loi pour la transparence des « algorithmes locaux » de Parcoursup

Au Sénat, une proposition de loi pour la transparence des « algorithmes locaux » de Parcoursup

Des débats algogo

Avatar de l'auteur
Xavier Berne

Publié dans

Droit

24/07/2019 8 minutes
10

Au Sénat, une proposition de loi pour la transparence des « algorithmes locaux » de Parcoursup

Le sénateur Jacques Grosperrin, qui fut rapporteur de la loi ayant instauré Parcoursup, a annoncé la semaine dernière le dépôt d’une proposition de loi visant à assurer la transparence sur les fameux « algorithmes locaux » utilisés par certaines universités. La majorité pourrait ainsi se retrouver à nouveau face à ses contradictions.

« On ne peut plus accepter ces régimes dérogatoires », a lancé l’élu LR, mercredi 17 juillet, en commission de la culture. Un an et demi après le vote de la loi sur « l’orientation et la réussite des étudiants » (ORE), Jacques Grosperrin a présenté les conclusions d’une mission de suivi consacrée aux algorithmes utilisés dans le cadre de la plateforme Parcoursup.

Si le code source de la plateforme nationale du successeur d’Admission Post-Bac a bien été rendu public, l’année dernière (ainsi que le cahier des charges afférent), le cœur de la machine Parcoursup, lui, demeure particulièrement opaque.

« Dans la plupart des formations, chaque candidat pouvant faire jusqu'à dix vœux et vingt sous-vœux non hiérarchisés, les équipes pédagogiques ont eu recours soit à des tableurs Excel de leur facture, soit à l'outil d'aide à la décision du ministère, a rappelé Jacques Grosperrin. En 2018, un petit quart des 14 500 formations avait eu recours à cet outil, dont 56 % des licences et 47 % des instituts universitaires de technologie (IUT). »

Ces feuilles de calcul, parfois qualifiées d’algorithmes locaux, permettent aux jurys d’effectuer un pré-classement de candidatures, à partir de différents critères restant à leur discrétion (notes, type de bac, etc.). Le Conseil d’État a toutefois jugé le mois dernier que ces tableurs n’étaient pas « communicables » au public, en raison de dispositions dérogatoires à la « loi CADA » sur l’accès aux documents administratifs.

Des dispositions qui avaient été introduites à la « hussarde » par le gouvernement, lors de l’examen de la loi ORE, et que certains aimeraient bien voir disparaître.

En dépit des promesses de l'exécutif, un régime dérogatoire à la « loi CADA »

« De quoi s’agit-il exactement ? Pouvez-vous nous donner des informations complémentaires, en particulier sur la publication des algorithmes et la question de la transparence ? » avait demandé le rapporteur du projet de loi ORE, le 7 février 2018, suite à la présentation d'un amendement de dernière minute du gouvernement.

Frédérique Vidal, la ministre de l’Enseignement supérieur, s’était alors voulue des plus rassurantes : « La publication des algorithmes est inscrite dans la loi : ce n’est pas le sujet ici. Cet amendement vise simplement à permettre à un candidat d’obtenir communication, dans le cadre d’une démarche individuelle, des raisons de la décision le concernant, tout en préservant le secret des délibérations des équipes pédagogiques. »

Sans plus de débat, les sénateurs avaient fait confiance au gouvernement, en dernière ligne droite de la procédure parlementaire. Quelques jours plus tard, ces dispositions étaient définitivement votées, suite à un accord avec les députés en commission mixte paritaire.

Résultat ? Sous couvert de « garantir la nécessaire protection du secret des délibérations des équipes pédagogiques » chargées d’examiner les candidatures des étudiants, les établissements de l’enseignement supérieur ne sont pas tenus de mettre en ligne, en Open Data, les « règles » définissant les « principaux traitements algorithmiques » qu’ils utilisent dans le cadre de Parcoursup.

De la même manière, ils sont dispensés d’expliquer, en cas de demande d’un candidat, dans quelle mesure des traitements algorithmiques se sont immiscés dans son dossier (à partir de quelles données, selon quelles opérations, etc.).

Entre mea culpa et retour à la charge

« Je me souviens du soir où nous avions débattu de cette question, lors de l'examen de la loi ORE. Nous étions quelque peu démunis, faute d'avoir pu travailler suffisamment », a reconnu la semaine dernière la présidente de la commission de la culture, Catherine-Morin Desailly, évoquant « l'urgence relative » à légiférer.

Jacques Grosperrin a de son côté préféré soutenir qu’il n'était à l’époque « pas envisageable de demander aux établissements, lesquels disposaient de très peu de temps pour monter leurs commissions d'examen des vœux, de publier en ligne les critères d'examen des candidatures. Il fallait aussi leur laisser le temps nécessaire pour roder ces critères et les éprouver face à la réalité des dossiers reçus. »

« Les candidats et le public ne sont pas sans information, a au passage tenu à souligner le rapporteur de la loi ORE : on trouve sur Parcoursup les attendus de chaque formation et, à partir de la prochaine campagne, les critères généraux d'examen des candidatures. L'attendu d'une licence de droit, par exemple, consiste à « savoir mobiliser les compétences en matière d'expression écrite afin de pouvoir argumenter un raisonnement ». »

Jacques Grosperrin a malgré tout déclaré qu’après « deux campagnes plutôt réussies de Parcoursup », le temps était venu « de reposer la question de la publication de tous les critères utilisés dans l'outil d'aide à la décision ». Pour le parlementaire LR, un « retour au régime de droit commun » s’impose désormais.

« Les délibérations ne commençant qu'au moment où la commission se penche au cas par cas sur les dossiers, il n'y a pas de raison d'étendre le secret à la phase automatisée de pré-classement des dossiers », s'est notamment justifié le sénateur. Et même si la transparence risque d’encourager les « comportements stratégiques », a-t-il poursuivi, « mieux vaut faire savoir à tous les candidats sur quels critères ils seront jugés, plutôt que limiter cette information à quelques happy few bien informés ».

Le sénateur Pierre Ouzoulias a rejoint le rapporteur de la loi ORE, ajoutant : « Faute de savoir exactement comment ils seront jugés, [les futurs bacheliers] multiplient les demandes. » Pour l’élu communiste, améliorer la transparence sur les « algorithmes locaux » de Parcoursup permettra de diminuer le nombre des candidatures, « ce qui fluidifierait tout le système ».

Un texte qui sera « a priori » formellement présenté à la rentrée

En conclusion de son intervention, Jacques Grosperrin a annoncé qu’il déposerait « prochainement » une proposition de loi, destinée à supprimer les dérogations à la transparence introduites dans la loi ORE.

Le texte sera co-signé par la centriste Sophie Joissains, qui avait déjà fait adopter l’année dernière, en tant que rapporteure du projet de loi relatif au RGPD, des dispositions en ce sens (voir notre article). Le Sénat s’était toutefois confronté à la farouche opposition du gouvernement, qui avait convaincu l’Assemblée nationale de retoquer la mesure, par crainte que cela ne « fragilis[e] les délibérations des équipes pédagogiques ».

La majorité n’avait pas davantage voulu entendre parler d’un compromis, consistant à prévoir un retour au droit commun après une première année de mise en œuvre de Parcoursup.

« Il ne s'agit pas de toucher au secret des délibérations. Nous souhaitons seulement plus de transparence dans la phase de prétraitement », a martelé Pierre Ouzoulias, mercredi dernier, en appui à la proposition de loi portée par Jacques Grosperrin et Sophie Joissains. « Tout ce qui relève du jury fait partie des libertés académiques et du socle constitutionnel. Nous n'y touchons absolument pas. »

Contactée, la sénatrice Sophie Joissains nous confirme que le texte devrait être présenté « a priori » à la rentrée. « Si ça passe rapidement, il restera quelques mois aux universités pour se mettre en conformité, et pour faire en sorte que la transparence soit totale. Ce qui n'empêchera absolument pas la personnalisation des délibérations, qui, elles, resteront confidentielles. »

forteza
Paula Forteza - Crédits : Assemblée nationale

Même si l’initiative passait le cap du Sénat, resterait encore à convaincre les députés. L’année dernière, la rapporteure du projet de loi RGPD pour l’Assemblée nationale, Paula Forteza, pourtant connue pour ses positions pro-transparence, s’était rangée derrière le gouvernement.

L’élue LREM avait néanmoins laissé entendre que des « corrections à la loi » pourraient être apportées, si nécessaire, « une fois la réforme stabilisée ».

La majorité pourrait à cette occasion se voir rappeler ses promesses, à commencer par celles d’Emmanuel Macron, qui avait déclaré en mars 2018 : « L'État, pour ce qui le concerne, rendra « par défaut » public le code de tous les algorithmes qu'il serait amené à utiliser – au premier rang desquels celui de Parcoursup. »

« Je m'explique difficilement que sa parole, son engagement, particulièrement clairs, aient été si peu suivis d'effets » a encore taclé Jacques Grosperrin, la semaine dernière au Sénat.

Pour aller plus loin sur ce sujet, nous vous recommandons de précédents articles :

10

Écrit par Xavier Berne

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

En dépit des promesses de l'exécutif, un régime dérogatoire à la « loi CADA »

Entre mea culpa et retour à la charge

Un texte qui sera « a priori » formellement présenté à la rentrée

Commentaires (10)


“Ces feuilles de calcul, parfois qualifiées d’algorithmes locaux,

permettent aux jurys d’effectuer un pré-classement de candidatures, à

partir de différents critères restant à leur discrétion (notes, type de

bac, etc.)”



 Un tri sur la première colonne “NOM” par ordre alphabétique, et voila! Nous avons notre classement!


D’une manière générale, tout critère de tris devrait être publié, que le traitement soit informatique ou pas.

Par exemple, j’attend avec impatience les algorithmes locaux d’attribution des HLM. Et quand quelqu’un force une décision, cela doit être tracé et publié aussi.

Il reste donc pas mal de travail…


Est ce que l’on peut décrire aussi simplement toutes les règles dans un arbre décisionnel qui peuvent amener à un choix ?



TL<img data-src=" />R : s’il y a un humain dans la prise de décision, c’est que les règles sont trop complexe pour être formaliser. Si les règles sont formaliser, il est simple de les automatiser et l’humain n’a plus d’intérêt.



Si c’était le cas, on aurait depuis bien longtemps remplacer les humains dans de nombreux métier qui consiste à prendre de décision (je pense aux médecins ou aux juges par exemple). Bien souvent, il y aura un cas “unique” qui ne rentre pas dans les cases et qui nécessitera du coup de réinterpréter les règles de décision.

Il peut être aussi difficile de donner une valeur numérique à certains critères et souvent c’est laisser à l’appréciation de l’humain qui décide.

La nécessité d’avoir un humain dans la prise de décision aujourd’hui (en plus d’un intérêt légal) est surtout dû que justement on ne peut pas facilement écrire ces règles et dès lors qu’on les écrira, il sera facile de l’automatiser et l’humain n’aura donc plus d’intérêt.



Du coup, selon moi, ton souhaite de coucher sous forme de règles écrites les critères de tris, ça n’est pas possible.


Une formation qui traite 20 dossiers à la main ca peut se comprendre qu’elle n’ait pas d’algo.

Une autre qui prend 100 élèves sur 3000 demandes, si elle ‘pré-filtre’ 2800 avec un fichier Excel alors oui elle doit publier le fait qu’elle ne prend que les élèves de moins de 20ans habitant dans un rayon de 10km et qui ont eu au moins 14 en maths au bac. Comme ca l’année prochaine, les élèves savent dès le départ ce qu’il faut faire pour avoir une chance d’être pris (et ca fluidifie le système en diminuant les demandes ‘perdues d’avances’).


+1



Le système actuel me parait aberrant, avec les lycéens qui sont poussés à faire 10 choix SANS priorité: ils doivent se retrouver dégoutés et démotivés de faire des études faussement choisies dans un lieux faussement choisi <img data-src=" />


Finalement, le but est peut-être d’en pousser plus vers les formations professionnelles. Faire croire que tout les bacheliers ont leur place à l’Université est hypocrite.


Merci de ‘e pas déformer mes propos. Je n’ai pas écrit qu’il fallait que les décisions soit prises par des machines. Je n’ai parlé que de tris, ce qui implique des critères. Concernant les juges dans ton exemple, leur décisions sont encadrées par la loi (les critères de tris), et leurs décisions sont prises publiquement.

Dans les écoles, les tris sont hors cadres, non consultables et non contestables. Et c’est pareil dans mon exemple avec l’attribution des HLM qui a donné lieu à un procès à Paris.


Toujours concernant les écoles mais dans un cadre plus larges ils faudrait que l’éducation nationnale apprenne à rendre des comptes et justifie les choix. Le chemin sera long pour qu’ils sortent de leur autisme (oui, je généralise. Il y abien quelques teansfuges ayant connu la vraie vie avant de retourner à l’école).


Tu déformes toi aussi mon propos : ce que je te dis, c’est qu’il est difficile de décrire précisément toutes les règles qui vont amener à une décision, c’est pour ça que l’on met des humains qui sont spécialisés pour ce genre de décision qui vont apporter leur expertise et leur “feeling” pour apprécier la situation.



Si la loi était si bien décrite, on n’aurait pas besoin d’un juge, un simple gars qui exécute à la lettre un livre de règles qu’édictent la loi (façon machine de Turing) pourrait rendre un jugement. Or la loi n’est pas sans ambigüité et elle laisse une marge d’appréciation (le fameux terme “manifestement” par exemple).



Dans mon boulot, j’ai souvent ce genre de problème lorsque je dois formaliser dans un programme informatique, un système décisionnelle qui était fait jusqu’à présent à la main. Les gars qui font ça à la main, arrivent assez facilement à le faire, mais ils aimeraient bien pouvoir l’automatiser. Et même si ça parait simple, en effet, les 2-3 principales règles sont assez basiques, on arrive très vite sur des cas où on rajoute des exeptions (le fameux :“alors, oui, mais pour ce cas là, je le connais, il faut faire comme ça”), qu’il faut rajouter des règles, certain règles font appelle à une expertise personne…. A ceci on rajoute que le “feeling” du gars est une heuristique permettant de trouver une solution suffisante à un problème NP-complet.


Tu confond encore: tu associe algo et informatique. Suivre une recète de cuisine, c’est déjà suivre un algorithme. Mon propos n’est pas de se focaliser sur les moyens de réaliser un algorithme mais sur le fait que, plus il sera détaillé, moins ils y aura d’arbitraire et plus il y aura d’égalité.



Donc, à mon avis, il est utile de définir et rendre public les algorithmes permettant de prendre des décisions. Après, comme tu le dit, il y a toujours des cas tordus qui ne peuvent pas être prévus sans que cela tourne à l’usine à gaz. Dans ces cas, comme pour les jugements, il faut rendre public les noms de ceux qui sont intervenus (et pas une commission opaque), et rendre des comptes sur les éléments ayant fait basculer les choix pour permettre la contestation. C’est le seul moyen de sortir de l’arbitraire actuel qui fait la loi à l’éducation nationnale et pour tous les choix d’orientation. Cela commence dès le collège.