Ce matin, au Journal officiel, un arrêté a donné naissance à « Orisup ». Derrière l’acronyme, se cache un « système d'information sur l'orientation dans le supérieur ». En pratique, un traitement de données à caractère personnel qui retrace tout le parcours des étudiants, avec un luxe de détails, à des fins statistiques et de recherche.
Avec « Orisup », le gouvernement veut disposer d’une vue générale sur l'ensemble du dispositif national d'orientation dans l'enseignement supérieur. L’enjeu ? Jauger son efficacité selon les populations, les filières et les types d'établissements.
À ce titre, ses informations sont accessibles à l’ensemble des agents du service statistique ministériel (exception faite des données relatives aux nom, prénoms et lieu de naissance des étudiants).
Sur demande, d’autres pourront y avoir accès, selon les mêmes finalités, tel le comité éthique et scientifique, dont l’une des missions est de remettre chaque année un rapport au Parlement portant sur le déroulement de la procédure nationale de préinscription.
S’y ajoutent, mais uniquement dans le périmètre de leurs travaux, les chercheurs sous convention, cette fois « après application d'un traitement rendant impossible l'identification directe ou indirecte des personnes concernées ».
Mais que trouve-t-on dans Orisup ? Pour le savoir, il faut se plonger dans l’annexe, longue de 170 lignes, où on comprend concrètement qu’il s’agit d’un fichier de fichiers, rassemblant donc des données issues de nombreux traitements déjà en vigueur.
Orisup = APB + Parcoursup + SIECLE + SYSCA + SCOLEGE + OCEAN + AGLAE
Les données issues de Parcoursup seront par exemple avalées : état civil, coordonnées personnelles, informations relatives aux responsables (lien de parenté, catégorie socioprofessionnelle, adresse postale), informations issues du dossier de bourse, revenu brut global, nombre de frères et sœurs à charge.
De la même source, on trouve aussi des informations sur les activités sportives et artistiques pratiquées par l’étudiant en devenir (niveau de pratique, discipline, résultat, performance, prix obtenus), son CV, ses résultats pour chaque matière, les éléments d'appréciation des professeurs, les résultats obtenus, mention comprise, le niveau de langue française, et même les données de connexion avec dates et heures, les « traces des actions sur le dossier du candidat », le média de connexion utilisé ou la distance entre le domicile et l'établissement de formation demandé.
Des données à peu près identiques sont chalutées dans Admission Post-Bac, le prédécesseur de Parcoursup, avec des adjonctions comme l’éventuelle justification de l'abandon de la procédure par le candidat.
D’autres fichiers servent de vivier, comme le « Système d’information sur le suivi des étudiants » (nationalité de l'étudiant, profession et catégorie socioprofessionnelle de ses parents, commune, département et pays de résidence de l'étudiant, etc.), les traitements SIECLE, SYSCA, SCOLEGE, outre SIFA (pour les apprentis) et OCEAN.
Ce dernier est relatif à la gestion des examens et concours scolaires. Il intègre les avis portés au titre de la scolarité antérieure (livret scolaire, diplôme antérieur, demande de validation des acquis, série du baccalauréat obtenus). Enfin, AGLAE (pour « automatisation de la gestion du logement et de l’aide à l’étudiant ») délivrera l’ensemble des informations issues du CROUS avec une typologie détaillée des aides financières (décision et montant attribué).
Des données conservées durant 15 ans
Les données sont conservées en principe durant 15 ans, sauf les nom et prénoms qui resteront stockés deux ans, avant archivage. Juridiquement, le traitement s’appuie non sur le consentement des personnes concernées, mais sur les nécessités liées à l'exécution d'une mission d'intérêt public (article 6 1 e) du RGPD).
Il n’est évidemment guère exceptionnel pour une administration en quête de modernité de disposer d’outils statistiques. L’intérêt de cet arrêté est surtout de révéler en une seule base la masse d’informations prélevées tout au long du parcours des étudiants.
Commentaires (31)
#1
Si le but du fichier est uniquement de faire des statistiques, tout doit être anonymisé, sinon ça devient horiblesup !
#2
Attention, ces données seront mises en Open Bar pour la police, le renseignement et tout le reste de l’exécutif dans 3… 2… 1…
#3
Tu oublies les GAFAM,les démarcheurs téléphoniques et les réseaux de spambots.
#4
#5
Si c’est à but statistique, en quoi le nom ou l’adresse postale sont des données pertinentes ?
#6
#7
Depuis quand le gouvernement français a-t-il besoin de s’occuper de son efficacité ? " />
Au pays des licornes tricolores et des Cerfas en quadruple exemplaires la perfection de l’action publique politicotechnicoadministrative est légendaire. La preuve ? La dette, le chômage et tous ces maux qui frappent les tribus libres au alentours sont sous contrôle chez nous, et le bon peuple satisfait procède gaiement à la réélection de leaders étatistes énarchiques avec une récurrence qui frise l’insouciance et l’indolence du drogué commodément assisté.
#8
Toi tu as encore trop forcé sur le bourbon et tes bouquins de Adam Smith à Noel. On dirait le tonton bourré à noel qui crache ses poncifs
#9
#10
#11
Merci d’avoir signalé ton conflit d’intérêt.
Tous le monde est lon d’avoir cet honnêteté.
#12
#13
Le code postal c’est quand même pas très précis.
Si tu prends rien qu’une ville pas immense comme Evreux, deux exemples, c’est un peu 2 salles, 2 ambiances et des réalités statistiques qui doivent varier d’un lieu à l’autre :
https://www.google.fr/maps/@49.0087705,1.1628689,3a,60y,103.08h,91.21t/data=!3m6!1e1!3m4!1sjnfaAyPdq9Zufjm5cOStZA!2e0!7i16384!8i8192?hl=fr
https://www.google.fr/maps/@49.0221806,1.1458724,3a,75y,178.05h,92.37t/data=!3m6!1e1!3m4!1sFvKzTpSVczYSgM_C8euDAg!2e0!7i16384!8i8192?hl=fr
#14
#15
#16
#17
Quelles qualifications te permettent d’infirmer ce que te dit quelqu’un qui est du métier ?
#18
#19
Si certains sont curieux de voir les procédures pour accéder à des données similaires, voici le site qui détail la procédure :
https://www.comite-du-secret.fr/
Puis ensuite le site du fournisseur d’accès aux données : https://www.casd.eu/
La procédure générale consiste à :
Bref, de la paperasse, beaucoup, mais des données de très bonne qualité qui permettent de faire avancer la recherche plutôt qu’elles soient uniquement disponibles dans les services qui les produisent.
#20
#21
Merci pour ces explications sur l’accès nominal à ces données.
Cette présentation me semble très progressiste et pourrait occulter les risques de dérives d’une telle accumulation de données, mais il me paraît normal qu’un chercheur ait une vision progressiste.
#22
Ah, ça sent le vécu !
#23
Argument d’autorité (= nul).
Sa réponse est convenable parce que le commentaire auquel il répond indique une échelle « géographique », ce qui est assez vague éviter tout reproche : comme il est difficile de faire plus précis qu’une adresse, et à moins de vouloir étudier des inégalités maison par maison ou individu par individu, ce dont tout le monde se fiche puisque qu’elles sont fort heureusement là pour rester, cette précision « géographique » est largement superflue. Au mieux, la demande d’une telle précision indique que la question est mal posée.
Voire même contre-productive : par ex. le cas d’une étude où ce degré de précision a été utilisé pour raffiner artificiellement un modèle de corrélations et donc augmenter son impact potentiel, alors même que les données sous-jacentes étaient inadaptées (ce qui était reconnu par les auteurs dans un autre de leur papier !), pour évaluer un supposé « problème sanitaire » de pollution. Résultat : des conclusions injustifiables (= erronées) mais largement utilisées politiquement parce qu’allant dans le « bon sens ».
#24
Merci pour ce commentaire constructif et intéressant. Ça change des commentaires limite complotiste qu’on trouve malheureusment trop souvent ici-même…
#25
Tu prend un cas spécifique pour faire des conclusions générales, j’ai connu mieux comme démarche scientifique.
Je ne sais pas ce qui se fait dans toutes les disciplines alors je ne me prononcerais pas dessus, mais pour évaluer la formation il me semble qu’il s’agit plus du travail des économistes. L’aspect spatial de l’analyse empirique en économie est quelque chose que je fais beaucoup, c’est pourquoi je me suis prononcé sur le sujet.
Quand on s’intéresse au cas de l’adresse il y a deux manières de voir les choses : est-ce utile pour l’analyse et est-ce-que cette précision nuit d’avantage qu’une information à la commune par exemple.
Pour l’utilité de cette information dans l’analyse économique, le cadre d’analyse est celui de l’économie urbaine. On s’intéresse ici à l’accessibilité des étudiants à l’université et potentiellement à leurs résultats. Le temps de trajet pour se rendre à l’université aura donc un intérêt notable dans l’analyse. Une mesure d’accessibilité aura pour objectif d’être la plus précise possible (temps de trajets ou distance à un point d’intérêt).
Bien sur il y a des cas où l’adresse n’a que peu d’intérêt, lorsqu’on cherche à étudier ce qu’on appelle les économies d’agglomération alors la zone d’emploi est l’échelle la plus pertinente.
Mais le choix de l’échelle géographique va dépendre de chaque étude, et pour le cas de l’accès à l’université et des résultats, l’adresse apporte un réel plus dans la précision de l’analyse.
Pour ce qui est du “risque” d’avoir l’adresse au lieu de la commune, il faut savoir que dans les deux cas les données seront considérées comme identifiables, donc protégées de la même manière. Une information sur la commune avec les autres informations sur un individus permettront souvent de retrouver l’identité d’un individu (d’où le fait que les données dites identifiables soient sous secret statistique). La plupart du temps en France on considère une donnée non identifiable lorsque l’échelle géographique n’est pas plus précise que la région.
#26
L’exemple était une simple illustration que la précision n’est pas nécessairement un gage de qualité, rien de plus. Je conçois et conviens qu’elle puisse avoir son utilité si tant est que le problème ait un intérêt, soit correctement posé et bénéficie d’une méthodologie adéquate.
Ici, on a plus affaire à du travail de sociologie mineur et anecdotique que d’économie (mais les économistes ont tendance à s’infiltrer partout où on ne les attend pas, et pour ma part vu l’état de la sociologie, c’est pour le meilleur) : les « résultats » étant majoritairement du ressort des compétences individuelles, pourquoi étudier l’accessibilité relativement à ce critère a un quelconque intérêt qui requiert une telle précision m’échappe. Mais je ne suis pas économiste ;)
#27
#28
#29
Le savoir, la compétence, la qualité de la recherche ou des idées etc. ne se mesurent pas qu’à l’aune des diplômes, fort heureusement.
Sinon, pourquoi qualifier de « fumeuses » des théories alors que tu n’es pas toi-même économiste (et donc, selon ta position, incompétent pour les juger) ?
Il est vrai que la cohérence et l’honnêteté intellectuelles ne sont que peu de choses quand on peut sans effort succomber à ses biais (ou aux sophismes comme le n° 42) …
#30
" />
#31