Le modèle de simulation Ines, de l’INSEE et la DREES, passe en open source

Le modèle de simulation Ines, de l’INSEE et la DREES, passe en open source

DREES code ?

Avatar de l'auteur
Xavier Berne

Publié dans

Internet

14/06/2016 3 minutes
18

Le modèle de simulation Ines, de l’INSEE et la DREES, passe en open source

L’INSEE et la DREES rendent public aujourd’hui le code source de leur modèle de simulation « Ines », destiné à établir des projections relatives notamment aux prélèvements sociaux et autres prestations de type RSA ou allocations familiales. L'outil n'est pas sans rappeler OpenFisca, ce logiciel développé en open source sous l'égide du SGMAP.

Après la Direction générale des finances publiques (DGFiP) et son logiciel de calcul de l’impôt sur le revenu, c’est au tour de l’Institut national de la statistique (INSEE) et de la Direction des études du ministère des Affaires sociales et de la santé (DREES) d’ouvrir un code source, correspondant au modèle de microsimulation Ines. Ce dernier a été développé conjointement par les deux institutions et se nourrit chaque année des enquêtes dites de Revenus fiscaux et sociaux.

« Grâce à la richesse de celles-ci, on dispose de centaines d’informations sur les 50 000 ménages de l’échantillon, explique la DREES, et de données précises et fiables sur leurs revenus, issues de leur déclaration fiscale. Sur cette base, le modèle simule, sur barèmes, les différentes prestations auxquelles chaque ménage a droit et les impôts et prélèvements qu’il doit acquitter. Il appréhende ainsi la diversité et la complexité des situations réelles des Français à partir d’un échantillon représentatif de la population vivant en France métropolitaine dans un logement ordinaire. »

Avec ce programme, de nombreuses possibilités s’offrent à celui qui maîtrise un minimum l’informatique : simulation de réformes en tout genre – hausse du montant du RSA, individualisation de l’impôt sur le revenu, suppression de certaines allocations familiales... – éventuellement en se basant sur une législation antérieure (de 2010 à 2014).

Une volonté d'attirer de nouveaux contributeurs

L'accès au code (en SAS) passe par une forge hébergée par l’association Adullact : « adullact.net/projects/ines-libre ». Il faut par contre créer un compte (soumis par ailleurs à validation de l’administrateur...) avant de pouvoir télécharger le fichier du modèle Ines. Nous n’avons de ce fait pas – encore – pu en profiter. L'ensemble des programmes est normalement diffusé avec la licence CeCILL V2.1 et les fichiers de paramètres avec la licence ODbL. Un guide d’utilisation est d’autre part proposé (PDF).

Pour l’INSEE et la DREES, l’ouverture du modèle Ines constitue un bon moyen « d’amplifier les échanges techniques dans la sphère de la microsimulation, à cheval entre la recherche et les administrations gérant des outils semblables (DG Trésor, Cnaf et France Stratégie) ». D’autres équipes de chercheurs pourraient s’emparer de cet outil, et proposer éventuellement des améliorations. « De plus larges utilisations du modèle Ines contribueront ainsi à en accroître la qualité et la légitimité » espère-t-on en interne.  

Pour mémoire, le projet de loi Numérique prévoit qu’à partir du 1er janvier 2017, l’INSEE ne pourra plus réclamer de redevance de réutilisation sur les données qu’elle produit (base SIRENE, etc.).

18

Écrit par Xavier Berne

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

Une volonté d'attirer de nouveaux contributeurs

Commentaires (18)


Ça peut être pratique pour faire des simulations autour du revenu de base.


Exactement. Plus on aura ce genre d’outil plus on pourra réfléchir à des modèles alternatifs et réaliser des simulation sur des hypothèses afin d’affiner des points de vues.


Pour info j’ai interpellé l’INSEE via leur compte Twitter concernant cette histoire de compte à créer… C’est vraiment étrange comme prérequis… → https://twitter.com/CyrilBrulebois/status/742771170467033092


Un programme open source qui nécessite l’accès obligatoire avec un compte validé par un admin ? Ah oui, c’est très pratique vraiment. Etait-ce si compliqué de mettre le code source sur GitHub comme l’ont fait d’autres institutions ou entreprises ?



On sent bien en filigrane que ça leur a déchiré le cul de passer le soft en open source… <img data-src=" />


Le logo d’Adullact ressemble à celui d’OpenOffice…


Un échantillon de 50000 seulement ? Ça me parait léger, comme échantillon. A l’heure du big data, on peut mieux faire, voire même sur l’ensemble des données. Et puis pourquoi “logement ordinaire” ? Exit Sarko et son hôtel particulier (en supposant qu’il n’ai qu’un logement), exit les politiques et autres profiteurs qui disposent d’un logement de fonction grand luxe aux frais de la princesse. En même temps, ils ne paye pas d’impôt, ils en profitent. Exit les riches et leurs châteaux, manoirs, domaines, méga-villas… En même temps, ils payent rien non plus.


L’ouverture de code, qu’elle soit voulue ou subie, n’est pas forcément évidente à mettre en place. Les connaissances concernant les aspects techniques et/ou communautaires ne sont pas forcément les mêmes au sein de différentes équipes, y compris au sein d’une même institution.



Je préfère attendre de voir s’il s’agit d’un choix (éventuellement stratégique/politique/whatever) de limiter l’accès à des utilisateurs enregistrés et validés manuellement, ou s’il s’agit d’une configuration par défaut qui aurait été appliquée à ce projet comme ça aurait été le cas pour un autre, avant de leur reprocher de faire de l’OpenWashing…


trouvé ici (INSEE) :



Le logement ordinaire est un logement défini par opposition à un logement en résidence offrant des

services spécifiques (résidences pour personnes âgées, pour étudiants, de tourisme, à vocation sociale, pour personnes handicapées…).


Des simulations sont déjà faites avec OpenFisca, mais je crois qu’il manque pas mal de données pour que ce soit pertinent :https://github.com/openfisca/openfisca-france-extension-revenu-de-base


Tu t’enflammes un peu vite. Déjà, fred42 t’a donné la définition du “logement ordinaire”. As tu remarqué que ta vision était aux antipodes ?



  Ensuite, les riches sont encore les principaux pourvoyeurs de l'impôt sur le revenu, par exemple : A l'échelle nationale, l'impôt acquitté par les 55 % de foyers qui ont un revenu fiscal inférieur à 30&nbsp;000 euros représente 10 % du montant total de l'impôt sur le revenu, quand les 3,12 % de plus riches (ceux à plus de 100 000 euros) en paient 40%. source Le monde   

Et pour faire honneur à Lapalice, les riches représentent 100% de ceux qui paient l'ISF.

Bref respire un grand coup.

&nbsp;

Lorsqu’on fait des stats ou de la simulation sur de grosses populations, le poids des cas particuliers sur le résultat final est négligeable.



Une base de données de qualité sur 50 000 sujets c’est déjà un bel outil. Evidemment 1 million serait mieux et 10 millions encore mieux. Le problème est de placer le curseur au bon endroit sur l’échelle qualité des données/quantité de données. On ne tire jamais rien de bon d’un gigantesque dataset sale. On peut sortir des prévisions bien plus fiables en s’appuyant sur un dataset plus petit mais propre. Obtenir un bon dataset à jour, complet et propre est un gros boulot et on ne rajoute pas des dizaines de milliers d’enregistrements de qualité d’un simple claquement de doigts.


Complément d’information posté ici →https://twitter.com/CyrilBrulebois/status/743119990040231936



En résumé : je suis très déçu des choix de gouvernance effectués.




@InseeFr répond en privé et refuse la publication de sa réponse



Et quel est le prétexte de ce refus d’une direction générale du ministère de l’Économie et des finances ?



Il me semble que toute personne recevant un courrier, message a le droit de le publier tant qu’il n’y a pas un autre droit en jeu (par exemple atteinte à la vie privée).

En tout cas, rien ne t’empêche de nous indiquer les raisons avec tes mots à toi.


C’est ce que j’ai fait dans le thread de 4 tweets sur Twitter. ;)


OK, je n’avais pas vu que c’était une raison tellement ce n’en est pas une.

On veut savoir qui accède à notre code.

Dans ce cas, autant utiliser une licence différente que CECILL équivalente à la GPL.

Cela serait moins hypocrite.


C’est non seulement hypocrite, contre-productif, mais surtout complètement idiot ! Une fois le code publié sous licence libre, je ne vois pas très bien par quel mécanisme ils espèrent contrôler qui le lit. C’est affligeant, c’est à croire qu’ils n’ont pas lu la licence.








Axonefr a écrit :



Tu t’enflammes un peu vite. Déjà, fred42 t’a donné la définition du “logement ordinaire”. As tu remarqué que ta vision était aux antipodes ?



   Ensuite, les riches sont encore les principaux pourvoyeurs de l'impôt sur le revenu, par exemple : A l'échelle nationale, l'impôt acquitté par les 55 % de foyers qui ont un revenu fiscal inférieur à 30&nbsp;000 euros représente 10 % du montant total de l'impôt sur le revenu, quand les 3,12 % de plus riches (ceux à plus de 100 000 euros) en paient 40%. source Le monde  

Et pour faire honneur à Lapalice, les riches représentent 100% de ceux qui paient l'ISF.

Bref respire un grand coup.

&nbsp;







Oui, j’avoue, je me suis enflammé comme il faut. Mais, à ma décharge, pour le

logement, je me base par défaut sur la définition de l’académie

française. Je ne savais pas que l’INSEE avait une définition propre

précise. J’espère juste que se n’est pas le cas pour la moitié des

termes usités.

Concernant les riches, je suis dans l’idée d’accord

avec chiffre que tu énonce. Le problème qui m’hérisse le poil, c’est plus ceux

qui ont un revenu de 500 000 euros et qui vont payer entre 0 et 100 euros

d’impôts sur le revenu grâce à de l’optimisation fiscale. Ou 30% (au

hasard) des riches qui ne paient pas l’ISF, alors qu’ils le devraient… Ceux-là, je ne pense pas qu’ils soient dans l’échantillon.



Vas y explique moi comment quelqu’un qui a 500 000 € de revenus ne paie pas plus de 100 € d’impôts en sachant que les niches fiscales sont plafonnées.

Pour l’ISF, tu n’as pas tord, c’est un impôt injuste qui ne touche que les petits riches, donc autant le supprimer.



Sinon, pour la définition de l’INSEE, je l’ai trouvée en suivant le lien de l’article, donc en 2 clics.