Vous n'avez pas encore de notification

Page d'accueil

Options d'affichage

Abonné

Actualités

Abonné

Des thèmes sont disponibles :

Thème de baseThème de baseThème sombreThème sombreThème yinyang clairThème yinyang clairThème yinyang sombreThème yinyang sombreThème orange mécanique clairThème orange mécanique clairThème orange mécanique sombreThème orange mécanique sombreThème rose clairThème rose clairThème rose sombreThème rose sombre

Vous n'êtes pas encore INpactien ?

Inscrivez-vous !

Le datamining, cache-misère contre la fraude fiscale

La parabole du fisc prodigue
Droit 8 min
Le datamining, cache-misère contre la fraude fiscale
Crédits : plej92/iStock

Le choix du datamining et des algorithmes implique d'amasser de plus en plus de données personnelles. Bercy promet des résultats importants dans la lutte contre la fraude fiscale. Selon un rapport de la commission des finances du Sénat, toutefois, le bilan est pour l’instant très mitigé.

À chaque fois qu’ils s’expriment sur la fraude fiscale, les ministres du Budget mettent en avant leurs résultats, forcément bons, en noyant le public sous une pluie de chiffres. En 2019, les montants recouvrés grâce au contrôle fiscal s’élevaient à 11,3 milliards d'euros. Une hausse de 30 % par rapport à 2018.

Ce chiffre de 12 milliards (Gérald Darmanin ayant ajouté les 500 millions payés par Google à ces 11,3 milliards) a été abondamment repris par la presse en début juin. Mais pour les sénateurs Claude Nougein (LR) et Thierry Carcenac (PS), qui ont conduit une mission sur ce sujet, « ces chiffres doivent être pris avec précaution, tant dans l'appréciation de leur montant que dans leur évolution sur le long-terme. »

Les données 2019 viennent juste enrayer une baisse importante depuis 2015. Pire, depuis deux ans le ministre du Budget ne met en avant que les montants encaissés et plus les droits et pénalités notifiés par le fisc. Or, entre le contrôle, la notification des droits et pénalités au contrôlé, les éventuels recours, et l’encaissement, il peut y avoir parfois des années.

Et si l'on regarde le montant des droits et pénalités notifiés (c’est-à-dire avant les éventuels recours et avant leur paiement), les résultats s’effondrent : -35 % en quatre ans. Ce chiffre médiocre était mis sous le tapis avant la publication de ce rapport parlementaire.

bercy fisc contrôle fiscal

Si les pénalités notifiées poursuivent leur baisse, les encaissements risquent de suivre dans les prochaines années. D’autant que la hausse en 2019 de ces derniers est en partie due à la nouvelle loi Essoc, qui encourage le fraudeur à régler rapidement, à l’amiable, les pénalités. Un « effet d’aubaine » qui ne se reproduira pas. Avec les crises sanitaires et économiques, les chiffres 2020 du contrôle fiscal devraient plonger.

Autre problème, le taux du recouvrement par le fisc stagne depuis plusieurs années à 68 %, même si une nouvelle procédure de « saisie administrative à tiers détenteur » suscite beaucoup d’espoirs à Bercy.

Fouiller nos données pour repérer les fraudeurs

Pour pallier ces mauvais résultats, Bercy a depuis plusieurs années une réponse magique : le datamining. Les nouvelles technologies, les échanges d’information au niveau international, l’accès de plus en plus simplifié à des bases de données, l’obligation qu’ont de nombreux professionnels de signaler toute suspicion de fraude, rendent possibles des croisements qui n’étaient pas envisageables avant.

Pour gérer ces téraoctets de données, le ministère a créé en 2013 une « mission requêtes et valorisation » (MRV), d’abord consacrée aux entreprises, élargie depuis aux particuliers.

La MRV modélise les comportements frauduleux en s'appuyant sur des exemples de fraude avérée : « le but est d'identifier, par des méthodes statistiques ou mathématiques, les critères caractérisant une personne fraudeuse afin d'établir un profil type qui sera ensuite appliqué à une population cible, pour déceler des comportements similaires. »

Une méthode apprenante, qui s’enrichit grâce à des nouvelles bases de données. La MRV déploie aussi des modèles dits « non supervisés », qui détectent des groupes de personnes au comportement atypique, susceptible d'être assimilé, après analyse, à de la fraude et fait aussi des analyses de réseaux, pour faire ressortir des entités ayant une forte proximité avec des fraudeurs.

Selon les sénateurs, les techniques d'analyse de données qu’utilise la MRV « sont sans cesse étendues. En plus du datamining et du recours à l'intelligence artificielle, la mission développe le textmining, soit le traitement de données non structurées [textes ou images]. En parallèle, une expérimentation est menée dans plusieurs départements afin de croiser les déclarations des contribuables, les vues aériennes et les plans cadastraux pour traquer les erreurs, intentionnelles ou non, de déclaration des contribuables. Pour ce faire, la DGFiP s'appuie sur un logiciel développé par la société Accenture, dont le coût est estimé à près de 20 millions d'euros. »

Cette MRV traite aujourd'hui plus de 200 téraoctets de données. Un chiffre qui ne cesse de gonfler, Bercy étant toujours vorace pour accéder à des nouvelles bases. La DGFiP a déjà accès à des données des administrations sociales, du monde foncier ou même des réseaux sociaux.

Une stratégie d’élargissement des bases rarement débattue, mis à part cet automne lors des débats parlementaires qui ont permis au fisc de pomper les données publiques mises en ligne sur Facebook et Instagram (le projet #BigBrotherBercy).

La MRV devrait compter 30 agents d’ici la fin de l’année. Une équipe sous-dimensionnée selon Vincent Drezet du syndicat Solidaires finances publiques que nous avons interrogé.

Les résultats décevants des algorithmes

Mais les résultats du datamining sont pour l’instant décevants. En 2019, 22 % des contrôles des entreprises et 11 % des contrôles particuliers trouvaient leur origine dans les algorithmes de la MRV. Un taux qui doit fortement augmenter d’ici 2022 : la moitié des contrôles devront trouver leurs sources dans les listes fournies par la MRV. Problème : si elle est à la base de 22 % des contrôles, la MRV n’était à l’origine que de 6 % des droits mis en recouvrement.

Pour les sénateurs, « en donnant la priorité à la programmation centralisée des contrôles, [Bercy] risque de remettre en cause les initiatives des brigades locales, qui connaissent bien le tissu fiscal de leur territoire. »

« Cela alimente le sentiment selon lequel le datamining, en dépit des affirmations du Gouvernement, tarde à produire ses effets et cela conduit également à s'interroger sur le ciblage des dossiers par la MRV. » En bref, l’intelligence artificielle est pour l’instant moins bonne que les humains pour cibler les entreprises à contrôler.

Parmi les raisons soulevées par les parlementaires, « les logiciels de datamining, d'intelligence artificielle et de textmining actuellement développés ont du mal à isoler et à détecter les cas de fraude complexe. »

Pour Vincent Drezet, de Solidaires finances publiques, la centralisation des contrôles se fait au détriment des contrôleurs et vérificateurs de terrain qui connaissent leurs territoires. Par ailleurs, Bercy taille depuis des années dans les effectifs, et cela va se poursuivre. Malgré les promesses de sanctuariser les personnels dédiés au contrôle, ceux-ci ont baissé de 7,8 % entre 2014 et 2018, même si cette baisse a moins affecté les emplois les plus qualifiés. Difficile de lutter contre la fraude quand, sur le terrain, le nombre d’agents diminue.

bercy contrôle fiscal

Et maintenant la fraude sociale

Parallèlement, l’Assemblée nationale conduit une commission d’enquête sur la fraude sociale, présidée par le député Patrick Hetzel (LR) et rapportée par Pascal Brindeau (UDI). Elle auditionne un à un l’ensemble des directeurs des caisses de sécurité sociale. Chacun vient souligner l’importance que prend le datamining pour lutter contre la fraude.

Parmi les plus avancées, la Caisse nationale des allocations familiales, Ainsi, Vincent Mazauric, son directeur général, a expliqué aux députés que la CNAF s’est mise au datamining en 2012. Par exemple, elle repère les déclarations trimestrielles de ressources faites depuis une adresse IP située hors de France.

En 2019, 9 000 contrôles conduits à ce titre ont permis le rappel de 55 millions d'euros d’indus, dont un peu plus de 50 % correspondaient à des situations frauduleuses. Reste que le datamining représente moins de 10 % des 324 millions d'euros fraudés repérés par la CNAF l’an dernier.

Même discours pour l’assurance-chômage. Comme l’ont expliqué des représentants de Pôle emploi à la commission d’enquête, une dizaine de personnes consacrent déjà une partie de leur activité au croisement des données et aux algorithmes.

L’organisme est encore en rodage, mais souhaite « créer des algorithmes de plus en plus puissants, qui se fondent davantage sur le comportement des personnes. La fraude n’est pas liée à des caractéristiques individuelles, mais à des comportements – la soudaine présentation d’une attestation de période de travail par un demandeur d’emploi arrivant en fin de droit, par exemple. »

Autre exemple, l’assurance maladie qui effectue des contrôles sur les prestations médicales si un médecin délivre trop de prescriptions d’un médicament ou d’arrêts maladie.

Les alertes du Défenseur des droits

Des outils algorithmiques qui engendrent pourtant des discriminations. Auditionné par la commission d’enquête, l’ancien Défenseur des droits Jacques Toubon a souligné qu’en 2014, « parmi la population contrôlée, la proportion d’allocataires percevant le RSA était de 40 % supérieure à celle de l’ensemble des allocataires de la branche "famille". Autrement dit, non seulement on vise la nationalité, mais on suspecte les plus précaires d’être les plus portés à frauder. »

Ces ciblages discriminatoires anti-étrangers et anti-pauvres, « quelle que soit la technologie employée, ne font que relayer préjugés et stéréotypes, conduisant à une surreprésentation de ces populations parmi les fraudeurs. Autrement dit, on finit par démontrer ce que l’on voulait démontrer  ! Or les réalités statistiques ne démontrent pas ces préjugés. Si l’on identifie un nombre d’indus plus élevé parmi les bénéficiaires des minimas sociaux, c’est précisément parce qu’ils font l’objet de contrôles plus nombreux. »

33 commentaires
Avatar de carbier INpactien
Avatar de carbiercarbier- 20/08/20 à 19:03:32

Cet article manque singulièrement de profondeur. Bon a bien compris que le but ultime était de flinguer le datamining mais en intro qui a décidé qu'une baisse ou une augmentation du recouvrement était une bonne ou une mauvaise nouvelle et/ou un constat d'échec ?
A montant fraudé équivalent cela se comprend, mais comme par définition ces montants ne sont pas publiques qui et comment fait-on pour estimer cette action annuellement ?

Avatar de tmtisfree Abonné
Avatar de tmtisfreetmtisfree- 20/08/20 à 20:01:34

Pas grave si la technologie de l'État utilisée comme béquille d'un système social(iste) à la dérive ne fonctionne pas : les banques vont être bientôt dans l'obligation de déclarer les locataires de coffres-forts. Le fisc n'aura plus qu'à se servir directement chez les particuliers (une fois de plus)...

Avatar de taxalot Abonné
Avatar de taxalottaxalot- 20/08/20 à 20:37:24

La question n'est pas : "Le datamining peut il améliorer le contrôle fiscal ?"

Mais "Le datamining permettra t'il de l'améliorer ?"

A termes, c'est certain. La matière s'y prête abondamment. Les outils sont en cours de création. Les vérificateurs ne font que participer a un beta test géant.

Avatar de hobhob Abonné
Avatar de hobhobhobhob- 20/08/20 à 22:59:49

Quel seum de droite en commentaire...
L'article manque de profondeur ? Le problème primaire soulevé par l'article n'est pas l'augmentation ou la baisse du recouvrement, c'est que le ministre en communiquant sur le montant encaissé se vante de sommes qui ont été obtenu par une lutte contre la fraude plus ancienne que son action. Il serait, comme le souligne l'article, plus judicieux de communiquer sur les notifications qui témoignent davantage de son activité récente (et de sa volonté de lutter contre la fraude fiscale). Mais il semble donc que ça ne soit pas bien glorieux...
Le datamining pourrait améliorer le contrôle fiscal, mais outre les problèmes d'atteinte à la vie privée, si les algorithmes de datamining sont, comme en parle l'article, biaisés et ciblent les plus précaires et les étrangers alors de la même manière que les systèmes de police prédicitves ça ne sera qu'un outil d'oppression supplémentaire plutôt que de Justice.
Merci M.Januel de cet article fort intéressant mettant en perspective les annonces du pouvoir.

Avatar de JD Abonné
Avatar de JDJD- 20/08/20 à 23:56:56

Merci pour cet article de qualité :yes:

Avatar de PJanuel Abonné
Avatar de PJanuelPJanuel- 21/08/20 à 04:50:18

taxalot a écrit :

La question n'est pas : "Le datamining peut il améliorer le contrôle fiscal ?"

Mais "Le datamining permettra t'il de l'améliorer ?"

A termes, c'est certain. La matière s'y prête abondamment. Les outils sont en cours de création. Les vérificateurs ne font que participer a un beta test géant.

C'est possible. D'ailleurs personne ne demande le démantèlement de la MRV.
Mais pour l'instant, les résultats ne sont pas là, contrairement à ce qu'annoncent les ministres dans leur communication. Mettre en avant le datamining permet de masquer le démantèlement d'autres éléments du contrôle fiscal.

Avatar de trash54 Abonné
Avatar de trash54trash54- 21/08/20 à 06:40:00

Top comme article

Mais il y a encore plein d'idées de croisement à faire
Les ventes de voiture, abonnement télé smartphone ....

Avatar de Hugues1337 INpactien
Avatar de Hugues1337Hugues1337- 21/08/20 à 08:32:14

Le datamining n'est pas magique et il faudra probablement des années avant de le maitriser pour ce cas de figure. De ce fait je ne comprends pas non plus le but de l'article.

Avatar de Minarey Abonné
Avatar de MinareyMinarey- 21/08/20 à 10:09:46

Qu'une techonologie ou un savoir faire soit survendu par une administration on a l'habitude. Mais pour qui sait faire une jointure SQL, apprendre que le "data mining" (sic) est arrivé si tard à Bercy a de quoi surprendre.

Après penser que les "zalgorithment" remplacent le travail humain est illusoir... Il faut bien du monde pour définir et affiner l'extraction des informations dans les donnés, et aussi du monde pour utiliser ces informations.

Avatar de loser Abonné
Avatar de loserloser- 21/08/20 à 10:17:02

[quote] CNAF s’est mise au datamining en 2012. Par exemple, elle repère les déclarations trimestrielles de ressources faites depuis une adresse IP située hors de France. [/quote]

c'est moi ou cet exemple n'illustre pas du tout le propos?

Il n'est plus possible de commenter cette actualité.
Page 1 / 4