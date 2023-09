Le webscraping peut être utilisé pour extraire une variété d'informations, telles que des données de prix, des avis de produits, des actualités, des données météorologiques… Mais également dans le but de faire de la prospection commerciale ainsi que pour inférer ou reconstituer des données (un exemple au hasard : Boursorama). Et dans ce domaine, il est facile de friser la légalité sans jamais l’atteindre.

Si dans le cas de Boursorama les clients étaient incités à donner leur identifiant et mot de passe, la banque en ligne devait ensuite récupérer les informations directement depuis le site des impôts, il n'y a pas a priori d'API disponible.

Prospection personnelle ou professionnelle

Partons d’une anecdote personnelle. J’ai commencé à recevoir des messages à caractère professionnel sur une adresse non professionnelle m’appartenant aussi. Rien de très surprenant a priori, mais il y avait malgré tout un fait curieux : cela se répétait régulièrement. Il y avait donc quelque chose qui associait mon activité professionnelle à un mail sans lien avec celle-ci. Premier réflexe : vérifier s’il s’agissait d’un pompage éhonté et mal ficelé des données personnelles dont il me fallait trouver la provenance, et demander a minima la correction ou au mieux la suppression.

J’ai interrogé plusieurs émetteurs de ces mails en brandissant la menace du couperet des 4 % du chiffre d'affaires mondial, et tous m’ont juré mordicus avoir récupéré cette adresse en toute légalité et que c’était celle que j’utilisais comme adresse de contact professionnel. Je leur répondais que c’était faux et qu’un simple coup d’œil aurait suffi à constater que le nom de domaine associé n’était pas le bon. La structure des adresses mails pro étant souvent d’une simplicité édifiante (genre nom + prénom + nom de domaine de la boîte). Je n’ai guère insisté les premières fois, mais la répétition de ces envois me fit comprendre qu’il fallait y mettre de l’ordre avant que cela ne dégénère.

Démarrons notre (petite) enquête. Mes interlocuteurs m’ont affirmé qu’il s’agissait de mon adresse de contact sur LinkedIn. Sauf que oui mais non : après vérification, j’utilise bien la bonne adresse professionnelle sur ce réseau. Je ne suis pas encore fou : j’ai bien renseigné l’adresse correctement et je n’ai jamais indiqué l’adresse non professionnelle.