Alliance publicitaire Gravity : la collecte des données commence, pas l'opt-out

Alliance publicitaire Gravity : la collecte des données commence, pas l’opt-out

La CNIL (en) veille

Avatar de l'auteur
David Legrand

Publié dans

Internet

05/07/2017 10 minutes
50

Alliance publicitaire Gravity : la collecte des données commence, pas l'opt-out

À peine l'Alliance Gravity a-t-elle été annoncée, que certains de ses membres ont mis en place le dispositif de collecte de données, sans méthode de refus pour les internautes. Pendant ce temps, la CNIL continue d'attendre ePrivacy...

Hier, un projet en préparation depuis quelques mois était annoncé : Alliance Gravity. Derrière ce nom aux accents spatiaux se cache en réalité un groupement d'éditeurs qui s'inquiètent du poids que prennent les GAFAM sur le marché publicitaire. Leur constat est simple : cette position s'explique par la quantité de données collectées à travers leurs différents services.

S'ils veulent s'imposer et assurer un modèle économique pour leurs titres, ils doivent faire de même. Une vision des choses sans doute assez partielle (ou partiale), mais qui est une tendance lourde du secteur où de tels regroupements vont devenir la norme. Des revendeurs et l'opérateur SFR rejoignent d'ailleurs le projet. Le Figaro et Le Monde devraient de leur côté annoncer leur propre initiative dès demain. L'unification à la française gardera donc un petit goût de « chacun pour soi ».

Le tout se passe sur fond d'arrivée du RGPD et d'ePrivacy, qui doivent encadrer la collecte et l'utilisation des données à partir de mai 2018 en Europe. On notera d'ailleurs que ceux qui participent à l'aventure sont souvent ceux qui sont les plus opposés au renforcement des obligations en la matière.

La trop longue hésitation de la CNIL

De fait, les éditeurs profitent d'une faille laissée béante par la CNIL (qui n'a pour le moment pas répondu à nos questions). La commission a en effet, après des années de bataille et de discussions sur la question des cookies et des traceurs, décidé de s'intéresser au marché publicitaire l'année dernière. Le tout pour nous annoncer en mai qu'elle avait mis en pause ses enquêtes dans l'attente des nouveaux textes européens, tout en promettant d'agir une fois que tout sera en place (sans doute avec de nouveaux délais).

Ainsi, cela fait des années que les éditeurs et leurs prestataires collectent et exploitent des données sans réel consentement des internautes, à coup de centaines de trackers par page. Et surtout, sans moyen concret de s'y opposer si ce n'est en bloquant les cookies tiers et en utilisant des extensions spécifiques.

Opt-out Google

Dans le même temps, les GAFAM tant décriés mettaient en place des solution d'opt-out unifiées. Bien entendu, tout n'est pas parfait. Le cas de solutions omniprésentes telles que Google Analytics ou le recoupement massif des données à travers différents services continue de poser question.

Mais au final il est plus simple de s'opposer au ciblage publicitaire via ces géants américains que via la multitude d'acteurs du marché français. Récemment, Apple a indiqué commencer à travailler sur une solution d'isolation des traceurs afin de limiter la collecte par différents domaines. Une version plus évoluée d'une initiative précédente de l'EFF : Privacy Badger

Les plus taquins noteront que tous les membres annoncés de Gravity utilisent des trackers des GAFAM et leur livrent donc déjà leurs données d'une manière ou d'une autre. Une autre façon de les centraliser, sans doute.

Alliance Gravity : l'unification des scripts

Mais de tout cela, il n'a pas vraiment été question lors de la conférence d'hier qui a surtout été l'occasion d'évoquer les objectifs et le calendrier. La plateforme d'achat sera lancée à la rentrée et pleinement opérationnelle en novembre. Elle doit permettre de toucher 44% des internautes français et de récolter 10 milliards de données par mois. Une première étape avant des objectifs plus ambitieux sur le long terme.

Impossible d'en savoir plus sur la question de la protection de la vie privée, qui n'a semble-t-il pas vraiment été évoquée... si ce n'est pour dire que l'alliance attend les prochains développements à Bruxelles (en espérant sans doute peser sur les débats en cours). Aucun site ne permet d'en savoir plus pour le moment. De notre côté, nous avons surtout pu confirmer que c'est la plateforme Mediarithmics qui est au cœur technique du système.

Ainsi, les différents éditeurs et partenaires doivent, dans les prochaines semaines, intégrer un nouveau script qui viendra progressivement remplacer une bonne partie de ceux en place. Les régies, elles, resteront séparées. Une manière de limiter le nombre de trackers tout en permettant des recoupements socio-démographiques qui pourront être enrichis par les données plus précises telles que celles d'un revendeur comme Darty-Fnac ou d'un opérateur comme SFR.

Les nouveaux acteurs du marché publicitaire

Car c'est aussi cela qui se joue dans ce projet : la mutation de certains acteurs qui voient leur avenir dans le marché publicitaire. Dans le cas de SFR, cela rejoint la stratégie de convergence du groupe Altice, qui a déjà placé quelques pions sur d'autres terrains à travers le rachat de Teads ou son implication sur la question de la publicité adressée en TV.

Pour les revendeurs, la publicité est une manière de se positionner comme un acteur central, qui connait énormément de choses sur ses utilisateurs et de manière assez fiable : habitudes de consommation, données géographiques, centre d'intérêts. Le tout est d'ailleurs largement inspiré de ce que propose Amazon ou de mutations en cours dans la grande distribution où la collecte massive de données est aussi vieille que la pratique des cartes de fidélité.

Libération active sa collecte, sans opt-out

Par curiosité, nous avons commencé à analyser les pages des partenaires de l'Alliance Gravity. Pour le moment, aucun ne semble intégrer de référence au projet ou à Mediarithmics, à l'exception d'un : Libération.

Le site de presse a en effet ajouté un bout de code en JavaScript sur ses pages afin d'envoyer des données à la plateforme. Dans les éléments visibles, on retrouve une mention du domaine de la page, de son titre, de ses mots clefs, de la section du site concerné, etc. Impossible de connaître l'ensemble de ce qui est envoyé sans une analyse plus fine. 

Alliance Gravity Script Libération

La page dédiée à la question de la vie privée du site ne nous en apprendra pas beaucoup plus. Contrairement à ce que demande la CNIL, il n'est en effet pas fait mention de Gravity, de Mediarithmics ou même de tout autre prestataire. Il est simplement recommandé de gérer la question via les paramètres des cookies du navigateur (qui ne sont pourtant pas le seul point de stockage de données par les trackers).

Aucun dispositif d'opposition n'est présent, mais nul doute que les différentes extensions de blocage ne tarderont pas à intégrer le domaine de Mediarithmics et autres scripts faisant référence à Gravity. Ainsi, le petit jeu du chat et de la souris ne fait que commencer pour le projet et ses membres. 

Un éditeur de presse n'est pas un réseau social (et inversement)

Au final, c'est une autre question qui semble se poser au secteur : celui de son modèle économique. En effet, les éditeurs opposent souvent aux défenseurs de la vie privée que renforcer le besoin d'un consentement explicite et spécifique à la publicité renforce les GAFAM. Ces derniers disposent d'un avantage de poids : les utilisateurs sont connectés à leur service, impliquant de fait un suivi fin de leur activité. 

Un tel argument oublie pourtant deux points essentiels : il appartient aux éditeurs de limiter l'accès à leurs contenus aux seuls lecteurs connectés. C'est notamment ce qui se passe de manière croissante pour les services de replay, de TF1 à M6 en passant par France Télévisions, dont le discours est assez clair sur la question :

France Télévisions Ciblage Login

De plus, l'activité principale d'un éditeur de presse est de proposer au public un contenu d'information, traité et hiérarchisé par une rédaction, et éventuellement des services tiers.

Ce modèle repose dans de nombreux médias (au moins en partie) sur une offre publicitaire, celle-ci ne nécessitant pas forcément une collecte massive de données. Son efficacité repose par contre le plus souvent sur la capacité à fédérer des audiences énormes, ce qui ne s'accomplit pas toujours par des pratiques (éditoriales) très avouables. 

De quoi se demander pourquoi la réflexion actuelle autour des modèles de financement de la majorité de la presse en ligne tourne presque uniquement autour de la collecte et de l'exploitation de données. Car après tout, cela n'a rien à voir avec le but d'un réseau social, qui est clair : vous permettre d'accéder gratuitement à un service de partage et de communication que vous allez alimenter vous-même avec vos données.

Ainsi, ces réseaux sociaux récupèrent assez facilement des informations personnelles, vos publications quotidiennes, les pages suivies, etc. De quoi vous afficher des contenus qui peuvent vous plaire, mais aussi des publicités ciblées. Un fonctionnement auquel on peut être opposé, et que la loi doit encadrer, mais qui répond à une certaine logique.

La presse face à la pauvreté de ses données et à ses responsabilités

Or, vous n'avez pas à alimenter le site d'un journal pour en profiter. C'est d'ailleurs même plutôt l'inverse. Et c'est tout le problème des éditeurs de presse en ligne qui disposent d'assez peu d'informations sur ses lecteurs, si ce n'est leurs centres d'intérêts et autres dérivés comme leur éventuelle position politique, ce qui peut être une information assez sensible. On imagine donc qu'elle ne devrait pas être collectée et stockée sans consentement de la personne concernée.

Il faut aussi voir comment elles sont récoltées et générées. Car il est facile pour un réseau social qui connait votre date de naissance de connaître votre âge. Moins pour un média qui devra se baser sur vos lectures. Même agrégées et suivies à travers un dispositif unique, il n'est ainsi pas assuré que toutes ces informations soient fiables, une problématique largement évoquée ces derniers mois lors de rencontres auxquelles nous avons pu participer.

Gravity Brochette
De gauche à droite : Olivier Gerolami (Groupe Sud Ouest), Michel Paulin (SFR), Alain Weill (NextRadioTV), Arnaud de Contades (Groupe Marie-Claire), Xavier Romatet (Condé Nast), Rolf Heinz (Prisma Média), Francis Morel (Groupe Les Échos), Marie-Odile Amaury (L'Équipe), Christophe Pingard (SoLocal Group), Nicolas de Tavernost (M6 Group), Denis Olivennes (Lagardère Active), Jean-Nicolas Baylet (Groupe La Dépêche).

Bien qu'enrichies et fédérées, les données d'Alliance Gravity devront donc être certifiées par des tiers de confiance (c'est prévu) et convaincre des annonceurs qui sont de plus en plus méfiants face aux promesses de la publicité en ligne. Outre les questions réglementaires qui ne manqueront pas de se poser d'ici mai 2018, c'est surtout sur ce terrain que le résultat devra être à la hauteur des annonces pour que le projet soit un succès.

À moins que d'ici là, les éditeurs de presse ne se rendent compte qu'il leur est possible d'informer leurs lecteurs, sans organiser une collecte massive de leurs données. Et que la montée en puissance de la réglementation en la matière est avant tout une chance de se démarquer de ceux qui ne l'ont pas encore compris.

Écrit par David Legrand

Tiens, en parlant de ça :

Sommaire de l'article

Introduction

La trop longue hésitation de la CNIL

Alliance Gravity : l'unification des scripts

Les nouveaux acteurs du marché publicitaire

Libération active sa collecte, sans opt-out

Un éditeur de presse n'est pas un réseau social (et inversement)

La presse face à la pauvreté de ses données et à ses responsabilités

Fermer

Commentaires (50)


Quel manque d’originalité dans tous ces logos…


Prix du Net s’appuyant sur M6, est-ce qu’ils récoltes des données?








France.tv a écrit :



Dans un contexte publicitaire premium, les nouveaux formats natifs intégrés permettent un discours digital qualitatif et sur-mesure, respectueux de l’expérience utilisateur et donc plus impactants.





je me suis un peu vomi dans la bouche en lisant ça <img data-src=" />

(En se faisant l’avocat du diable… bon ok, c’est de la com à destination d’utilisateurs de ce domaine mais bon sang !)



Lu pub c’est bon, bourrez-vous mangez en. <img data-src=" />


C’est fou la pub. C’est de pire en pire.



Il y a quelques années, j’étais anti-Adblock. Plutôt du côté des gens qui disaient que c’était une manière de payer le contenu : si un site affichait trop de pub bah, il suffisait de ne pas le visiter.



Maintenant je n’en peut plus, vraiment, j’en fais une overdose, le vrai contenu gratuit (financé par la pub) a de toutes façons disparu et on se retrouve inondé comme jamais de publicité de plus en plus en plus insidieuse, de contenu de moins en moins qualitatif et de plus en plus tape à l’oeil (et le clickbait marche chez tout le monde, même chez moi). Chaque titre, chaque lien a été pensé et conçu pour qu’on clique dessus.



Maintenant c’est sans moi, j’utilise mon porte monnaie pour ce qui me plait, et je bloque tout le reste, ça devient vraiment trop insidieux, planqué et nuisible à l’intellect, parce que la publicité devient bien trop intelligente, plus intelligente que moi.



Merci NXI de nous en avoir délivré tout en continuant votre super travail.


+1

Ce ramassi d’anglisme est vraiment horrible à lire. Mes yeux yeux saignent grâce à france.tv

T_T



  • 1 !!



    Je n’ai rien à ajouter.


C’est très bien leur truc de tout unifier. Ca nous simplifiera les dev des règles des bloqueurs de pubs et des anti tracker <img data-src=" />



pour le reste, boarf, ils sont toujours dans les vieux modèles sur la pub intrusive. Donc bon, on bloque les pub et pis c’est tout <img data-src=" />


Avec toute cette gravité, j’espère qu’ils vont pas nous pondre un trou noire.<img data-src=" />


Non


“il est facile pour un réseau social qui connait votre date de naissance de connaître votre âge”



sérieux, c’est si facile que ça ???

naaan, franchement je ne vois pas comment !!! <img data-src=" />


Le silence de la CNIL est assez dérangeant dans cette affaire.


uBlock avec les bons filtres, un petit privacy badger, &nbsp;ça leur fait les pieds.








boogieplayer a écrit :



C’est très bien leur truc de tout unifier. Ca nous simplifiera les dev des règles des bloqueurs de pubs et des anti tracker <img data-src=" />





C’est exactement ce que j’ai pensé lol



Raclures INc.


Ce qu’il faudrait c’est un bot qui leur envoie à chaque seconde de navigation sur Internet une demande de suppression des données personnelles. <img data-src=" />


Le script de Libé est servi depuis static.mediarithmics.com si j’en crois uMatrix. Il est appelé en inline dans les pages d’articles



Donc, vous pouvez légitimement bloquer toutes crasses provenant de ce domaine (via uMatrix, via un uBlock, via résolveur DNS menteur. Meurs saleté, meurs ! <img data-src=" />)


Belle photo de violeurs de vie privée, et d’opposants aux droits de l’Homme <img data-src=" />


En regardant la portion de code js, je me pose la question suivante : existe-t-il une extension FFox qui permettrait de “sélectionner” des portions de code source des pages web pour les blacklister ? J’entends par là les actions suivantes :

-pour du html/css : ne pas les afficher

-pour du js : ne pas l’interpréter (il sera téléchargé mais pas exécuté)

-tout en memorisant d’une manière globale les éléments blacklistés pour que ça soit effectué sur n’importe quelle page web indépendamment du domaine.



En gros, une sorte de filtre entre le telechargement http/s et l’interprétation par le moteur du navigateur.








John Shaft a écrit :



[…] static.mediarithmics.com […] bloquer toutes crasses provenant de ce domaine […]





<img data-src=" />



Après vérif, uBlock le bloque déjà. Donc normalement, l’utilisateur un peu concerné devrait être un minimum couvert :)


Tu sais depuis quelle liste ?&nbsp;


EasyPrivacy <img data-src=" />


Merci pour l’info ! <img data-src=" />


Précisions : c’est une liste activée par défaut dans uBlock <img data-src=" />


Perso je boycotte au max tout ce qui vient de cete liste de rapaces. Je ne “consomme” que du medium indépendant : NXi, le Canard, le Monde diplo, frustrations (et Mediapart + @si mais j’ai arrêté).



Et avec le max d’extensions pour qu’ils collectent le moins possible (je suis souvent en navigation privée d’ailleurs).





L’unification à la française gardera donc un petit goût de « chacun pour soi ».





Et tous par terre <img data-src=" />


Je suis très surpris des mots en anglais utilisés par francetv sur leur application.

C’est horrible, et désespérant.&nbsp;


ca me rapelle un coktail chez une profession plutot culturelle (a paris), ou dès mon arrivée j’ai entendu dire mais tous le monde parle anglais.



c’est idiot je trouve, sachant que certain ne savent même pas lire le francais.








WereWindle a écrit :



je me suis un peu vomi dans la bouche en lisant ça <img data-src=" />

(En se faisant l’avocat du diable… bon ok, c’est de la com à destination d’utilisateurs de ce domaine mais bon sang !)









Soriatane a écrit :



+1

Ce ramassi d’anglisme est vraiment horrible à lire. Mes yeux yeux saignent grâce à france.tv

T_T





+10000 <img data-src=" />



C’est du Jean-Claude Van Damme dans le texte <img data-src=" />


Dans l’état actuel de la loi (je connais pas assez), le fait de ne pas avoir d’opt out est légal ?


Dans l’état actuel de la loi, la majorité des sites n’a pas une pratique légale <img data-src=" />&nbsp;








boogieplayer a écrit :



C’est très bien leur truc de tout unifier. Ca nous simplifiera les dev des règles des bloqueurs de pubs et des anti tracker <img data-src=" />



pour le reste, boarf, ils sont toujours dans les vieux modèles sur la pub intrusive. Donc bon, on bloque les pub et pis c’est tout <img data-src=" />





+1 Il manque en effet dans la news à savoir si les noms de domain de ce service ont bien été intégrés dans les différents bloqueurs de publicité!



Et dans 6 mois on reverra tous ces éditeurs se plaindre de l’augmentation du taux d’utilisation de bloqueurs de publicité!









Crowned-Clown a écrit :



Je suis très surpris des mots en anglais utilisés par francetv sur leur application.

C’est horrible, et désespérant.&nbsp;





Je te renvoie au dernier livre de Régis Debray “Civilisation: comment nous sommes devenus Américains”, ou à défaut aux interviews récentes qu’il a données suite à la sortie de ce livre (disponibles sur Youtube).









Soriatane a écrit :



+1

Ce ramassi d’anglisme est vraiment horrible à lire. Mes yeux yeux saignent grâce à france.tv

T_T





T’as bien payé ta redevance j’espère ?<img data-src=" />









John Shaft a écrit :



Le script de Libé est servi depuis static.mediarithmics.com si j’en crois uMatrix. Il est appelé en inline dans les pages d’articles



Donc, vous pouvez légitimement bloquer toutes crasses provenant de ce domaine (via uMatrix, via un uBlock, via résolveur DNS menteur. Meurs saleté, meurs ! <img data-src=" />)





uBlockOrigin me donne ça:



liberation.fr

www.liberation.fr

ads-twitter.com

static.ads-twitter.com

adspirit.de

maetva.adspirit.de

chartbeat.com

static.chartbeat.com

dhpikd1t89arn.cloudfront.net

facebook.net

connect.facebook.net

google-analytics.com

www.google-analytics.com

googleadservices.com

www.googleadservices.com

lemde.fr

img.lemde.fr

libe.com

md0.libe.com

md1.libe.com

s1.libe.com

mediarithmics.com

static.mediarithmics.com

nuggad.net

asqliberation.nuggad.net

outbrain.com

widgets.outbrain.com

quantserve.com

pixel.quantserve.com

quantum-advertising.com

wrappercdn.quantum-advertising.com

smartadserver.com

www6.smartadserver.com

twimg.com

pbs.twimg.com

twitter.com

platform.twitter.com

weborama.fr

cstatic.weborama.fr

xiti.com

logliberation.xiti.com



Bloqué par défaut chez moi.<img data-src=" />









Nozalys a écrit :



En regardant la portion de code js, je me pose la question suivante : existe-t-il une extension FFox qui permettrait de “sélectionner” des portions de code source des pages web pour les blacklister ? J’entends par là les actions suivantes :

-pour du html/css : ne pas les afficher

-pour du js : ne pas l’interpréter (il sera téléchargé mais pas exécuté)

-tout en memorisant d’une manière globale les éléments blacklistés pour que ça soit effectué sur n’importe quelle page web indépendamment du domaine.



En gros, une sorte de filtre entre le telechargement http/s et l’interprétation par le moteur du navigateur.





uBlockO te permet de faire tout ça avec les réglages qu’il faut, mais c’est contraignant. Sinon, t’as uMatrix, mais c’est encore plus velu.

Petite précision qui a quand même son importance, si tu veux bloquer le HTML et le CSS, tu vas te retrouver avec une page blanche. <img data-src=" />



L’extrait de la planche de franceTV est splendide ! Quelle honte sur la forme et le fond !


J’utilise uBlockO. on peut en effet sélectionner des portions de page web (les div, tables, etc.) mais on ne peut pas sélectionner des blocs dans la source de la page, ni les balises . Au passage il faudrait un chouilla d’intelligence pour “analyser” et “différencier” les différents blocs javascript.



Je ne connais pas uMatrix, mais j’y vais de ce pas. Aucun problème pour mettre les mains dans le cambouis, de toute évidence, pour se prémunir de ces intrusions, il faut être de plus en plus calé…


Bienvenue dans le monde de la pub <img data-src=" />


Oui, j’écoute beaucoup la radio.


C’est à peut près ce que me donne uMatrix :)



J’aime bien les domaines types “pixel.quantserve.com” qui doivent, vu le nom, récupérer un pixel espion <img data-src=" />








Nozalys a écrit :



J’utilise uBlockO. on peut en effet sélectionner des portions de page web (les div, tables, etc.) mais on ne peut pas sélectionner des blocs dans la source de la page, ni les balises . Au passage il faudrait un chouilla d’intelligence pour “analyser” et “différencier” les différents blocs javascript.



Je ne connais pas uMatrix, mais j’y vais de ce pas. Aucun problème pour mettre les mains dans le cambouis, de toute évidence, pour se prémunir de ces intrusions, il faut être de plus en plus calé…





Ha ok. J’avais pas compris ça comme ça. En gros, tu veux supprimer uniquement une partie du HTML de la source ?

Là je sais pas si c’est possible.









vincz777 a écrit :



Je te renvoie au dernier livre de Régis Debray “Civilisation: comment nous sommes devenus Américains”, ou à défaut aux interviews récentes qu’il a données suite à la sortie de ce livre (disponibles sur Youtube).





l’ironie est mordante <img data-src=" />

(même si je me doute bien que ce n’est ni lui, ni les auteurs des entrevues qui les y ont mises)



Tu peux techniquement injecter ton js à toi, et tu peux flinguer les autres js avec ton js, éditer des morceaux de pages en temps réel etc.








Ricard a écrit :



En gros, tu veux supprimer uniquement une partie du HTML de la source ?





Exactement, et en interceptant ledit HTML avant qu’il ne soit interprété par le navigateur (sinon c’est inutile).







Zulgrib a écrit :



Tu peux techniquement injecter ton js à toi, et tu peux flinguer les autres js avec ton js, éditer des morceaux de pages en temps réel etc.





Corrige-moi si je me trompe, mais en faisant cela, ça implique que le navigateur ait déjà chargé le HTML avant d’y rajouter le script user non ? Donc les scripts gênant et voleurs de données personnelles, ils auront déjà été exécutés ?



Tu peux déjà avec uBlockO bloquer les scripts embarqués/domaine de la page/tierce partie pour le site ou global (visible en mode expert)

Si après c’est un script en particulier particulier, il faut l’isoler dans le journal des requêtes et créer manuellement sa règle dans “mon filtrage dynamique” et bloquer son domaine en “règle permanente”.


Si ton JS a été chargé avant non, tu peux enlever les autres avant ou refuser l’exécution des autres, refuser leurs chargement quand tiers (avec erreur “blocked by client” ou “blocked by plugin”


INtéressant … et quels genre d’outil permet d’injecter du JS comme ça ? (depuis FFox)


Greasemonkey ? Sinon tu créer un plugin… Certains plugins ne sont que de bêtes JS