Nous avons déjà largement évoqué dans nos colonnes les différentes pratiques permettant de gonfler artificiellement le volume de pages vues ou de publicité écoulées. L'une d'entre elles est le rafraichissement automatique. Parfois gênante pour l'utilisateur et bien que néfaste pour les annonceurs, celle-ci continue de sévir. Suite à des échanges avec des confrères et des lecteurs, nous avons décidé de faire le point sur ses implémentations actuelles et sur son effet dans la pratique via une série de tests menés la semaine dernière.
Lorsque nous avons commencé à évoquer la problématique des bloqueurs de publicité et des pratiques des différents sites, nous n'avons pas parlé que de la multiplication des espaces et des formats natifs / sponsorisés. Il a en effet aussi été question de ces méthodes qui consistent à gonfler les statistiques affichées, ou même plus simplement à écouler bien plus de bannières / pavés publicitaires qu'il ne serait possible de le faire naturellement.
Générer de la page vue : un art aux multiples facettes, qui a survécu à l'AJAX
Cela peut prendre différentes formes plus ou moins ingénieuses, et l'on a par exemple longtemps eu droit à de la simple surpagination, à une ergonomie volontairement complexifiée, à des quizz, ou même des diaporamas photo qui nécessitaient que la page soit rafraichie entièrement entre chaque élément. Résultat : plus de pages vues facilement générées (comprendre à moindres frais), chacune contenant de la publicité. Mais cela avait tendance à faire râler les utilisateurs, surtout à l'heure du chargement asynchrone généralisé.
Les pratiques ont donc évolué et l'AJAX est rentré en jeu, de différentes manières. Désormais, lorsque vous changez d'image dans un diaporama par exemple, seule celle-ci est modifiée... ainsi que la publicité et les compteurs de statistiques. L'ergonomie est bien meilleure pour l'utilisateur, mais le résultat est le même pour le site.
Changer d'élément dans cette gallerie photo de Mashable, rafraichit les publicités et les différents scripts de la page
Certains vont même plus loin, puisque ce rafraichissement ne se fait pas toujours sur une action de l'utilisateur, mais en fonction d'un compteur temporel. Ainsi, Freenews met par exemple à jour ses espaces publicitaires, et seulement eux, toutes les 20 secondes. Mais ici, ce sont au final surtout les régies et les annonceurs qui sont à plaindre, puisque si les affichages grimpent en flèche, les taux de clic, et donc l'efficacité, ont tendance à descendre tout aussi fortement. Nous en reparlerons d'ailleurs un peu plus loin.
Simuler une activité, même si ce doit être au détriment de l'utilisateur
Ce n'est donc pas cela qui a focalisé notre attention, car une pratique bien plus ancienne continue de sévir. Et ici, l'AJAX ou d'autres solutions peinent à prendre le relai. Celle-ci est communément appelée « Auto-refresh » et consiste tout simplement à mettre à jour une page complète de manière récurrente, sans action de l'utilisateur. Elle a déjà fait l'objet des foudres de Korben et interpellé Guillaume Limare, mais on retrouve aussi quelques grognements du côté de Sirchamallow ou de SeoVox pour ne citer qu'eux.
Le but est simple : sous l'avalanche de contenus, la plupart des internautes ouvrent des pages tout au long de leur journée et ne s'en occupent que lorsqu'ils ont du temps. Si des outils comme Pocket ou Instapaper ont limité de tels comportements, ils sont encore assez courants, surtout chez ceux qui ont besoin de faire de la veille. Il est donc assez habituel de se retrouver avec des utilisateurs qui ont plusieurs fenêtres ouvertes et des dizaines d'onglets dans chacune d'entre elles.
Une fenêtre un peu trop ordinaire...
Certains se sont alors dit : plutôt que de laisser ces pages inactives, pourquoi ne pas en profiter pour les rafraichir automatiquement ? À chaque fois, cela décompte une page vue en plus, ce qui est au final bénéfique aux chiffres d'audience. Si cela pouvait un temps se comprendre sur une page contenant un « live » par exemple (il est désormais assez aisé de ne mettre à jour que le contenu de la page), il n'y a pas d'explication logique au fait de généraliser ce comportement à tout un site, sans distinction. D'autant plus que lorsque vous regardez une vidéo, écrivez un long commentaire, mettez du temps à lire un article, cela peut vite devenir un problème.
Lors d'échanges récents sur le sujet avec des confrères et des lecteurs, nous nous sommes néanmoins rendu compte que les façons de procéder étaient largement différentes d'un site à l'autre, et que l'impact réel n'avait semble-t-il pas été vraiment mesuré récemment. Nous avons donc décidé de faire le point, et de mettre en place plusieurs phases de tests en conditions réelles, qui se sont déroulées en fin de semaine dernière afin d'en avoir le cœur net.
Le cas d'un site comme PC INpact
Avant de commencer, et comme cela nous est parfois demandé, voici quelques chiffres qui nous seront utiles concernant PC INpact. Selon Xiti et Analytics, le site affiche en moyenne 2,4 pages par visite sur l'ensemble de l'année 2013. Une valeur assez faible puisque nos confrères de Les Numériques, qui communiquent ouvertement sur leur audience et ne pratiquent pas le rafraîchissement automatique, indiquaient par exemple 37 millions de pages vues pour 10 millions de visites en décembre dernier, soit un rapport de 3,7.
Notre score actuel est d'ailleurs en baisse puisqu'il était de 3 pages par visite il y a quelques années, ce qui s'explique par plusieurs raisons. Tout d'abord parce que PC INpact est avant tout un site d'actualité quotidienne. Même si nous publions des contenus paginés, ceux-ci ne représentent qu'une faible portion de notre audience et nous avons même récemment décidé de rallonger leur longueur (notamment avec l'arrivée d'une colonne de droite plus importante). Ensuite parce qu'avec la version 5 du site, nous avons mis en place toute une série de fonctionnalités visant à améliorer l'ergonomie en limitant les effets de découpage.
Par défaut, seuls les cinq commentaires les plus récents sont affichés sous nos actualités. Un choix pensé au départ pour limiter la charge sur le serveur. La pagination s'active ensuite tous les dix commentaires, mais nos lecteurs inscrits et connectés (qui interviennent le plus souvent) peuvent, eux, afficher jusqu'à 100 commentaires par page. Les abonnés peuvent grimper à 500 et bénéficient de la pagination en AJAX que nous avons expérimentée depuis quelques mois. Au final, ces pages représentent 7,6 % de notre audience sur les huit premiers mois de l'année.
Comme précisé à Marc Prieur de Hardware.fr, qui nous interrogeait hier sur le sujet, nous avons d'ailleurs décidé de généraliser cette procédure sur la prochaine version du site. Il en sera de même avec la mise à jour du nombre de commentaires et des actualités sur la page d'accueil, qui utilise les websockets sous la forme d'un « push », plutôt que via un rafraichissement quelconque. Bien entendu, il n'est pas question de retirer toute procédure de rafraichissement de la page en entier (elles ont parfois un intérêt), mais de les limiter lorsque cela n'est pas utile, tout en préservant la source de revenus nécessaire qu'elles représentent. Un juste milieu à trouver, donc.
La bonne vieille META Refresh affichée sur la page d'accueil
Passons maintenant aux pratiques que nous avons constatées et les méthodes qui sont utilisées. La plus simple est de placer une balise META Refresh au début de chaque page, avec un nombre de secondes (600 dans notre exemple) à attendre avant de la rafraîchir. Cela prend alors la forme suivante :
meta http-equiv="refresh" content="300"
D'après nos constatations, c'est notamment le cas de 20 minutes (240 secondes) et d'Europe 1 (300 secondes), mais uniquement sur leur page d'accueil. Certains sites étrangers font de même, mais parfois avec des valeurs bien plus élevées. Ainsi, le Wall Street Journal se contente de 1 200 secondes, contre 1 800 secondes pour Adweek. Les sites spécialisés ne sont d'ailleurs pas en reste puisque nous avons relevé 240 secondes chez 01 Net, 480 secondes chez L'Equipe, 600 secondes chez Journal du geek et 900 secondes chez Comment ça marche.
Gregori Pujol de JdG a accepté de nous répondre sur le sujet. Selon lui, c'est surtout la nécessité de proposer une page d'accueil toujours à jour à ses lecteurs qui a motivé le choix de la rafraichir toutes les 600 secondes : « Il est là depuis la dernière version, soit au moins deux ans, et se fait toutes les 10 minutes. Nous l'avons mis car nous avons constaté que de nombreux visiteurs ont le JDG ouvert sur un onglet mais passent à côté de nombreuses actus. Du coup en rafraîchissant la page toutes les 10 minutes cela leur permet quand ils reviennent sur l'onglet d'avoir directement les dernières news et comme nous en avons environ une trentaine par jour, cela a permis de booster leur visibilité au global ». Pourquoi alors ne pas être passé sur une mise à jour en AJAX ou l'utilisation des websockets ? « On n'a pas changé la techno car on verra ça sur la prochaine version », nous précise-t-il.
La touche F5, bientôt obsolète ?
Parfois cela va jusqu'aux contenus, avec quelques adaptations
Si l'excuse de la fraîcheur de la page d'accueil est encore à peu près valable, et ne gêne pas trop l'utilisateur dans la pratique, il en est tout autrement des pages intérieures comme nous l'avons évoqué précédemment. Pourtant, plusieurs sites exploitent cette méthode. C'est notamment le cas du journal Le Monde, qui se contente alors de passer son compteur de 600 secondes à 900 secondes. Plus proche de nous, PC World ou Cowcotland font de même, mais à 600 secondes dans les deux cas. Certaines adaptations sont néanmoins parfois mises en place comme nous l'a confirmé Aurélien Lagny (aka Mantidor chez CCL) :
« Le rafraichissement automatique permet en fait de recharger notre système de cache, pour alléger au mieux notre serveur » nous explique-t-il, alors que nous pensions que cela multipliait surtout les requêtes. Selon lui, cela ne gêne d'ailleurs en rien l'utilisateur puisque « nous avons déterminé un temps supérieur au temps de consultation des pages. Chaque consultation de page est de 4 minutes en moyenne, alors que le refresh est de 10 minutes. [...] Les news contenant beaucoup de photos ou des vidéos n'ont pas le refresh auto. Les news contenant un certain nombre de commentaires désactivent automatiquement la fonction auto refresh, afin que les lecteurs puissent consulter les commentaires plus facilement et ne pas être coupés en pleine rédaction par exemple ». Le site préparant actuellement sa nouvelle version, il sera intéressant de voir si cela est toujours le cas à terme ou non.
L'utilisation de JavaScript peut vite mener à un concours Lépine
Car ce sont bien ces cas qui posent souci dans la pratique. Et plutôt que de complètement désactiver l'auto-refresh, certains font dans l'inventivité. Cela passe alors en général par un code JavaScript afin de disposer d'une plus grande flexibilité de mise en place. PC World vérifie ainsi que le formulaire de commentaire ne contient pas de texte comme vous pouvez le voir ci-dessous. On retrouve un peu le même comportement chez Le nouvel observateur :
Le code JavaScript de PCWorld puis du Nouvel Observateur, qui gère le rafraichissement automatique des pages
L'Express, qui utilise un compteur JS à 240 secondes sur sa page d'accueil, grimpe à 900 secondes en page intérieure, mais en se laissant la possibilité de le bloquer s'il le juge nécessaire. Mais notre préférence va tout de même au Figaro et aux Échos qui utilisent le même script sur la page d'accueil (uniquement).
En effet, celui-ci permet de réguler l'activation ou non du compteur en fonction de l'état des publicités ou des vidéos, mais aussi d'un « Buffer ». Notez que si vous n'avez pas JavaScript sur votre machine, c'est une bonne vieille balise META Refresh qui prend le relai, à 180 secondes :
Le script applique sur la page d'accueil du Figaro et des Échos
Rafraîchissement automatique des pages : quel impact dans la pratique ?
Mais au final, une question continue de se poser après tout cela : quel est l'effet d'une telle façon de faire dans la pratique ? Ceux qui l'exploitent semblent indiquer que l'écart n'est pas si élevé que l'on pourrait le penser. Pour en avoir le cœur net, nous avons décidé de mener l'expérience en conditions réelles, sur PC INpact. Nous avons ainsi activé un rafraichissement automatique des pages durant quelques jours, ce qui avait pour nous deux buts :
- Constater le temps avant la réception des premières plaintes des utilisateurs
- Constater l'effet sur le nombre de pages vues du site, de manière générale ou par visites
Cette expérience a été réalisée en concertation avec l'équipe rédactionnelle, entre le mardi 17 septembre à 20h et le vendredi 20 septembre à 9h. Bien entendu, personne d'autre n'était au courant, pas même notre régie ni les annonceurs (qui ont eu droit à une compensation pour les pages vues perdues dans la nature). Nous avons découpé les choses en plusieurs phases :
- Du mardi à 20h au mercredi à 9h : META à 300 secondes sur toutes les pages du site
- Du mercredi à 9h au jeudi à 9h : META à 300 secondes sur toutes les pages, sauf pour les inscrits
- Du jeudi à 9h au vendredi à 9h : JS à 300 secondes uniquement sur la page d'accueil, pour tout le monde
Nous avons opté pour une valeur de 300 secondes car elle nous semblait un juste milieu entre les valeurs 180 et 600 habituellement utilisées. Et autant dire que les résultats n'ont pas trainé. En effet, Analytics en temps réel a tout de suite multiplié par deux ou trois le nombre d'utilisateurs actifs sur le site, en fonction de l'heure. En moins d'une heure, nous étions interpellés dans les commentaires, par mail, ou sur Twitter par des lecteurs qui se plaignaient. La raison ? Surtout l'impossibilité d'écrire sereinement des commentaires ou de lire des contenus longs.
Le lendemain, nous avons décidé de supprimer la balise, afin de voir l'effet sur le nombre d'utilisateurs actifs selon Analytics en temps réel. Et on peut dire que la différence était assez nette :
Avec, puis sans le rafraichissement automatique de l'ensemble des pages : des utilisateurs actifs qui sont faciles à simuler
Rafraîchir toutes les pages, une bonne manière de tripler les pages vues
Sur cette première période, nous avons grimpé à une moyenne de 7,27 pages vues par visite, contre 2,1 environ habituellement dans des horaires similaires. Soit un rapport de 3,46 ! Afin de tenter de résoudre la grogne légitime des lecteurs, nous sommes ensuite passés à la phase 2. Désormais, seuls ceux qui ne sont pas connectés avaient droit à un rafraîchissement automatique. Un choix plutôt judicieux, puisque dès ce moment-là, nous n'avons plus relevé la moindre plainte.
Pour autant, les statistiques étaient toujours à la hausse : 5,16 pages vues par visite sur l'ensemble de la période. On passait alors à un rapport d'un peu moins de 2,5, ce qui était tout de même largement acceptable. Lors de la phase 3, nous avons opté pour un code JavaScript, qui n'était présent que sur la page d'accueil, mais pour l'ensemble des visiteurs, connectés ou non. Résultat : 3,56 pages vues par visite, un gain de près de 70 %.
Au final, nous avons complètement explosé les statistiques en termes de pages vues, comme vous pouvez le voir sur les graphiques ci-dessous, issus de Google Analytics :
Des résultats statistiques sans appel grâce à quelques lignes de code
Deuxième effet Kiss Cool : l'impact sur le taux de clic, quid des revenus de l'éditeur ?
Mais si vous pensez que cela peut facilement permettre de générer bien plus de revenus, ce n'est pas forcément le cas. En effet, comme nous l'avons déjà précisé, l'un des aspects négatifs de cette pratique est que les publicités sont certes comptabilisées, mais jamais vues. Pour monnayer cher un espace, une audience qualifiée et un taux de clic correct sont nécessaires. Et sur ce dernier point... autant dire que les résultats sont désastreux.
En effet, nous avons demandé à l'une des régies de PC INpact de nous fournir les chiffres d'une campagne présente sur la page d'accueil sur la période : le taux de clic s'est effondré, passant de 0,17 % à 0,06 % sur une période comparable. Au final, cette pratique est sans doute une bonne chose pour faciliter l'écoulement de grosses campagnes lorsque les annonceurs ne sont pas très regardants sur le taux de clic, mais l'on peut se demander si ces derniers n'auraient pas plus intérêt à s'intéresser à la manière dont sont diffusées leurs campagnes.
Du côté des problématiques plus légitimes, comme le fait de disposer d'une page d'accueil toujours à jour, la volonté de trouver le juste milieu entre mise en cache et fraîcheur du contenu affiché, il existe sans doute bien des manières de le faire désormais sans avoir à utiliser un reload JavaScript plus ou moins complexe ou cette bonne vieille balise META Refresh. Espérons donc que les sites commenceront à le comprendre dans les mois qui viennent au gré de l'arrivée de leurs nouvelles versions, ce qui permettra ainsi à leurs lecteurs un usage plus confortable au quotidien. Des lecteurs qui devraient d'ailleurs sans doute être parmi les premiers à l'exiger.