Selon une étude, seul 49 % du trafic web est d'origine humaine

La vérité est ailleurs 32
Le web est une terre particulièrement sauvage où les bas instincts ont quartier libre. C’est en tout cas la conclusion que l’on pourrait tirer d’une étude réalisée par la société Incapsula. Cette dernière s’est penchée en effet sur les différents types de trafic qui constituent la fréquentation des sites web, et les résultats sont pour le moins surprenants.

incapsula analyse trafic web

La conclusion la plus étonnante est que plus de la moitié de la fréquentation d’un site provient de visiteurs… non humains. Selon Incapsula, 51 % du trafic serait en fait issu de différents bots, c’est-à-dire de modules automatisés. Les intentions seraient plus ou moins bonnes en fonction bien sûr des structures qui se tiennent derrière. Les 49 % restants seraient eux bien issus de la navigation « humaine ».

Les plus grandes surprises résident évidemment dans la partie automatisée. Par exemple, sur ces fameux 51 %, 20 proviennent des moteurs de recherche. Ce qui est déjà en soi un résultat intéressant : un cinquième du trafic d’un site alimente donc les moteurs, que ce soit pour l’indexation des données, leur mise en cache et ainsi de suite. Et les 31 % restant ? Ils ont tous trait à la sécurité.

incapsula analyse trafic web 

Les outils relatifs au piratage des sites représenteraient à eux seuls 5 % de tout le trafic web. Le piratage abordé ici couvre les cas les plus classiques : vol de données, infections par des malwares, modification directe du site ou encore plantage total de ce dernier. Les sites choisis ne le sont pas au hasard : des bots automatiques scannent le web pour vérifier la présence de certains ports ouverts, tester la présence d’une faille, d’une configuration logicielle précise, etc. Des clients DDoS peuvent se tourner en masse vers un site et le faire crouler sous les requêtes, sur une simple commande d’un individu unique pilotant des dizaines de milliers de machines zombies (botnets).

Cinq autres pourcents proviendraient des activités d’espionnage. Ce dernier peut revêtir plusieurs formes. Il y a d’abord la copie pure et simple d’informations d’un site vers un autre, sans aucune demande. Autre activité très courante : la recherche d’adresses email pour créer des listes de diffusion de spam. Enfin, on trouve aussi l’analyse d’un contenu pour y effectuer un reverse engineering pour en extraire des politiques de prix, des modèles commerciaux, etc.

Les 2 % suivants sont un phénomène que l’on retrouve de temps à autre sur PC INpact : le spam dans les commentaires. Sur une actualité comme celle-ci, un compte est créé pour venir diffuser un message à but publicitaire. Le contexte peut être respecté ou non. La diffusion du message se fait en dehors de toute considération des utilisateurs normaux et intègre souvent un ou plusieurs liens. Dans certains cas, les liens peuvent mener vers des malwares.

L'espionnage dans toute sa splendeur

Mais la majeure partie, soit 19 %, regroupe les activités diverses d’espionnage à large échelle. Ces bots scannent les structures des sites pour y chercher la moindre information pertinente sur ce qui peut avantager une société. Peuvent être ainsi analysés les mots clés et l’ensemble de l’optimisation pour les moteurs de recherche (SEO) afin d’en retirer un bénéfice.

Incapsula indique que les données ont été recueillies sur un panel de 1000 sites dont la fréquentation moyenne allait de 50 000 à 100 000 visiteurs uniques par mois. Pour la grande majorité des cas présentés, tous les sites peuvent être touchés. L’extraction d’informations tels que les tarifs et les modèles commerciaux auront cependant plus tendance à toucher les sites d’agences de voyage, les nouveaux sites, les forums et globalement tout ce qui touche à l’industrie.

Bien entendu, la conclusion de cette étude, même si elle se dessine en filigrane, est qu’il existe véritablement un commerce du piratage. Les informations qui sont extraites, volées, copiées ou autres le sont pour être revendues par la suite. Elles constituent alors des avantages commerciaux directs et l’espionnage industriel est un moteur : si un tel trafic existe, c’est que la demande est bien réelle.
 
On retiendra en tout cas que même si on met de côté les 20 % du trafic par les moteurs de recherche, près d'un tiers du trafic est touché par le côté obscur.
Publiée le 16/03/2012 à 17:44 - Source : Incapsula
Vincent Hermann

Rédacteur/journaliste spécialisé dans le logiciel et en particulier les systèmes d'exploitation. Ne se déplace jamais sans son épée.

Soutenez nos journalistes

Le travail et l'indépendance de la rédaction dépendent avant tout du soutien de nos lecteurs.

Abonnez-vous
À partir de 0,99 €

Publicité