Google vient de mettre en ligne une infographie interactive afin de détailler un peu le principe de fonctionnement de son moteur de recherche. Le géant du web en profite pour dévoiler au passage quelques chiffres qui donnent le vertige : 30 000 milliards de pages web sont référencées via un index qui occupe 100 000 To.
Google a décidé de donner quelques informations sur son moteur de recherche et, pour cela, le géant du web a mis en place une infographie interactive baptisée : « How Search Works. From algorithms to answers » (Comment fonctionne la recherche. Des algorithmes aux réponses).
Bien évidemment, cela commence par naviguer sur le net afin de récupérer un maximum de données. Google indique référencer ainsi 30 000 milliards de pages web (soit plus de 4 000 par être humain) au sein d'un index qui occupe 100 000 To d'espace de stockage, excusez du peu.
Lorsque vous saisissez une requête, Google va d'abord se servir d'algorithmes maison afin de mieux comprendre votre demande (autocomplétion, correction orthographique, étude des synonymes, etc.). Les pages intéressantes sont ensuite récupérées via l'index dont nous vous parlions, avant d'être triées en fonction de divers critères : « qualité » du site et de la page, ancienneté sur le web, géolocalisation, etc.
Au final, Google annonce qu'entre le moment où vous validez votre recherche et celui où il vous retourne les résultats correspondants, il ne se passe que 0,125 seconde.
Une troisième partie s'intéresse enfin à la gestion du spam et aux différentes actions mises en place pour en supprimer un maximum, et ce, de manière automatique.
Bien évidemment, l'ensemble est schématisé et largement simplifié, mais les chiffres annoncés n'en restent pas moins intéressants. N'hésitez pas à cliquer sur les éléments qui composent cette infographie afin d'obtenir des détails sur certains points.
- Accéder à l'infographie interactive. (en anglais).