du 11 mai 2020
Date

Choisir une autre édition

Le Centre national pour la recherche scientifique explique que « depuis sa conception en 1998, Google continue à évoluer et la plupart des améliorations demeurent des secrets bien gardés », mais « l’idée principale » a par contre été publiée. 

Première constatation, « une base de données a une structure prédéfinie qui permet d’en extraire des informations […]. L’internet, par contre, est peu structuré : c’est une immense collection de textes de nature variée ».

Le web peut être comparé à un « graphe » et c’est cette fonctionnalité qu’il faut exploiter. Plusieurs méthodes sont possibles : comptage naïf, comptage pondéré et comptage récursif.

Le CNRS explique les différences, et revient ensuite sur la loi de transition, sur la nécessité de faire attention aux « trous noirs » et enfin sur le modèle PageRank de Google.

PageRank de Google : le CNRS revient sur la « judicieuse modélisation mathématique »
chargement Chargement des commentaires...