Images des Mathématiques. L’algorithme PageRank de Google.
Une promenade sur la toile.
Auteur : Eisermann Michael
Résumé
Le point fort de Google est qu’il trie intelligemment ses résultats par ordre de pertinence. Le pilier de son succès est une judicieuse modélisation mathématique. Le web est un graphe, qu’il faut exploiter.
Plusieurs modèles sont possibles. Mais attention aux « trous noirs ». Pour y échapper, Google utilise un modèle raffiné basé sur le théorème du point fixe. Un moteur de recherche doit non seulement énumérer les résultats d’une requête, mais les classer par ordre d’importance. Estimer la pertinence des pages web est un profond défi de modélisation, que Google relève grâce au théorème du point fixe qui justifie l’algorithme itératif choisi. Le modèle PageRank définit une mesure de « popularité ». La deuxième partie de l’article présente les développements mathématiques : la reformulation matricielle, les matrices stochastiques, le modèle PageRank, le théorème du point fixe, et se termine par quelques approfondissements (chaînes de Markov et ergodicité) et quelques points de réflexion : le modèle est-il plausible, descriptif ou normatif ?
Notes
Cet article est publié sous la rubrique « Echos de la recherche ».
Il et également paru dans Bulletin de l’APMEP n° 489 , Maths A Venir Express .
Cet article est en libre accès sur le site https://images.math.cnrs.fr/Comment-Google-classe-les-pages-web
Données de publication
Éditeur Centre National de la Recherche Scientifique (CNRS) , 2009
ISSN 2105-1003
Public visé élève ou étudiant, enseignant, tout public Niveau 1re, 2de, 3e, collège, lycée, terminale Âge 14, 15, 16, 17
Type article de périodique ou revue Langue français Support internet
Classification