Images des Mathématiques. L’algorithme PageRank de Google.

Une promenade sur la toile.

Résumé

Le point fort de Google est qu’il trie intelligemment ses résultats par ordre de pertinence. Le pilier de son succès est une judicieuse modélisation mathématique. Le web est un graphe, qu’il faut exploiter.
Plusieurs modèles sont possibles. Mais attention aux « trous noirs ». Pour y échapper, Google utilise un modèle raffiné basé sur le théorème du point fixe. Un moteur de recherche doit non seulement énumérer les résultats d’une requête, mais les classer par ordre d’importance. Estimer la pertinence des pages web est un profond défi de modélisation, que Google relève grâce au théorème du point fixe qui justifie l’algorithme itératif choisi. Le modèle PageRank définit une mesure de « popularité ». La deuxième partie de l’article présente les développements mathématiques : la reformulation matricielle, les matrices stochastiques, le modèle PageRank, le théorème du point fixe, et se termine par quelques approfondissements (chaînes de Markov et ergodicité) et quelques points de réflexion : le modèle est-il plausible, descriptif ou normatif ?

Notes

Cet article est publié sous la rubrique « Echos de la recherche ».
Il et également paru dans Bulletin de l’APMEP n° 489 , Maths A Venir Express .

Cet article est en libre accès sur le site https://images.math.cnrs.fr/Comment-Google-classe-les-pages-web

Données de publication

Éditeur Centre National de la Recherche Scientifique (CNRS) , 2009
ISSN 2105-1003

Public visé élève ou étudiant, enseignant, tout public Niveau 1re, 2de, 3e, collège, lycée, terminale Âge 14, 15, 16, 17

Type article de périodique ou revue Langue français Support internet

Classification