Vidéoconférence. Mathématiques et biologie : combinatoire, automates et génome.

Auteur : Nicomède Pierre

Résumé

Au cours de la conférence sont considérés des textes aléatoires. Le cas le plus simple est celui où les textes sont composés de 2 lettres (par exemple a et b ). Les lettres peuvent arriver de manière indépendante (par exemple avec probabilité 1/3 pour a et 2/3 pour b ), ou suivant un modèle défini en imposant les probabilités de transition entre lettres (modèle markovien).
Sur ces textes est étudié l’apparition d’un mot particulier (par exemple le mot aba). Combien de temps faut-il pour rencontrer ce mot ? Quelle est la probabilité qu’un texte de taille n ne contienne pas ce mot ? Quelle est la distribution du nombre d’occurrences de ce mot dans un texte de taille n (espérance, écart-type ) ? Quelle est la distribution asymptotique du nombre d’occurrences ? Les méthodes combinatoires (entre autres l’utilisation de séries génératrices) permettent de répondre à ce type de problèmes. D’une manière plus générale, l’apparition d’un ensemble de mots (par exemple aba,abba,abbba,… ) est étudiée. Les questions posées sont les mêmes, mais dans ce cas, sont utilisées comme représentation intermédiaire des automates (la théorie mathématique des automates a connu des succès importants ces dernières années).
En génomique on dispose de génomes (textes sur un alphabet de 4 lettres correspondant aux bases de l’ADN) ou de protéomes (textes sur un alphabet de 20 lettres correspondant aux acides aminés qui constituent les protéines). On compte sur ces textes le nombre d’occurrences observées d’un mot ou d’un ensemble de mots, et on compare à ce que l’on attend par un calcul probabiliste. La sur-représentation (ou la sous-représentation) de mots correspond souvent à des mécanisme biologiques ; par exemple certaines séquences protègent le génome contre des protéines qui le dégradent et sont très sur-représentées. La calibration des observations par les résultats probabilistes donne des indications très utiles au biologiste.

Notes

L’IREM de Paris met en ligne une variété importante de vidéos issues des travaux de recherche de ses groupes et chercheurs.
Cette cassette vidéo de la collection « Vidéoconférence » est l’une d’entre elles.

Données de publication

Éditeur IREM de Paris, Institut Henri Poincaré Paris , 2002 Collection Vidéoconférence

Public visé chercheur, élève ou étudiant, enseignant

Type Film, vidéo Langue français Support cassette vidéo

Classification