Sophie Lemaire, Nicolas Delpierre et Judith Legrand
Objectifs :
Comprendre les modèles stochastiques discrets classiques utilisés en biologie, savoir construire un modèle à partir d'un
problème biologique, savoir effectuer une étude par simulations d'un modèle avec le logiciel R et interpréter les résultats de simulations.
Prérequis :
Notions de base sur les probabilités et les variables aléatoires discrètes, des rappels seront cependant donnés pendant le cours.
Descriptif :
Les modèles mathématiques en biologie permettent de formaliser et appréhender des
phénomènes complexes afin de comprendre leurs fonctionnements et de prédire leurs
évolutions. L'utilisation de modèles stochastiques (par opposition aux modèles déterministes)
s'impose pour étudier un système où à chaque instant, plusieurs évolutions sont possibles,
chacune d'elles ayant une certaine probabilité d'être réalisée ; c'est le cas par exemple,
lorsqu'on étudie l'évolution des génotypes par croisements. L'utilisation de tels modèles
stochastiques et leur analyse par simulations a considérablement progressé dans de
nombreux champs d'application.
L'objet du cours est la présentation des outils nécessaires pour comprendre et simuler
les modèles stochastiques discrets classiques utilisés en biologie. Lorsqu'il n'est pas
nécessaire de connaître tout l'historique du système pour prédire son évolution future, mais que
la connaissance du présent suffit, l'évolution du système peut être modélisée par un processus
stochastique simple appelé chaîne de Markov qui sera étudié dans ce cours. Les chaînes de Markov
sont utilisées dans de nombreux domaines de la biologie : évolution moléculaire, analyse de la
répartition des nucléotides d'une séquence d'ADN, évolution des fréquences génotypiques au sein
d'une population, épidémiologie des maladies infectieuses, dynamique des populations, dynamique
d'un écosystème.
Simulation de l'évolution au cours des générations du nombre d'allèles A dans 4
populations, initialement identiques, composées de 30 individus diploides (modèle de Fisher-Wright sans sélection, ni mutation).
Plan du cours :
Présentations de systèmes biologiques modélisés par des chaînes de Markov par un enseignant de biologie.
Rappels et compléments en probabilités (probabilités conditionnelles, loi d'un vecteur aléatoire discret). Utilisation de R pour effectuer des calculs de probabilités.
Présentation de la simulation stochastique et des outils probabilistes pour interpréter les résultats de simulations (loi des grands nombres, estimation et représentation graphique d'une loi empirique). Utilisation de R pour simuler le comportement d'un système biologique modélisé.
Etude des modèles stochastiques appelés "chaînes de Markov"
Définition et exemples de chaînes de Markov ;
Etude de la loi d'une chaîne de Markov à espace d'états fini à l'aide du calcul matriciel (loi à un instant donné, lois invariantes) et applications notamment en bioinformatique ;
Etude du temps d'atteinte d'un état d'une chaîne de Markov à espace d'états fini et application en génétique et en dynamique des populations ;
Estimations des paramètres d'une chaîne de Markov à espace d'états fini.
Etude par simulations de systèmes biologiques modélisés par une chaîne de Markov présentés par un enseignant de biologie (par exemple : évolution des fréquences alléliques, dynamique temporelle d'une épidémie dans une population de taille fixe, modélisation de la PCR, modélisation d'une réaction biochimique, évolution de la taille d'une population par naissance, décès et immigration, succession d'espèces dans un écosystème, modèle de type proie-prédateur).
Fonctionnement
Cours intégré avec des TD sur ordinateurs utilisant le logiciel R.
Des exercices à corrections automatiques et de documents interactifs sont mis à
disposition dans une classe WIMS pour aider à l'assimilation du cours.
Ouvrages de référence
Les livres énumérés ci-dessous sont disponibles à la bibliothèque universitaire.
Cours de probabilités
Bogaert P. "Probabilités pour scientifiques et ingénieurs.
Introduction au calcul des probabilités", deBoeck (2005)
J-M et R Morvan "Bien débuter en probabilités, Exercices avec rappels de cours de probabilités discrètes", Cepadues
K. P. Baclawski, "Introduction to Probability with R", Chapman & Hall
Ouvrages généraux sur la modélisation
Allman E. Rhodes J. "Mathematical models in biology", Cambridge University Press (2004)
Coquillard P., Hill D. "Modélisation et simulation d'écosystèmes", Masson (1997)
Istas J. "Mathematical modeling for the life sciences", Springer (2005)
Chaînes de Markov et applications
Engel, A. "Processus aléatoires pour les débutants". Cassini (2011)