Back to top

Stage M2 Modèles à blocs latents pour la caractérisation de la biodiversité

Description: 

La notion de biodiversité peut se refléter dans un pattern de dissimilarités entre séquences, quantifiées par des distances d'alignement. Il s'agit alors d'identifier à partir de ces données, les groupes de séquences correspondant à une même espèce, puis le pattern d'organisation des espèces entre elles. Des premiers travaux ont permis de représenter les séquences sous la forme d'un nuage de points en petite dimension et d'en extraire des zones de fortes densités de points. L'étape suivante consiste à revenir à l'espace de grande dimension initial et à analyser ces zones dans cet espace : est-ce qu'une zone correspond vraiment à une seule espèce, ou découvre-t'on des sous-groupes? Les "espèces" sont-elles connectées, ou isolées ?

Comment se positionnent les zones les unes par rapport aux autres ? Pour répondre à ces questions, il est possible par seuillage des distances, de se ramener à une représentation des zones par un graphe où un sommet est une séquence, et un lien existe si la distance est inférieure au seuil puis d'analyser la structure de ce graphe pour en déduire une description de la biodiversité associée. Le stage proposé porte sur l'analyse de ce graphe basée sur l'utilisation des modèles à blocs stochastiques (Stochastic Block Model, SBM) qui permettent non seulement d'identifier des groupes de sommets connectés mais aussi de caractériser les interactions entre ces groupes.

Type de l'offre: 
Date limite de la candidature: 
28/02/2019
Période d'emploi: 
01/03/2019 - 31/08/2019
Email du contact: 
Unité de recherche d'affectation: