Fouille de données en grande dimension pour l’exploration du lien entre microbiote intestinal et santé

Deadline: 
Sunday, January 14, 2018
Period: 
01/02/2018 to 07/07/2018
City: 
Ile de France Jouy en Josas
Research Unit/Team name: 
MaIAGE

Stage de Master 2 en Biostatistique - Durée 6 mois

 

CONTEXTE ET OBJECTIF DU STAGE

L’essor récent de la métagénomique a permis des avancées scientifiques majeures dans le domaine de la santé humaine en étudiant rôle du microbiote intestinal dans des maladies aussi diverses que l’obésité, le diabète, le cancer ou les maladies cardio-vasculaires [1, 2].

Au sein de l’unité MetaGenoPolis, l’équipe InfoBioStat développe une expertise pointue dans la découverte et la caractérisation fonctionnelle de biomarqueurs microbiens associés à des pathologies. L’équipe StatInfOmics de l’unité MaIAGE (Mathématiques et Informatique Appliquées du Génome à l'Environnement) est quant à elle spécialisée dans le développement de méthodes statistiques pour l’analyse des données "omiques".

Un des challenges pour l’exploration de ces données en grande dimension est la recherche de structures cohérentes dans le microbiote intestinal, qui puissent être mises en regard avec les données des individus dont ils proviennent. Pour cela, deux méthodes d’analyse de données basée sur la modélisation (i) de données de comptages pour l’une [3], et de données de type compositionnelles pour l’autre [4] ont été développées et testées sur différents jeux de données réels ou simulés, mais jamais dans un contexte biomédical. L’objectif de ce stage est d’étudier dans quelle mesure ces méthodes restent pertinentes dans ce contexte, et comment les appliquer à l’étude du lien entre le microbiote intestinal et la santé. Le stage s’appuiera notamment sur les nombreuses données de métagénomique produites au sein de MGP sur des cohortes précliniques.

 

VOS MISSIONS

  • Étudier, comprendre et prendre en main les deux méthodes existantes,
  • Appliquer ces méthodes sur différentes cohortes de patients / contrôles sains, notamment pour vérifier si elles passent à l’échelle sur de grosses cohortes,
  • Interpréter les structures trouvées dans les jeux de données et identifier des clusters de biomarqueurs liés à la santé ou à la maladie,
  • Tester la robustesse et comparer la cohérence des signaux entre les différentes cohortes.

 

PROFIL SOUHAITÉ

  • Formation M2 en biostatistiques, mathématiques, modélisation ou équivalent
  • Connaissances en statistiques, méthodes multivariées
  • Connaissance du langage R
  • Des connaissances générales en biologie, en écologie et sur les problématiques liées aux données métagénomiques seraient un plus
  • Anglais scientifique

 

REFERENCES

[1] Le Chatelier, Emmanuelle, et al. "Richness of human gut microbiome correlates with metabolic markers." Nature 500.7464 (2013): 541-546.

[2] Qin, Nan, et al. "Alterations of the human gut microbiome in liver cirrhosis." Nature 513.7516 (2014): 59-64.

[3] Chiquet, Mariadassou, and Robin. 2017. Variational Inference for Probabilistic Poisson PCA. ArXiv E-Prints. https://arxiv.org/abs/1703.06633

[4] Silverman, Washburne, Mukherjee and David. 2017. A phylogenetic transform enhances analysis of compositional microbiota data. Elife 2017;6:e21887

 

Encadrement : Magali Berland ( , 01 34 65 16 49), Mahendra Mariadassou ( , 01 34 65 29 00)

Équipe d’accueil : MetaGenoPolis (US 1367), Bât. 325 ; en collaboration avec MaIAGE (UR 1404), INRA, Centre de recherche de Jouy-en-Josas, Domaine de Vilvert, 78350 Jouy-en-Josas.

Plan : https://www.google.fr/maps/place/MetaGenoPolis/