Back to top

Exploration de méthodes statistiques multi-tableaux pour l’agro-écologie

Description: 

Comment le paysage dans sa composition, sa complexité, est lié ou non à la production agricole et forestière ? Divers éléments ont été mesurés, de manière plus ou moins précise. L’objectif du stage sera d’intégrer cet ensemble de données hétérogènes, bruitées, composé aussi de mesures indirectes, afin d’obtenir une vue d’ensemble qui soit parlante pour les agroécologues. La littérature scientifique propose des outils statistiques, tels que l’Analyse Factorielle Multiple (AFM), la Regularized Generalized Canonical Correlation Analysis (RGCCA), la PLS Path Modelling (PLS-PM), les Structural Equation Modelling (SEM) par exemple. La PLS-PM a donné des résultats satisfaisants sur la partie « agricole » du projet Muesli, nous proposons dans ce stage de faire de même sur les données « forêts » de Muesli. Dans un deuxième temps, selon les affinités de l’étudiant(e), nous approfondirons un des points suivants. La première piste concerne l’imputation des valeurs manquantes et leur influence dans l’analyse. La deuxième piste sera centrée sur les données hyperspectrales : comment proposer des statistiques résumant le paysage autour de chaque parcelle agricole à partir de centaines de milliers de pixels décrits par 300 bandes spectrales. Une troisième possibilité concerne la comparaison de plusieurs approches statistiques, notamment la PLS-PM et le SEM. Un sujet de thèse sera déposé cette année sur ce sujet, en prolongement du stage.

Type de l'offre: 
Date limite de la candidature: 
30/11/2018
Période d'emploi: 
01/01/2019 - 30/06/2019
Email du contact: 
Unité de recherche d'affectation: 
Localisation CR INRA: