D-ONT

Titre du projet: 
Exploitation optimisée des bases de données phénotypiques - Des ontologies pour le partage d’information
Type de projet: 
Responsable du projet: 
Isabelle Hue et Claire Nédellec
Période: 
01/09/2015 - 30/09/2018

L’intégration et la modélisation des données issues des recherches sur l’animal sont des priorités pour répondre aux enjeux scientifiques du phénotypage. Cela requiert que les données primaires, acquises de manière indépendante dans des projets dédiés soient à la fois accessibles (open data) et opérationnelles (linked data), c’est à dire qualifiées, interprétées et intégrées avec la connaissance du domaine pour être exploitées. En l’état, leur réutilisation est affectée par différents facteurs : l‘hétérogénéité des mesures, des échelles et des objets décrits, l’absence de normalisation de leur identification, leur dispersion dans des bases de données phénotypiques, le manque de formalisation des connaissances qui sont publiées sous forme de textes. Or, les ontologies sont reconnues comme des instruments privilégiés pour relier, intégrer, combiner et faciliter un accès normalisé aux données (voir par exemple les nombreuses actions dans le domaine médical (MeSH), en génétique avec Gene Ontology, ou en végétal dans Wheat Initiative). Les ontologies dédiées aux animaux de rente, notamment ATOL (Animal Trait Ontology for Livestock) et EOL (Environment Ontology for Livestock), ont pour fonction :

i) de rendre les bases de données phénotypiques interopérables grâce à un référentiel formel commun précis et univoque,

ii) d’extraire des corpus bibliographiques les informations d’intérêt pour la recherche ou l’application (ex : Golik et al., 2012) , de les structurer et de les rendre interopérables avec les bases de données,

iii) d’organiser la connaissance pour des acteurs extérieurs au domaine d’intérêt (documentalistes, évaluateurs (ex. projet TriPhase [Nédellec & Girard, 2013])), mais aussi 

iv) d’extraire automatiquement et à la demande à partir de sources multiples ces informations hétérogènes éventuellement complexes, pour alimenter, notamment, des modèles de connaissance ou des modèles prédictifs comme ceux de la biologie des systèmes.

L’adoption de cette démarche nécessite de qualifier précisément les conditions dans lesquelles la normalisation et l’intégration par les ontologies apportent un gain scientifique, quelles sont les caractéristiques et les domaines pertinents pour ces ontologies et comment les acteurs doivent être impliqués dans une telle démarche.

Au-delà d’une analyse des besoins et d’un cahier des charges, D-ONT mettra en œuvre une solution sur le sujet de l’effet de la nutrition animale sur la composition de la carcasse, du muscle et de la viande, avec l’ambition d’en tirer des enseignements de portée générale pour les phénotypes animaux et une méthode et des outils de travail transférables à d’autres domaines.