• Media type: Text; Electronic Thesis; E-Book
  • Title: Analysis and integration of heterogeneous large-scale genomics data : application to B cell differentiation and follicular lymphoma non coding mutations ; Analyse et intégration de données génomiques larges et hétérogènes : application à la différentiation des cellules B naïve et au lymphome folliculaire
  • Contributor: Louarn, Marine [Author]
  • Published: theses.fr, 2020-11-26
  • Language: English
  • Keywords: Inférence de réseaux de régulations ; Bio-Informatique ; Regulatory network inference ; Semantic Web technologies ; BioInformatics ; Technologies du web sémantique
  • Origination:
  • Footnote: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Description: L’inférence de réseaux de régulation à partir de données hétérogènes a pour but d’identifier les régulateurs clefs impliqués dans des processus biologiques aboutissant à des cancers. Dans cette thèse, je m’intéresse à la différenciation des cellules B naïves, d'où émerge le lymphome folliculaire. Ma première contribution souligne les problèmes de réutilisation et de reproductibilité des méthodes d’inférence de réseaux actuelles. Pour surmonter ces limites, je propose une structure utilisant les technologies du Web Sémantique pour intégrer et requêter ces jeux de données hétérogènes de manière systématique (deuxième contribution). Le pipeline d'origine est reproduit par des requêtes sur le graphe de données, ce résultat peut lui-même être intégré et enrichi avec des données publiques (troisième contribution). Ceci démontre l’utilité de cette approche et de ses bénéfices en terme de réutilisation et de reproductibilité. Ma quatrième contribution est une nouvelle méthode d’inférence de réseaux prenant en compte la connaissance des experts, pour étendre l’analyse à des jeux de données restreints et biologiquement proches et pour introduire la notion de relations signées, incluant les inhibitions. Enfin, l'application de cette méthode à la différenciation des cellules B, a permis la découverte de 146 FT avec un impact potentiel majeur sur le réseau (cinquième contribution). ; Regulatory networks inference from heterogeneous data is a computational step aiming at identifying key regulators involved in differentiation processes leading to cancer. In this thesis I focus on B cell differentiation, from which follicular lymphoma emerges. The first contribution outlines the reproducibility and reusability limitations of a state-of-the-art method for network inference from genomic data. To overcome these limitations, I demonstrated that Semantic Web technologies can structure and integrate large-scale heterogeneous datasets in a systematic way (second contribution). The original analysis workflow outputs could be reproduced ...
  • Access State: Open Access