• Media type: Text; Electronic Thesis; E-Book
  • Title: Nouvelle méthode d’interprétation de données de spectrométrie de masse en tandem pour l’identification de microorganismes dans un échantillon complexe ; Novel interpretation method of tandem mass spectrometry data for microorganisms identification in a complex sample
  • Contributor: Allain, François [Author]
  • Published: theses.fr, 2014-07-08
  • Language: French
  • Keywords: Complex sample ; Mass spectrometry ; Microorganisms ; Microorganismes ; Spectroscopie de masse ; Echantillon complexe
  • Origination:
  • Footnote: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Description: Identifier rapidement le contenu microbien d’un échantillon biologique complexe constitue un enjeu majeur en biodéfense et dans les domaines concernant la santé humaine, les biotechnologies et l’environnement. La spectrométrie de masse en tandem (MS/MS) permet de sonder le contenu protéique d’un échantillon avec précision. Ce travail de thèse porte sur le développement d’un nouveau concept d’interprétation des données de spectrométrie de masse MS/MS à des fins d’identification sans a priori du contenu microbien d’un échantillon à l’aide de bases de données protéiques généralistes. L’approche d’identification se base (i) sur la base de données actuelle la plus exhaustive, et (ii) sur un algorithme d’interprétation de spectres MS/MS. Une architecture informatique a été développée afin de regrouper les résultats MS/MS selon la taxonomie des organismes vivants tout en veillant à minimiser le temps de traitement nécessaire et à maximiser le taux d’attribution de spectres MS/MS. Une stratégie d’identification récursive à travers l’arbre taxonomique basée sur le nombre de spectres spécifiques associés à chaque taxon est possible, mais ne permet pas d’identifier avec confiance le contenu d’un échantillon multi-organismes séquencés. Le concept innovant développé a permis d’établir une corrélation entre le nombre de spectres attribués à un taxon et la distance phylogénétique de ce taxon au taxon de l’organisme présent dans le cas d’un échantillon mono-organisme séquencé. Cette corrélation permet de modéliser et de déterminer la présence de tout organisme séquencé dans un échantillon multi-organismes. Un outil automatique d’estimation de distances phylogénétiques entre taxons a donc été mis au point, basé sur l’ajout de nouveaux organismes à un alignement multiple de séquences de référence composé de 31 familles de protéines universelles pour des organismes des 3 domaines du vivants (bactéries, archées, eucaryotes). Enfin, deux algorithmes d’identification du contenu d’un échantillon multi-organismes séquencés ont été ...