• Medientyp: Elektronische Hochschulschrift; Sonstige Veröffentlichung; E-Book
  • Titel: Use of data analysis techniques to solve specific bioinformatics problems ; Apport de techniques d'analyse de données pour résoudre des problèmes spécifiques en bio-informatique
  • Beteiligte: Moulin, Serge [VerfasserIn]
  • Erschienen: theses.fr, 2018-12-12
  • Sprache: Französisch; Englisch
  • Schlagwörter: Ordinal polytomous regression ; Bio-Informatique ; Courbes ROC ; Régression polytomique ordonnée ; Transposable elements ; Éléments transposables ; Statistique ; Bioinformatics ; Clustering de séquences génétiques ; Statistic ; DNA clustering ; ROC analysis
  • Entstehung:
  • Anmerkungen: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Beschreibung: De nos jours, la quantité de données génétiques séquencées augmente de manière exponentielle sous l'impulsion d'outils de séquençage de plus en plus performants, tels que les outils de séquençage haut débit en particulier. De plus, ces données sont de plus en plus facilement accessibles grâce aux bases de données en ligne. Cette plus grande disponibilité des données ouvre de nouveaux sujets d'étude qui nécessitent de la part des statisticiens et bio-informaticiens de développer des outils adaptés. Par ailleurs, les progrès constants de la statistique, dans des domaines tels que le clustering, la réduction de dimension, ou les régressions entre autres, nécessitent d'être régulièrement adaptés au contexte de la bio-informatique. L’objectif de cette thèse est l’application de techniques avancées de statistiques à des problématiques de bio-informatique. Dans ce manuscrit, nous présentons les résultats de nos travaux concernant le clustering de séquences génétiques via Laplacian eigenmaps et modèle de mélange gaussien, l'étude de la propagation des éléments transposables dans le génome via un processus de branchement, l'analyse de données métagénomiques en écologie via des courbes ROC ou encore la régression polytomique ordonnée pénalisée par la norme l1. ; Nowadays, the quantity of sequenced genetic data is increasing exponentially under the impetus of increasingly powerful sequencing tools, such as high-throughput sequencing tools in particular. In addition, these data are increasingly accessible through online databases. This greater availability of data opens up new areas of study that require statisticians and bioinformaticians to develop appropriate tools. In addition, constant statistical progress in areas such as clustering, dimensionality reduction, regressions and others needs to be regularly adapted to the context of bioinformatics. The objective of this thesis is the application of advanced statistical techniques to bioinformatics issues. In this manuscript we present the results of our works concerning ...
  • Zugangsstatus: Freier Zugang