• Medientyp: Elektronische Hochschulschrift; E-Book; Sonstige Veröffentlichung
  • Titel: Contribution to the study of graphical models and high-dimensional statistics applied to the modeling of Triple-Negative Breast Cancer ; Contribution à l’étude des modèles graphiques et statistique en grande dimension appliquée à la modélisation du cancer du sein triple négatif
  • Beteiligte: Okome Obiang, Eunice [VerfasserIn]
  • Erschienen: theses.fr, 2022-10-18
  • Sprache: Englisch
  • Schlagwörter: Sparsité ; Variable selection ; Sparsity ; Structural penalization ; Approche bayésienne ; Spike-And-Slab ; Corrélation partielle ; Partial correlation ; Gibbs sampler ; Régression linéaire en grande dimension ; Échantillonneur de Gibbs ; High-dimensional linear regression ; Bayesian approach ; Sélection de variables ; Modèle graphique partiel ; Pénalisation structurante ; Partial graphical model
  • Entstehung:
  • Anmerkungen: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Beschreibung: Cette thèse s'articule autour de deux axes. Le premier constitue une contribution à l'étude des modèles graphiques gaussiens partiels (PGGM) dans le cadre de l'apprentissage en grande dimension. Plus précisément, nous nous intéressons à la modélisation à sorties multiples, où nous souhaitons estimer d'une part la matrice D des liens directs entre les prédicteurs et les réponses, et d'autre part la matrice de précision conditionnelle des réponses Wy. Nous débutons avec une approche fréquentiste par maximum de vraisemblance pénalisée, où nous proposons un PGGM muni de deux formes de pénalisation : une pénalisation l1 induisant de la sparsité sur D et Wy, et une pénalisation structurante reflétant un a priori gaussien généralisé sur les liens directs. Nous montrons que, lorsqu'il est convenablement régularisé, ce modèle est agrémenté d'une garantie théorique prenant la forme d'une borne supérieure sur l'erreur d'estimation. Enfin, nous clôturons cette première réflexion par des études empiriques mettant en avant le caractère structurant de cette procédure d'estimation, et sa pertinence sur un jeu de données réelles. Nous poursuivons par l'étude de la contrepartie bayésienne, jusqu'alors inexplorée dans la littérature. En suivant une stratégie spike and slab, nous offrons plusieurs structures hiérarchiques imposant soit une configuration saturée, sparse, group-sparse ou encore sparse-group-sparse de la matrice D. Nous obtenons une garantie théorique pour les configurations sparse et group-sparse, et illustrons les résultats compétitifs de ces modèles sur une étude de simulation et un jeu de données réels, menés avec des échantillonneurs de Gibbs. Le deuxième axe de la thèse est, quant à lui, entièrement dévolu à la sélection de variables pronostiques en analyse de suvie multi-omique. Nous y proposons un algorithme de sélection de variables descendante offrant un consensus entre différentes méthodes de régularisation, notamment celles présentées dans le premier axe. L'efficacité de cette approche est enfin étudiée ...
  • Zugangsstatus: Freier Zugang