• Media type: Text; Electronic Thesis; E-Book
  • Title: Contributions to the theoretical analysis of statistical learning and uncertainty quantification methods ; Contributions à l'analyse théorique de méthodes d'apprentissage statistique et de quantification de l'incertitude
  • Contributor: Randrianarisoa, Thibault [Author]
  • Published: theses.fr, 2022-09-28
  • Language: English
  • Keywords: Bayesian nonparametrics ; Quantification de l’incertitude ; Distances de Wasserstein ; Statistiques bayésiennes non paramétriques ; Tree-based methods ; Uncertainty Quantification ; Wasserstein distance ; Gaussian processes ; Méthodes par arbres ; Processus gaussiens
  • Origination:
  • Footnote: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Description: L'analyse moderne des données fournit aux scientifiques des algorithmes statistiques et d'apprentissage automatique aux performances impressionnantes. Face à leur utilisation intensive pour traiter des problèmes dont la complexité ne cesse de croître, il existe un réel besoin de comprendre les conditions dans lesquelles ceux-ci fonctionnent ou sont voués à l'échec. Un objectif supplémentaire est d'obtenir des pistes pour la conception de nouvelles méthodes algorithmiques capables de s'attaquer à des tâches toujours plus innovantes et complexes. Un cadre naturel pour développer une théorie mathématique de ces méthodes est celui de l'inférence non-paramétrique. Ce domaine de la statistique s'intéresse à l'inférence de quantités inconnues sous des hypothèses minimales, moins restrictives qu'en statistique paramétrique. À la base de cette théorie est la modélisation statistique en dimension infinie d'une quantité paramétrant la loi des données. Cette flexibilité est d'autant plus intéressante que nous recherchons des algorithmes fiables dans un large éventail de contextes, et que les progrès des techniques d'acquisition de données génèrent désormais des ensembles de données massifs et complexes. Ce dernier point nous incite à mener une analyse asymptotique, qui est une approche traditionnelle pour évaluer la performance des procédures d'apprentissage. Nous étudions ici des problèmes d'estimation et de quantification de l'incertitude (QI).La première classe d'algorithmes que nous traitons est celle des méthodes bayésiennes basée sur des structures d'arbres. Elles reposent sur le principe de 'diviser pour mieux régner', en partitionnant l'espace des données pour estimer le paramètre localement. En régression, ces méthodes incluent BCART et BART, cette dernière étant un ensemble d'arbres ou forêt. En estimation de densité, les arbres de Pólya sont un exemple de telles lois a priori et constituent la base d'une myriade de constructions connexes. Nous proposons une nouvelle extension, DPA, qui est une "forêt de Pólya" et ...
  • Access State: Open Access