> Merkliste Sie können Bookmarks mittels Listen verwalten, loggen Sie sich dafür bitte in Ihr SLUB Benutzerkonto ein.
Medientyp: E-Artikel Titel: Policy Mirror Descent for Regularized Reinforcement Learning: A Generalized Framework with Linear Convergence Beteiligte: Zhan, Wenhao; Cen, Shicong; Huang, Baihe; Chen, Yuxin; Lee, Jason D.; Chi, Yuejie Erschienen: Society for Industrial & Applied Mathematics (SIAM), 2023 Erschienen in: SIAM Journal on Optimization, 33 (2023) 2, Seite 1061-1091 Sprache: Englisch DOI: 10.1137/21m1456789 ISSN: 1052-6234; 1095-7189 Entstehung: Anmerkungen: