• Medientyp: E-Artikel
  • Titel: Policy Mirror Descent for Regularized Reinforcement Learning: A Generalized Framework with Linear Convergence
  • Beteiligte: Zhan, Wenhao; Cen, Shicong; Huang, Baihe; Chen, Yuxin; Lee, Jason D.; Chi, Yuejie
  • Erschienen: Society for Industrial & Applied Mathematics (SIAM), 2023
  • Erschienen in: SIAM Journal on Optimization, 33 (2023) 2, Seite 1061-1091
  • Sprache: Englisch
  • DOI: 10.1137/21m1456789
  • ISSN: 1052-6234; 1095-7189
  • Entstehung:
  • Anmerkungen: