Zum Inhalt springen

  1. Cen, Shicong [Verfasser:in]; Cheng, Chen [Verfasser:in]; Chen, Yuxin [Verfasser:in]; Wei, Yuting [Verfasser:in]; Chi, Yuejie [Verfasser:in]

    Fast global convergence of natural policy gradient methods with entropy regularization

    Aufsätze
    Online ansehen
    Schließen

    Merkliste

    Sie können Bookmarks mittels Listen verwalten, loggen Sie sich dafür bitte in Ihr SLUB Benutzerkonto ein.

    2022

    Erschienen in: Operations research ; 70(2022), 4 vom: Juli/Aug., Seite 2563-2578

  2. Zhan, Wenhao; Cen, Shicong; Huang, Baihe; Chen, Yuxin; Lee, Jason D.; Chi, Yuejie

    Policy Mirror Descent for Regularized Reinforcement Learning: A Generalized Framework with Linear Convergence

    Aufsätze
    Online ansehen
    Schließen

    Merkliste

    Sie können Bookmarks mittels Listen verwalten, loggen Sie sich dafür bitte in Ihr SLUB Benutzerkonto ein.

    Society for Industrial & Applied Mathematics (SIAM), 2023

    Erschienen in: SIAM Journal on Optimization, 33 (2023) 2, Seite 1061-1091