在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

一種解決連續問題的真實在線自然梯度行動者-評論家算法

大小:0.85 MB 人氣: 2017-12-19 需要積分:0

  策略梯度作為一種能有效解決連續空間決策問題的方法被廣泛研究.然而,由于在策略估計過程中存在較大的方差,因此基于策略梯度的方法往往受到樣本利用率低、收斂速度幔等限制.針對該問題。提出了真實在線增量式自然梯度行動者一評論家算法(TOINAC).TOINAC算法采用優于傳統梯度的自然梯度,在真實在線時間差分(TOTD)算法的基礎上。提出了一種新型的向前觀點,改進了自然梯度行動者一評論家算法.在評論家部分,利用TOTD算法高效性的特點來估計值函數:在行動者部分。引入一種新的向前觀點來估計自然梯度。再利用資格跡將自然梯度估計變為在線估計。提高了自然梯度估計的準確性和算法的效率.將TOINAC算法與核方法以及正態策略分布結合,解決連續空間問題.最后。在平衡桿、Mountain Car、以及Acrobot等連續問題上進行了仿真實驗。驗證算法的有效性.

一種解決連續問題的真實在線自然梯度行動者-評論家算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

一種解決連續問題的真實在線自然梯度行動者-評論家算法下載

相關電子資料下載

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?
      主站蜘蛛池模板: 日韩视频高清| 午夜特级毛片| 久久久国产在线| 国产人成午夜免视频网站| 国产一级特黄aa大片免费| 日本三级免费看| 亚洲国产成人久久三区| 亚洲vv| 久久精品亚洲一级毛片 | 成人亚洲网站| 久久久久综合中文字幕| 黄视频在线观看免费| 人人入人人爱| 天堂视频在线| 中文字幕有码视频| 亚洲欧美天堂网| 欧美三级网站| 2020天天操| fenfencao在线观看免费视频| 色视频免费在线| 五月天丁香婷婷综合| 1000部啪啪未满十八勿入| 国产美女免费| 国产在线a不卡免费视频| 久久久久青草| 国产成年美女毛片80s| 国产www色| 天天摸天天摸天天躁| 天天综合天天色| 色综合久久88| 性xxxx欧美| 欧美a级网站| 禁漫画羞羞动漫入口| 国产精品免费一级在线观看| 美女又黄又www| 加勒比一区二区三区| 四虎影院观看视频在线观看| 四虎影院官网| 狠狠色成人综合首页| 爱婷婷网站在线观看| 7777在线|