?

首頁: 電子電路圖,電子技術資料網站首頁

電子資料下載: 電子資料下載頻道 -- 為電子工程師提供激發創新靈感的新方案、新的參考設計、新的設計構想等可下載的電子資料！

電子技術應用: 電子技術應用頻道 -- 為電子工程師提供電子產品設計所需的技術分析、設計技巧、設計工具、測試工具等技術文章！

電子元器件: 專業的電子元器件平臺 -- 及時發布大量最新IC、分立器件、模組等電子元器件產品信息！

電子電路圖: 電路圖頻道 -- 提供電子電路圖,原理圖,汽車電路圖,手機電路圖,功放電路圖,電源電路圖等電路圖紙

電子技術論壇: 構建電子工程師交流的平臺 -- 在交流中進一步學習設計技巧、規劃技術人生、提升自我價值！

源碼下載: 源碼下載頻道; uCOS編程 C/C++語言編程 Symbian編程 Linux/uClinux/Unix編程 Windows編程 matlab源程序 php源碼下載 asp.net源碼下載 java源碼下載匯編編程驅動程序單片機編程數值算法/人工智能

您的位置：電子發燒友網>源碼下載>數值算法/人工智能>

一種解決連續問題的真實在線自然梯度行動者-評論家算法

大小：0.85 MB 人氣： 2017-12-19 需要積分：0

推薦 + 挑錯 + 收藏(0) + 用戶評論（0）

前往下載地址

分享到:

標簽：

　　策略梯度作為一種能有效解決連續空間決策問題的方法被廣泛研究．然而，由于在策略估計過程中存在較大的方差，因此基于策略梯度的方法往往受到樣本利用率低、收斂速度幔等限制．針對該問題。提出了真實在線增量式自然梯度行動者一評論家算法（TOINAC）.TOINAC算法采用優于傳統梯度的自然梯度，在真實在線時間差分（TOTD）算法的基礎上。提出了一種新型的向前觀點，改進了自然梯度行動者一評論家算法．在評論家部分，利用TOTD算法高效性的特點來估計值函數：在行動者部分。引入一種新的向前觀點來估計自然梯度。再利用資格跡將自然梯度估計變為在線估計。提高了自然梯度估計的準確性和算法的效率．將TOINAC算法與核方法以及正態策略分布結合，解決連續空間問題．最后。在平衡桿、Mountain Car、以及Acrobot等連續問題上進行了仿真實驗。驗證算法的有效性．

一種解決連續問題的真實在線自然梯度行動者-評論家算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

下載地址

不能下載？請通知我們

一種解決連續問題的真實在線自然梯度行動者-評論家算法下載

普通下載普通下載

用戶評論

發表評論即可獲得積分！ 詳見積分規則

發表評論

用戶評論

評價:好評中評差評

發表評論，獲取積分！請遵守相關規定！

or

注冊會員

游客:

分享你我的電子世界

上傳我的電子資料

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

一種解決連續問題的真實在線自然梯度行動者-評論家算法

下載地址

一種解決連續問題的真實在線自然梯度行動者-評論家算法下載

相關電子資料下載

用戶評論

發表評論

分享你我的電子世界

實用電子設計資料下載

源碼下載排行

熱門詞