在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

電子發燒友App

硬聲App

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示
電子發燒友網>電子資料下載>傳感與控制>圍棋人工智能基本原理及其意義

圍棋人工智能基本原理及其意義

2017-09-13 | rar | 2.78 MB | 次下載 | 免費

資料介紹

  人工智能(Artificial Intelligence,AI)主要研究人類思

  維、行動中那些尚未算法化的功能行為, 使機器像人的大

  腦一樣思考、行動。長期以來, 圍棋作為一種智力博弈游

  戲, 以其變化莫測的博弈局面, 高度體現了人類的智慧, 為

  人工智能研究提供了一個很好的測試平臺, 圍棋人工智能

  也是人工智能領域的一個重要挑戰。

  傳統的計算機下棋程序的基本原理, 是通過有限步數

  的搜索樹, 即采用數學和邏輯推理方法, 把每一種可能的

  路徑都走一遍, 從中選舉出最優路徑, 使得棋局勝算最大。

  這種下棋思路是充分發揮計算機運算速度快、運算量大等

  優勢的“暴力搜索法”, 是人類在對弈規定的時間限制內無

  法做到的。但是由于圍棋局面數量太大, 這樣的運算量對

  于計算機來講也是相當之大, 目前的計算機硬件無法在對

  弈規定的時間內, 使用計算機占絕對優勢的“暴力搜索法”

  完成圍棋所有局面的擇優, 所以這樣的下棋思路不適用于

  圍棋對弈。

  搜索量巨大的問題一直困擾著圍棋人工智能, 使其發

  展停滯不前,直到2 0 0 6 年, 蒙特卡羅樹搜索的應用出現,

  才使得圍棋人工智能進入了嶄新的階段, 現代圍棋人工智

  能的主要算法是基于蒙特卡洛樹的優化搜索。

  2 圍棋人工智能基本原理

  目前圍棋人工智能最杰出的代表, 是由谷歌旗下人工

  智能公司DeepMind創造的AlphaGo圍棋人工智能系統。它

  在與人類頂級圍棋棋手的對弈中充分發揮了其搜索和計

  算的優勢, 幾乎在圍棋界立于不敗之地。

  Alph a G o系統的基本原理是將深度強化學習方法與蒙

  特卡洛樹搜索結合, 使用有監督學習策略網絡和價值網

  絡, 極大減少了搜索空間, 即在搜索過程中的計算量, 提高

  了對棋局估計的準確度。

  2.1 深度強化學習方法

  深度學習源于人工神經網絡的研究, 人類大量的視覺

  聽覺信號的感知處理都是下意識的, 是基于大腦皮層神經

  網絡的學習方法, 通過模擬大腦皮層推斷分析數據的復雜

  層狀網絡結構, 使用包含復雜結構或由多重非線性變換構

  成的多個處理層對數據進行高層抽象, 其過程類似于人們

  識別物體標注圖片。現如今, 應用最廣泛的深度學習模型

  包括: 卷積神經網絡、深度置信網絡、堆棧自編碼網絡和遞

  歸神經網絡等。

  強化學習源于動物學習、參數擾動自適應控制等理

  論, 通過模擬生物對環境以試錯的方式進行交互達到對環

  境的最優適應的方式, 通過不斷地反復試驗, 將變化無常

  的動態情況與對應動作相匹配。強化學習系統設置狀態、

  動作、狀態轉移概率和獎賞四個部分, 在當前狀態下根據

  策略選擇動作, 執行該過程并以當前轉移概率轉移到下一

  狀態, 同時接收環境反饋回來的獎賞, 最終通過調整策略

  來最大化累積獎賞。

  深度學習具有較強的感知能力, 但缺乏一定的決策能

  力; 強化學習具有決策能力, 同樣對感知問題無能為力。深

  度強化學習方法是將具有感知能力的深度學習和具有決

  策能力的強化學習結合起來, 優勢互補, 用深度學習進行

  感知, 從環境中獲取目標觀測信息, 提供當前環境下的狀

  態信息; 然后用強化學習進行決策, 將當前狀態映射到相

  應動作, 基于初期匯報評判動作價值。

  深度強化學習為復雜系統的感知決策問題提供了一

  種全新的解決思路。

  2.2 蒙特卡洛樹搜索

  蒙特卡洛樹搜索是將蒙特卡洛方法與樹搜索相結合

  形成的一種搜索方法。所謂蒙特卡洛方法是一種以概率統

  計理論為指導的強化學習方法, 它通常解決某些隨機事件

  出現的概率問題, 或者是某隨機變量的期望值等數字特征

  問題。通過與環境的交互, 從所采集的樣本中學習, 獲得關

  于決策過程的狀態、動作和獎賞的大量數據, 最后計算出

  累積獎賞的平均值。

  蒙特卡洛樹搜索算法是一種用于解決完美信息博弈

  (perfect information games,沒有任何信息被隱藏的游戲)

  的方法,主要包含選擇(Selection)、擴展(Expansion)、模擬

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1TC358743XBG評估板參考手冊
  2. 1.36 MB  |  330次下載  |  免費
  3. 2開關電源基礎知識
  4. 5.73 MB  |  11次下載  |  免費
  5. 3100W短波放大電路圖
  6. 0.05 MB  |  4次下載  |  3 積分
  7. 4嵌入式linux-聊天程序設計
  8. 0.60 MB  |  3次下載  |  免費
  9. 5DIY動手組裝LED電子顯示屏
  10. 0.98 MB  |  3次下載  |  免費
  11. 6基于FPGA的C8051F單片機開發板設計
  12. 0.70 MB  |  2次下載  |  免費
  13. 751單片機PM2.5檢測系統程序
  14. 0.83 MB  |  2次下載  |  免費
  15. 8基于51單片機的RGB調色燈程序仿真
  16. 0.86 MB  |  2次下載  |  免費

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234315次下載  |  免費
  3. 2555集成電路應用800例(新編版)
  4. 0.00 MB  |  33566次下載  |  免費
  5. 3接口電路圖大全
  6. 未知  |  30323次下載  |  免費
  7. 4開關電源設計實例指南
  8. 未知  |  21549次下載  |  免費
  9. 5電氣工程師手冊免費下載(新編第二版pdf電子書)
  10. 0.00 MB  |  15349次下載  |  免費
  11. 6數字電路基礎pdf(下載)
  12. 未知  |  13750次下載  |  免費
  13. 7電子制作實例集錦 下載
  14. 未知  |  8113次下載  |  免費
  15. 8《LED驅動電路設計》 溫德爾著
  16. 0.00 MB  |  6656次下載  |  免費

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935054次下載  |  免費
  3. 2protel99se軟件下載(可英文版轉中文版)
  4. 78.1 MB  |  537797次下載  |  免費
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420027次下載  |  免費
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234315次下載  |  免費
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費
  11. 6電路仿真軟件multisim 10.0免費下載
  12. 340992  |  191186次下載  |  免費
  13. 7十天學會AVR單片機與C語言視頻教程 下載
  14. 158M  |  183279次下載  |  免費
  15. 8proe5.0野火版下載(中文版免費下載)
  16. 未知  |  138040次下載  |  免費
主站蜘蛛池模板: 婷婷九月丁香| 你懂的视频在线看| 黄 色 片成 人免费观看| 新版天堂资源在线官网8| 22222se男人的天堂| 亚洲综合亚洲综合网成人| 美女视频永久黄网站在线观看| 亚洲乱亚洲乱妇13p| 公开免费视频| 视频色版| 夜夜偷影视| 91男人| 三级色网站| 小雪被老外黑人撑破了视频| 男人和女人在床做黄的网站| 五月天婷婷导航| 99久久综合精品免费| 日xxxx| 日本视频网站在线www色| 亚洲88av| 欧美精品人爱a欧美精品| 免费人成在线观看网站| 奇米影视7777久久精品| 成人二区| 国产乱码一区二区三区四川人| 成人午夜大片免费视频77777| 亚洲 欧美 另类 吹潮| bt天堂网在线www资源| 亚洲一区二区欧美| 欧美网站色| 久久99精品国产麻豆宅宅| 亚洲综合色网| 91色在线播放| 亚洲一区三区| 久久青草国产免费观看| 国产午夜精品一区二区三区| 婷婷在线影院| 天天射日日干| 亚洲伊人久久大香线蕉综合图片| 成年人网站在线| 天天躁夜夜躁狠狠躁2021西西|