電子發燒友網>電子資料下載>傳感與控制>圍棋人工智能基本原理及其意義

圍棋人工智能基本原理及其意義

2474220 2017-09-13 | rar | 2.78 MB | 次下載 | 免費

普通下載普通下載

資料介紹

　　人工智能（Artificial Intelligence，AI）主要研究人類思

　　維、行動中那些尚未算法化的功能行為，使機器像人的大

　　腦一樣思考、行動。長期以來，圍棋作為一種智力博弈游

　　戲，以其變化莫測的博弈局面，高度體現了人類的智慧，為

　　人工智能研究提供了一個很好的測試平臺，圍棋人工智能

　　也是人工智能領域的一個重要挑戰。

　　傳統的計算機下棋程序的基本原理，是通過有限步數

　　的搜索樹，即采用數學和邏輯推理方法，把每一種可能的

　　路徑都走一遍，從中選舉出最優路徑，使得棋局勝算最大。

　　這種下棋思路是充分發揮計算機運算速度快、運算量大等

　　優勢的“暴力搜索法”，是人類在對弈規定的時間限制內無

　　法做到的。但是由于圍棋局面數量太大，這樣的運算量對

　　于計算機來講也是相當之大，目前的計算機硬件無法在對

　　弈規定的時間內，使用計算機占絕對優勢的“暴力搜索法”

　　完成圍棋所有局面的擇優，所以這樣的下棋思路不適用于

　　圍棋對弈。

　　搜索量巨大的問題一直困擾著圍棋人工智能，使其發

　　展停滯不前，直到2 0 0 6 年，蒙特卡羅樹搜索的應用出現，

　　才使得圍棋人工智能進入了嶄新的階段，現代圍棋人工智

　　能的主要算法是基于蒙特卡洛樹的優化搜索。

　　2 圍棋人工智能基本原理

　　目前圍棋人工智能最杰出的代表，是由谷歌旗下人工

　　智能公司DeepMind創造的AlphaGo圍棋人工智能系統。它

　　在與人類頂級圍棋棋手的對弈中充分發揮了其搜索和計

　　算的優勢，幾乎在圍棋界立于不敗之地。

　　Alph a G o系統的基本原理是將深度強化學習方法與蒙

　　特卡洛樹搜索結合，使用有監督學習策略網絡和價值網

　　絡，極大減少了搜索空間，即在搜索過程中的計算量，提高

　　了對棋局估計的準確度。

　　2.1 深度強化學習方法

　　深度學習源于人工神經網絡的研究，人類大量的視覺

　　聽覺信號的感知處理都是下意識的，是基于大腦皮層神經

　　網絡的學習方法，通過模擬大腦皮層推斷分析數據的復雜

　　層狀網絡結構，使用包含復雜結構或由多重非線性變換構

　　成的多個處理層對數據進行高層抽象，其過程類似于人們

　　識別物體標注圖片。現如今，應用最廣泛的深度學習模型

　　包括：卷積神經網絡、深度置信網絡、堆棧自編碼網絡和遞

　　歸神經網絡等。

　　強化學習源于動物學習、參數擾動自適應控制等理

　　論，通過模擬生物對環境以試錯的方式進行交互達到對環

　　境的最優適應的方式，通過不斷地反復試驗，將變化無常

　　的動態情況與對應動作相匹配。強化學習系統設置狀態、

　　動作、狀態轉移概率和獎賞四個部分，在當前狀態下根據

　　策略選擇動作，執行該過程并以當前轉移概率轉移到下一

　　狀態，同時接收環境反饋回來的獎賞，最終通過調整策略

　　來最大化累積獎賞。

　　深度學習具有較強的感知能力，但缺乏一定的決策能

　　力；強化學習具有決策能力，同樣對感知問題無能為力。深

　　度強化學習方法是將具有感知能力的深度學習和具有決

　　策能力的強化學習結合起來，優勢互補，用深度學習進行

　　感知，從環境中獲取目標觀測信息，提供當前環境下的狀

　　態信息；然后用強化學習進行決策，將當前狀態映射到相

　　應動作，基于初期匯報評判動作價值。

　　深度強化學習為復雜系統的感知決策問題提供了一

　　種全新的解決思路。

　　2.2 蒙特卡洛樹搜索

　　蒙特卡洛樹搜索是將蒙特卡洛方法與樹搜索相結合

　　形成的一種搜索方法。所謂蒙特卡洛方法是一種以概率統

　　計理論為指導的強化學習方法，它通常解決某些隨機事件

　　出現的概率問題，或者是某隨機變量的期望值等數字特征

　　問題。通過與環境的交互，從所采集的樣本中學習，獲得關

　　于決策過程的狀態、動作和獎賞的大量數據，最后計算出

　　累積獎賞的平均值。

　　蒙特卡洛樹搜索算法是一種用于解決完美信息博弈

　　（perfect information games，沒有任何信息被隱藏的游戲）

　　的方法，主要包含選擇（Selection）、擴展（Expansion）、模擬

下載該資料的人也在下載下載該資料的人還在閱讀

更多 >

LLM預訓練的基本概念、基本原理和主要優勢 697次閱讀
人工智能模型有哪些 421次閱讀
人工智能深度學習的五大模型及其應用領域 2148次閱讀
神經網絡的基本原理 641次閱讀
人工智能中文本分類的基本原理和關鍵技術 946次閱讀
無功補償裝置的基本原理及作用 500次閱讀
無功補償的意義及基本原理 439次閱讀
什么是人工智能上百個人工智能的經典問答 6027次閱讀
淺析單片機中PWM的基本概念和基本原理 1.1w次閱讀
六張圖看懂人工智能的前世今生 4329次閱讀
騰訊微信翻譯團隊開源的人工智能圍棋項目 PhoenixGo 5788次閱讀
人工智能為何這么熱_人工智能價值與應用_無人機屬于人工智能嗎 7410次閱讀
人工智能需要哪些知識_人工智能需要學什么_如何自學人工智能 4.4w次閱讀
為什么要發展人工智能_發展人工智能經濟意義分析 4.8w次閱讀
“人工智能＋”或再掀新一輪熱潮經濟形態迎巨變 475次閱讀

1TC358743XBG評估板參考手冊
1.36 MB | 330次下載 | 免費
2開關電源基礎知識
5.73 MB | 11次下載 | 免費
3100W短波放大電路圖
0.05 MB | 4次下載 | 3 積分
4嵌入式linux-聊天程序設計
0.60 MB | 3次下載 | 免費
5DIY動手組裝LED電子顯示屏
0.98 MB | 3次下載 | 免費
6基于FPGA的C8051F單片機開發板設計
0.70 MB | 2次下載 | 免費
751單片機PM2.5檢測系統程序
0.83 MB | 2次下載 | 免費
8基于51單片機的RGB調色燈程序仿真
0.86 MB | 2次下載 | 免費

本月

1OrCAD10.5下載OrCAD10.5中文版軟件
0.00 MB | 234315次下載 | 免費
2555集成電路應用800例(新編版)
0.00 MB | 33566次下載 | 免費
3接口電路圖大全
未知 | 30323次下載 | 免費
4開關電源設計實例指南
未知 | 21549次下載 | 免費
5電氣工程師手冊免費下載(新編第二版pdf電子書)
0.00 MB | 15349次下載 | 免費
6數字電路基礎pdf(下載)
未知 | 13750次下載 | 免費
7電子制作實例集錦下載
未知 | 8113次下載 | 免費
8《LED驅動電路設計》溫德爾著
0.00 MB | 6656次下載 | 免費

總榜

1matlab軟件下載入口
未知 | 935054次下載 | 免費
2protel99se軟件下載(可英文版轉中文版)
78.1 MB | 537797次下載 | 免費
3MATLAB 7.1 下載 (含軟件介紹)
未知 | 420027次下載 | 免費
4OrCAD10.5下載OrCAD10.5中文版軟件
0.00 MB | 234315次下載 | 免費
5Altium DXP2002下載入口
未知 | 233046次下載 | 免費
6電路仿真軟件multisim 10.0免費下載
340992 | 191186次下載 | 免費
7十天學會AVR單片機與C語言視頻教程下載
158M | 183279次下載 | 免費
8proe5.0野火版下載(中文版免費下載)
未知 | 138040次下載 | 免費

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

圍棋人工智能基本原理及其意義

資料介紹

評論

下載排行

本周

本月

總榜