?

首頁(yè): 電子電路圖,電子技術(shù)資料網(wǎng)站首頁(yè)

電子資料下載: 電子資料下載頻道 -- 為電子工程師提供激發(fā)創(chuàng)新靈感的新方案、新的參考設(shè)計(jì)、新的設(shè)計(jì)構(gòu)想等可下載的電子資料！

電子技術(shù)應(yīng)用: 電子技術(shù)應(yīng)用頻道 -- 為電子工程師提供電子產(chǎn)品設(shè)計(jì)所需的技術(shù)分析、設(shè)計(jì)技巧、設(shè)計(jì)工具、測(cè)試工具等技術(shù)文章！

電子元器件: 專業(yè)的電子元器件平臺(tái) -- 及時(shí)發(fā)布大量最新IC、分立器件、模組等電子元器件產(chǎn)品信息！

電子電路圖: 電路圖頻道 -- 提供電子電路圖,原理圖,汽車電路圖,手機(jī)電路圖,功放電路圖,電源電路圖等電路圖紙

電子技術(shù)論壇: 構(gòu)建電子工程師交流的平臺(tái) -- 在交流中進(jìn)一步學(xué)習(xí)設(shè)計(jì)技巧、規(guī)劃技術(shù)人生、提升自我價(jià)值！

源碼下載: 源碼下載頻道; uCOS編程 C/C++語(yǔ)言編程 Symbian編程 Linux/uClinux/Unix編程 Windows編程 matlab源程序 php源碼下載 asp.net源碼下載 java源碼下載匯編編程驅(qū)動(dòng)程序單片機(jī)編程數(shù)值算法/人工智能

您的位置：電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

從AlphaGo談直覺學(xué)習(xí)到整體知識(shí)

大小：0.06 MB 人氣： 2017-10-12 需要積分：1

推薦 + 挑錯(cuò) + 收藏(0) + 用戶評(píng)論（0）

前往下載地址

分享到:

標(biāo)簽：AlphaGo(27503)

　谷歌AlphaGo最近戰(zhàn)勝了歐洲頂尖職業(yè)圍棋玩家，這一壯舉被廣泛認(rèn)為是人工智能（AI）的重大突破，因?yàn)锳lphaGo所具有的功能（圍棋的復(fù)雜度是國(guó)際象棋的指數(shù)倍）以及出現(xiàn)的時(shí)間（比預(yù)期要早出現(xiàn)許多）。它的產(chǎn)生所帶來的飛躍就像是發(fā)達(dá)肌肉和大腦，前者在計(jì)算能力上大幅增加，后者創(chuàng)新組合建立好的算法。
　　
　　這項(xiàng)突破以及它實(shí)現(xiàn)的方式可能會(huì)對(duì)未來IA帶來對(duì)立的觀點(diǎn)：任一當(dāng)前概念框架都是最好的選擇，隨著健壯的機(jī)器變得更聰明，它們遲早會(huì)超過它們的人類制造者；或者這是一種迷惑，可能讓更健壯的機(jī)器和無助的人類陷入其中。
　　AlphaGo和DeepMind的開發(fā)人員可以在這困境中指出一條整體出路嗎？
　　來源分類法
　　借用斯賓諾莎的話，人們可以從考慮來源知識(shí)類別開始：
　　第一類是通過我們的感官（視覺，聽覺，嗅覺，觸覺）或信念（通過我們共同的“感覺”作為培育）來實(shí)現(xiàn)。這一類天生容易受環(huán)境和偏見影響。第二類是通過內(nèi)置推理，即符號(hào)表示的心理過程。其目的是普及和開放分析，但它無法保證與實(shí)際現(xiàn)實(shí)的一致性。第三類是通過哲學(xué)實(shí)現(xiàn)，它本質(zhì)上將認(rèn)知，直覺和符號(hào)表示結(jié)合。
　　然而對(duì)于第一點(diǎn)不會(huì)有太多的爭(zhēng)議，第三類對(duì)哲學(xué)原理有廣泛的空間，從宗教到科學(xué)，集體意識(shí)形態(tài)，或精神超越。隨著今天的知識(shí)橫跨智能設(shè)備，并由群眾智慧驅(qū)動(dòng)，哲學(xué)似乎更關(guān)注大數(shù)據(jù)而不是它原本關(guān)注的領(lǐng)域。
　　盡管（或者是因?yàn)椋┧闹攸c(diǎn)是第二類，AlphaGo和它的創(chuàng)建者的壯舉仍然可以為整個(gè)人工智能的努力帶來一些經(jīng)驗(yàn)。
　　表示分類法
　　如前所述，IA支持范式的有效性已經(jīng)由指數(shù)形式增長(zhǎng)的數(shù)據(jù)和處理能力支撐著。毫不奇怪，那些范式在知識(shí)來源，隱式感覺，顯式推理上與兩種基本的表示形式有關(guān)：
　　基于符號(hào)表示的設(shè)計(jì)可以處理顯式信息：數(shù)據(jù)被“解釋”成信息，然后當(dāng)做知識(shí)使用，用來主導(dǎo)行為?；?a href='http://www.xsypw.cn/tags/神經(jīng)網(wǎng)絡(luò)/' target='_blank' class='arckwlink_none'>神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)具有處理隱式信息的特征：數(shù)據(jù)被“編譯”成神經(jīng)元連接，他們的權(quán)重（可以理解為知識(shí)）根據(jù)行為反饋迭代地進(jìn)行調(diào)整。
　　由于該二元性反映了人類的認(rèn)知能力，建立在這些設(shè)計(jì)上的聰明機(jī)器是為了將合理性與有效性結(jié)合：
　　符號(hào)表示支持兩端的透明性和方式的溯源性，可以對(duì)目的性，實(shí)際性或社會(huì)性進(jìn)行分類。神經(jīng)網(wǎng)絡(luò)，在它們學(xué)習(xí)內(nèi)核的幫助下，可以直接在數(shù)據(jù)上操作，加快了具體目標(biāo)的實(shí)現(xiàn)，這基于支持知識(shí)，這些知識(shí)隱式地以加權(quán)連接呈現(xiàn)。
　　這種方法的潛能已經(jīng)由基于互聯(lián)網(wǎng)的語(yǔ)言處理展現(xiàn)了：實(shí)際的關(guān)聯(lián)分析“觀察”了數(shù)以億計(jì)的話語(yǔ)，它們正在逐步補(bǔ)充甚至取代基于Web解析器的語(yǔ)法語(yǔ)義規(guī)則。
　　在這一點(diǎn)上，AlphaGo有它的野心，因?yàn)樗惶幚矸欠?hào)的輸入，即圍棋高手玩家落子的集合（共約3千萬）。但是，這個(gè)限制也可以成為一個(gè)優(yōu)勢(shì)，因?yàn)樗鼛砹送|(zhì)性和透明性，使得算法有了更高效的組合：健壯的組合用來進(jìn)行實(shí)際行動(dòng)，使用最好玩家的直覺知識(shí)，聰明的組合用來進(jìn)行推斷行動(dòng)、計(jì)劃和策略。
　　教它們?nèi)绾螀f(xié)同工作，可以說是這項(xiàng)突破的關(guān)鍵因素。
　　學(xué)習(xí)分類法
　　對(duì)于智能機(jī)器，應(yīng)該可以預(yù)料到，它們驕人的成就完全取決于它們的學(xué)習(xí)能力。而這些能力通常分別運(yùn)用到隱式（或是非符號(hào)）和顯式（或是符號(hào)）內(nèi)容上，讓它們?cè)谕粋€(gè)認(rèn)知引擎的管控之下，就如人腦通常那樣，這也成為IA的長(zhǎng)期首要目標(biāo)。
　　實(shí)際上，這已經(jīng)由神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了，它將監(jiān)督式和非監(jiān)督式學(xué)習(xí)結(jié)合：人類專家?guī)椭到y(tǒng)去其糟粕，然后通過系統(tǒng)自己百萬次的訓(xùn)練來提高它們的專長(zhǎng)。
　　然而，領(lǐng)先的AI玩家的成就已經(jīng)揭露出了這些解決方案的局限性，即扮演最好人類玩家并打敗他們性質(zhì)上的差距。而前者的結(jié)果可以通過似然決策得出，后者需要原始方案的開發(fā)，這就帶來了定量和定性的障礙：
　　與實(shí)際動(dòng)作相反，可能的動(dòng)作沒有限制，因此在搜索樹中以指數(shù)形式增長(zhǎng)。原始計(jì)劃根據(jù)估值和策略制定。
　　通過單個(gè)方案克服這兩個(gè)挑戰(zhàn)，可以說是DeepMind工程師的關(guān)鍵成就。
　　掌握搜索樹的廣度和深度
　　使用神經(jīng)網(wǎng)絡(luò)對(duì)實(shí)際狀態(tài)評(píng)估以及來自于搜索樹中以指數(shù)形式增長(zhǎng)的廣度和深度的策略采樣。然而蒙特卡洛樹搜索（MCTS）算法可以用來解決這個(gè)問題，用有限的能力擴(kuò)大處理性能仍然只能處理樹較淺的部分；直到DeepMind的工程師將MCTS運(yùn)用到分層的估值和策略網(wǎng)絡(luò)上，成功解除了深度的障礙。
　　AlphaGo無縫使用了分層的網(wǎng)絡(luò)（即深度卷積神經(jīng)網(wǎng)絡(luò)）進(jìn)行直覺學(xué)習(xí)，強(qiáng)化，評(píng)估和策略，圍棋的棋盤和規(guī)則（與國(guó)際象棋一樣，無差異性移動(dòng)和搜索陷阱）的同質(zhì)性使之成為可能。
　　從直覺到知識(shí)
　　人類是唯一能夠?qū)⒅庇X（隱式的）和符號(hào)（顯式的）知識(shí)結(jié)合起來的物種，人類具有這樣的雙重能力，將前者轉(zhuǎn)換成后者，然后通過后者的反饋反過來改善前者。
　　用在機(jī)器學(xué)習(xí)方面的話需要監(jiān)督式和非監(jiān)督式學(xué)習(xí)的連續(xù)性，這應(yīng)該可以通過神經(jīng)網(wǎng)絡(luò)達(dá)到，這種神經(jīng)網(wǎng)絡(luò)可以用來符號(hào)表示和處理原始數(shù)據(jù)：
　　從顯式到隱式：為特定情境和目的建立的符號(hào)描述將被輸入到神經(jīng)網(wǎng)絡(luò)之中，在目標(biāo)環(huán)境的數(shù)據(jù)上進(jìn)行測(cè)試和改善。從隱式到顯式：一旦通過百萬次在相關(guān)目標(biāo)上運(yùn)行對(duì)設(shè)計(jì)進(jìn)行了測(cè)試和強(qiáng)化，將有可能對(duì)結(jié)果重新設(shè)計(jì)，用來改善符號(hào)描述。
　　然而深度符號(hào)知識(shí)的非監(jiān)督式學(xué)習(xí)超出了智能機(jī)器的范圍，顯著的結(jié)果可以在“平坦”的語(yǔ)義環(huán)境下得到，比如，如果同一個(gè)語(yǔ)義可以用來評(píng)估網(wǎng)絡(luò)狀態(tài)和策略：
　　在百萬次落子中由人類專家觀察到的直覺部分的監(jiān)督式學(xué)習(xí)。自我對(duì)弈中的非監(jiān)督式強(qiáng)化學(xué)習(xí)。使用蒙特卡洛樹搜索（MCTS）構(gòu)建，評(píng)估和完善自我策略的規(guī)劃和決策。
　　沒有圍棋整體性的性質(zhì)，將不可能有這種深度和無縫的集成。
　　美學(xué)評(píng)估和整體知識(shí)
　　圍棋的特異性是雙重的，定量側(cè)的復(fù)雜性，定性側(cè)的簡(jiǎn)單性，前者是后者的代價(jià)。
　　與國(guó)際象棋相比，圍棋的實(shí)際位置和潛在落子方式只能由整個(gè)棋盤進(jìn)行評(píng)估，它使用了一個(gè)最具美學(xué)的標(biāo)準(zhǔn)，不會(huì)簡(jiǎn)化成任意度量和手工制作的專家規(guī)則。玩家不會(huì)在詳細(xì)分析當(dāng)前位置和評(píng)估可供選擇方案后再落子，而是根據(jù)他們的對(duì)棋盤的直覺。
　　因此，AlphaGo的行為會(huì)完全按照上面所說的第二層次的知識(shí)進(jìn)行：
　　作為游戲玩家，它可以從實(shí)際現(xiàn)實(shí)考慮中分離。作為圍棋玩家，不需要解決任何語(yǔ)義復(fù)雜性。
　　給予足夠的計(jì)算能力，DeepMind工程師的主要挑戰(zhàn)是教AlphaGo將它的美學(xué)直覺轉(zhuǎn)換成整體知識(shí)，而不需要定義它們的實(shí)質(zhì)。
?

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

下載地址

不能下載？請(qǐng)通知我們

從AlphaGo談直覺學(xué)習(xí)到整體知識(shí)下載

普通下載普通下載

用戶評(píng)論

發(fā)表評(píng)論即可獲得積分！ 詳見積分規(guī)則

發(fā)表評(píng)論

用戶評(píng)論

評(píng)價(jià):好評(píng)中評(píng)差評(píng)

發(fā)表評(píng)論，獲取積分！請(qǐng)遵守相關(guān)規(guī)定！

or

注冊(cè)會(huì)員

游客:

分享你我的電子世界

上傳我的電子資料

實(shí)用電子設(shè)計(jì)資料下載

51單片機(jī)學(xué)習(xí)資料打包 103080
華為硬件工程師手冊(cè) 101834
接口電路圖大全 91558
電工學(xué)視頻教程(免費(fèi)下載) 89663
手機(jī)電路原理及檢修 75276
最全的芯片封裝方式(圖文對(duì)照) 66327
usb3.0驅(qū)動(dòng)下載,xp程序 63815
PCB高級(jí)設(shè)計(jì)系列講座 (開發(fā)公司值1萬元) 63689
電工基礎(chǔ)課件免費(fèi)下載 50213
電子電路大全合訂本 45495

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

從AlphaGo談直覺學(xué)習(xí)到整體知識(shí)

下載地址

從AlphaGo談直覺學(xué)習(xí)到整體知識(shí)下載

相關(guān)電子資料下載

用戶評(píng)論

發(fā)表評(píng)論

分享你我的電子世界

實(shí)用電子設(shè)計(jì)資料下載

源碼下載排行

熱門詞