本自同根生,相煎就是這么急。
在結(jié)束的世界人工智能圍棋大賽上,騰訊AI Lab開發(fā)的“絕藝”意外輸給了Phoenix Go,屈居第二。
Phoenix Go是微信翻譯團(tuán)隊(duì)開發(fā)的人工智能圍棋,算是“絕藝”的小弟,它們兩個(gè)都出自騰訊,可謂“同根生”。
不同的是,Phoenix Go的優(yōu)勢(shì)在于,它基于AlphaGo Zero論文實(shí)現(xiàn),同時(shí)做了若干提高訓(xùn)練效率的創(chuàng)新,并利用微信服務(wù)器的閑時(shí)計(jì)算資源進(jìn)行自我對(duì)弈。
目前,PhoenixGo已經(jīng)戰(zhàn)勝過200多位人類棋手,這次戰(zhàn)勝“絕藝”倒是出乎所有人的意外。
認(rèn)識(shí)PhoenixGo:曾被認(rèn)為是百度、阿里、Zero養(yǎng)的“金毛”
2018年初,PhoenixGo以Bensondarr等賬號(hào)在騰訊野狐圍棋上進(jìn)行實(shí)戰(zhàn),目前已經(jīng)戰(zhàn)勝200多位棋手。
在公布正式身份之前,社區(qū)、貼吧等上面關(guān)于BensonDarr的猜測(cè)眾多。
有的說BensonDarr的首字母縮寫是“BD”,就是百度的狗,也有的注意到BensonDarr從來沒有和絕藝指導(dǎo)下過棋,這很難解釋。正常的話,其它AI應(yīng)該都是非常渴望挑戰(zhàn)絕藝,因此可能是阿里的狗。
看到Bensondarr這么強(qiáng)大,也有人說是Zero。
而Bensondarr換了金毛的頭像后,就被棋友稱為金毛。
這只金毛在野狐圍棋上名氣越來越大,直到世界人工智能圍棋大賽在今年4月20日公布參賽陣容時(shí)候,它的身份首次公開:就是“絕藝”的自家兄弟PhoenixGo。
PhoenixGo是微信的幾名工程師在開發(fā)機(jī)器翻譯引擎“之余”抽空研發(fā)的AI程序。它基于AlphaGo Zero論文實(shí)現(xiàn),同時(shí)做了若干提高訓(xùn)練效率的創(chuàng)新,并利用微信服務(wù)器的閑時(shí)計(jì)算資源進(jìn)行自我對(duì)弈,緩解了Zero版本對(duì)海量資源的苛刻需求。
微信團(tuán)隊(duì)沒有公布如何基于AlphaGo Zero論文實(shí)現(xiàn),不過去年10月,DeepMind在Nature的一篇論文中,描述了AlphaGo Zero 的技術(shù)細(xì)節(jié)。
AlphaGo Zero完全不依賴于人類數(shù)據(jù),因此,這一系統(tǒng)的成功也是朝向人工智能研究長(zhǎng)期以來的目標(biāo)——?jiǎng)?chuàng)造出在沒有人類輸入的條件下,在最具挑戰(zhàn)性的領(lǐng)域?qū)崿F(xiàn)超越人類能力的算法——邁進(jìn)的一大步。
作者在論文中寫道,AlphaGo Zero 證明了即使在最具挑戰(zhàn)的領(lǐng)域,純強(qiáng)化學(xué)習(xí)的方法也是完全可行的:不需要人類的樣例或指導(dǎo),不提供基本規(guī)則以外的任何領(lǐng)域知識(shí),使用強(qiáng)化學(xué)習(xí)能夠?qū)崿F(xiàn)超越人類的水平。此外,純強(qiáng)化學(xué)習(xí)方法只花費(fèi)額外很少的訓(xùn)練時(shí)間,但相比使用人類數(shù)據(jù),實(shí)現(xiàn)了更好的漸進(jìn)性能(asymptotic performance)。
AlphaGo Zero在其他方面也與之前的版本有所不同:
AlphaGo Zero 只使用圍棋棋盤上的黑子和白子作為輸入,而上一版本的 AlphaGo 的輸入包含了少量人工設(shè)計(jì)的特征。
它只使用一個(gè)神經(jīng)網(wǎng)絡(luò),而不是兩個(gè)。以前版本的 AlphaGo 使用一個(gè)“策略網(wǎng)絡(luò)”(policy network)來選擇下一個(gè)落子位置和一個(gè)“價(jià)值網(wǎng)絡(luò)”(value network)來預(yù)測(cè)游戲的贏家。這些在 AlphaGo Zero 中是聯(lián)合進(jìn)行的,這使得它能夠更有效地進(jìn)行訓(xùn)練和評(píng)估。
AlphaGo Zero 不使用“走子演算”(rollout)——這是其他圍棋程序使用的快速、隨機(jī)游戲,用來預(yù)測(cè)哪一方將從當(dāng)前的棋局中獲勝。相反,它依賴于高質(zhì)量的神經(jīng)網(wǎng)絡(luò)來評(píng)估落子位置。
PhoenixGo對(duì)戰(zhàn)絕藝:騰訊自家兄弟的游戲
在世界人工智能圍棋大賽半決賽,PhoenixGo和絕藝分別順利擊敗Leela Zero和天算圍棋,令決賽成為騰訊兩兄弟的對(duì)決。
28日中午12:30,決賽首局開戰(zhàn)。
八冠王古力九段受邀為棋迷解說。猜到白棋的絕藝一出手就有創(chuàng)新,左下面對(duì)金毛的托扳定式,絕藝沒有采納人類耳熟能詳?shù)拇蛲暾成希亲叱龆返够⒌男率帧?/p>
隨后的進(jìn)程,絕藝一直保持著大貼目下白方的后發(fā)優(yōu)勢(shì)。不過雙方差距并未拉大。
進(jìn)入官子,執(zhí)黑的金毛在下方二路大跳,入侵白空。絕藝出人意料的脫先跑到右上扳角。嗅到機(jī)會(huì)的PhoenixGo出手狠辣,147凌空一擠,左上一隊(duì)白棋突然面臨生死之危。
突然而至的危機(jī),并不會(huì)讓AI慌亂。
實(shí)戰(zhàn)絕藝順利將大隊(duì)人馬完整連回,但是勝負(fù)的重點(diǎn)仍在他處。繼續(xù)掌控先手的PhoenixGo回到下邊,令白棋目數(shù)大幅縮水。絕藝弈出一路“金雞獨(dú)立”經(jīng)典手筋,PhoenixGo177妙手一靠還以顏色。此處戰(zhàn)罷黑棋徹底完成逆轉(zhuǎn)。
又進(jìn)行了40手,絕藝中盤認(rèn)輸。
發(fā)球局被破,絕藝的決賽之旅頓生坎坷。
第2局拿到白棋的PhoenixGo發(fā)揮出色,始終保持著貼目?jī)?yōu)勢(shì),弈至159手絕藝強(qiáng)行收下右邊官子,打破局面平衡。
面對(duì)絕藝的進(jìn)擊,PhoenixGo態(tài)度同樣強(qiáng)硬,一刀切斷黑棋19子大龍歸路。慘烈的攻殺開始,黑棋大龍幾經(jīng)輾轉(zhuǎn),弈至191手雖能從上邊鑿出縫隙回家,但要付出左上角被吃的代價(jià)。
見此情景絕藝團(tuán)隊(duì)主動(dòng)認(rèn)輸,比分變?yōu)?:0,PhoenixGo已經(jīng)提前奪冠。
最終,Phoenix Go 2:1擊敗絕藝,贏下本屆AI大賽,智能圍棋世界冠軍榜上又添新成員。
“星陣”戰(zhàn)勝柯潔,國產(chǎn)AI圍棋崛起
中國作為圍棋的發(fā)源地,在AlphaGo誕生后的幾年里也成為主要的AI圍棋源頭之一。
被同門兄弟擊敗的“絕藝”,是騰訊AI Lab于2016年3月4日開發(fā)出的AI圍棋,當(dāng)年8月絕藝就首次戰(zhàn)勝職業(yè)棋手,11月第一次戰(zhàn)勝世界冠軍棋手江維杰(野狐ID若水云寒)。
2016年11月“絕藝”首次和柯潔交手,成績(jī)一勝一負(fù);2017年2月14日以后,絕藝對(duì)野狐帽子(世界冠軍和全國冠軍)的勝率,已經(jīng)能夠穩(wěn)定在90%以上。不久前,“絕藝”還成為中國圍棋國家隊(duì)的訓(xùn)練工具。
在PhoenixGo戰(zhàn)勝絕藝的同一個(gè)賽場(chǎng)上,另一家國產(chǎn)AI圍棋“星陣”戰(zhàn)勝了柯潔。
星陣的前身是清華大學(xué)由小川團(tuán)隊(duì)研發(fā)的“神算子”,曾在比賽中戰(zhàn)勝世界冠軍孔杰九段。
據(jù)“AI前線”報(bào)道,由小川曾介紹,星陣也借鑒了AlphaGo的基本架構(gòu),但在特征體系、模型結(jié)構(gòu)、MCTS 算法架構(gòu)等方面有所創(chuàng)新,力爭(zhēng)用更少的計(jì)算資源和更少的訓(xùn)練樣本完成模型學(xué)習(xí)。
現(xiàn)在,AlphaGo已經(jīng)退休,但是它啟發(fā)的無數(shù)后來者站在巨人的肩膀上,不斷探索計(jì)算的奧秘。
-
人工智能
+關(guān)注
關(guān)注
1791文章
47279瀏覽量
238513 -
騰訊
+關(guān)注
關(guān)注
7文章
1655瀏覽量
49440
原文標(biāo)題:微信AI圍棋絕殺同門師兄“絕藝”,國產(chǎn)AI圍棋崛起
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論