《星際爭霸II》作為游戲玩家心目中即時戰略游戲的經典之作,它的“即時”和“戰略”特性,使其成為深度強化學習和博弈決策智能算法研究的重要平臺。通過游戲研究AGI技術,英國有DeepMind,美國有OpenAI,那么中國呢?
“二十年后,伴你遨游太空、探索星際的是人?還是AI?
或許是這位星際指揮官。”
《星際爭霸II》作為游戲玩家心目中即時戰略游戲的經典之作,它的“即時”和“戰略”特性,使其成為深度強化學習和博弈決策智能算法研究的重要平臺。
包括DeepMind在內的世界頂尖AI團隊也在攻堅《星際爭霸II》。其背后擁有一個共同的終極目標——進一步拓展AI邊界,并為最終達到通用人工智能(AGI)探索道路。
AI打星際有多“硬核”?
星際是有史以來電子競技領域最經典的游戲之一,也被認為是最有挑戰的即時戰略(RTS)游戲。今天,之所以成為AI研究的主要平臺和工具,是因為其蘊含了下述多方面的挑戰,一旦取得技術突破,將擁有廣泛的應用場景。
那么,用AI打星際有多“硬核”?難點和挑戰在哪?
挑戰一:層次化的體系博弈
星際實質上蘊含了一套層次化的博弈體系,它包括宏觀經濟實力的比拼、科技與兵種的相互克制、戰役戰術上的指揮對戰、各編隊單位的微觀操控等。如何能讓AI學會并進行上述多層次的決策,而不是在某一層級上進行學習,是個非常大的挑戰。
挑戰二:決策空間復雜度巨大
圍棋的決策動作空間不超過361,而星際的決策動作空間是10的26次方,由決策時機、決策指令、決策主體、決策目標等多維度的決策因素組合而成。
挑戰三:非完全信息動態博弈
對比圍棋或者象棋等完全信息下的博弈,星際擁有“戰爭迷霧”機制,你無法在任意時刻得知對手完整的信息,必須通過主動偵察和對手建模來推測對手策略。相對于德撲的非完全信息博弈,星際又體現了動態性,上一時刻偵察所獲取的信息,下一時刻又可能變化了。
挑戰四:大規模多單位協作
星際的戰斗部分需要指揮多兵種、上百個單位進行協作配合。相對來講,《DOTA2》、《王者榮耀》游戲AI只需要5個單位進行協作配合。
挑戰五:毫秒級實時決策
星際作為即時戰略游戲,要和職業選手(平均每分鐘300次操作)進行對抗,要求AI能夠在一秒鐘之內做出多次快速決策,這對AI算法模型的性能、工程實現的效率帶來非常大的挑戰。
中國的“星際之王”是誰?
通過游戲研究AGI技術,英國有DeepMind,美國有OpenAI,中國呢?
啟元世界希望是一個答案。
啟元世界自2017年成立,便開始基于《星際爭霸II》研究決策智能、開發智能體,探索AGI之路。
繼2018年5月在北大ACM總決賽期間發布基于星際的人機協作對抗賽、11月在加拿大AIIDE策略博弈研討會展示自學習戰術指揮官、12月獲得NeurIPS多智能體競賽Learning組冠軍之后,2019年以來啟元星際指揮官又實現了重要突破。
目前啟元“星際指揮官”(簡稱“星指”),已能夠在全場游戲(full game)中與業余高手過招較量,從宏觀到微觀博弈上展現出若干智能行為:如因地制宜地發展經濟與科技、有條不紊地安排建造與布局、審時度勢地進行偵察和攻擊、指揮上百個單位進行協同作戰等。
啟元與星際指揮官成長歷程
“星指”要挑戰職業玩家,你敢不敢來?
實現高水平的《星際爭霸II》對弈,代表了AI在復雜電子游戲中取得的重大突破。但對于啟元世界來說,星際AI的作用遠不止于打打游戲如此簡單,最終的目標是將其中研發的技術應用到現實世界,從博弈決策到網絡調度,從數字娛樂到機器人控制,都不乏應用場景。
啟元“星際指揮官”今年9月正式在北京亮相,開始挑戰職業玩家!屆時將舉辦一系列線下比賽和線上直播,現場抽取星際發燒友與"星指"面對面切磋,感受AI智能體的激情與魅力,感興趣的朋友可以點擊閱讀原文報名哦~
-
AI
+關注
關注
87文章
31097瀏覽量
269430 -
強化學習
+關注
關注
4文章
268瀏覽量
11267 -
DeepMind
+關注
關注
0文章
130瀏覽量
10881
原文標題:硬核!繼DeepMind之后,首個中國AI挑戰《星際爭霸II》
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論