游戲和模擬從一開始就是DeepMind研究計劃的核心部分,這種方法已經在人工智能研究上取得了重大突破。作為一名前視頻游戲設計師,我對于和Unity達成合作,創建虛擬環境以開發、測試用于解決實際問題的智能、靈活算法感到興奮?!狣eepMind聯合創始人兼CEO Demis Hassabis
近日,Unity在幾位“游戲設計師”的幫助下徹底火了。
先是登頂steam熱銷榜的國產武俠游戲《太吾繪卷》,由于代碼遭泄露,只有一個main(x)、上萬個if、全用字符串……這些非常規操作讓一眾網友把游戲內核“蛐蛐”吹成了新一代錦鯉。之后,熟悉Unity的玩家開始陸續辟謠,指出主創寫游戲用的引擎是Unity,之所以全是字符串,是因為其中內置的PlayMaker可以調整變量數據類型。
無論是游戲營銷還是無心造謠,這個事件凸顯了Unity在游戲制作上的專業和易上手。事實上,Unity是現在受眾最廣的實時開發平臺,從市場規模上看,它占全球AR/VR內容創作的60%,在移動游戲創作上也占了全球的50%。
而除去簡單易用這個特征,Unity的最著名的靈活性也使開發人員能夠針對25個平臺定位和優化他們的創作,包括Xbox One、PlayStation 4、Gameroom(Facebook)、SteamVR(PC和Mac)、Oculus、PSVR、Gear VR、HoloLens、ARKit(Apple)、ARCore(谷歌)等。
另一個“游戲設計師”是DeepMind的哈薩比斯。26日,DeepMind宣布和Unity達成合作,由前者的研究人員使用Unity創建虛擬環境,進一步開展基礎AI研究,而后者能利用這些成果,為游戲開發者提供最新的機器學習技術。
說起DeepMind,相信國內讀者對這個名字不會陌生。無論是2014年被谷歌天價收購,還是2016年用深度強化學習系統AlphaGo擊敗韓國棋手李世石,還是2017年AlphaGo擊敗中國棋手柯潔,這家受神經科學啟發的人工智能公司一直走在科技前沿。自2010年在倫敦成立以來,DeepMind已經共計發表了兩百余篇同行評審論文,其中有6篇被刊登在《Nature》等頂級科學期刊上,這是計算機科學實驗室的一個史無前例的記錄。
截至目前,雙方還沒有透露有關合作內容和資金往來的信息,但有資料顯示,早在今年6月,Unity就已將開始向DeepMind的兄弟部門——谷歌云上的網絡游戲開發商提供服務。
合作的意義
智能設計和進化不僅是人類世界觀的一個分支,它也是人工智能社區的一個分支。直到幾年前,學界研究的AI還僅限于編碼智能算法,比如銀行欺詐檢測和玩獨立小游戲。但是對于大型復雜環境,比起人為硬編碼,“直覺”算法更能提升機器學習AI的整體表現。因此在現實場景中模擬智能是AI研究下一階段的重要目標,作為基礎,極度逼真的房屋、高速公路等3D環境是必要的。
“游戲有很多種形式……它們比人們想象的更接近自然?!盪nity的機器學習和人工智能副總裁Danny Lange在接受采訪時表示,“在游戲中,你能得到視覺上的、物理上的、認知層面上的,以及社交方面的互動。這些都給算法帶來了進化壓力,就像大自然對生物一樣。”
演示一
上圖是游戲如何訓練AI的一個例子,這個小人沒有任何關于行走的知識,但它一直在生理學和物理定律范圍內探索,一旦它發生了類似行走的行為,系統就會觸發數字獎勵,激勵它不斷學習這種行為。經過嘗試,這個小人最終學會了走路——盡管它的動作還是很笨拙,
這項技術本身不是新的,很多公司和實驗室早幾年就已經開始在游戲引擎里訓練AI,其中最知名的是Nvidia的Isaac虛擬機器人訓練系統。此外,自動駕駛汽車算法也高度依賴逼真的虛擬道路環境,而Danny Lange本人之前也是Uber機器學習平臺的建立者。
如果說物理模擬能讓AI進行更宏大的實驗,幫人類鎖定實際測試范圍,那么游戲作為開放世界,除了物理學,它能模擬的還有色彩之間的相互作用、社交行為等。
“社會動態建模,這是一個新興領域,”Danny Lange介紹道:“你模擬了多個智能體,他們會互相交流,甚至發明對話使用的語言。這可以深入了解人群的行為方式,舉一個實際的例子,假設我們模擬了兩個知名投資分析師,他們中的一個說股票明天會跌,一個說會漲,那我們就能通過模擬來觀察他們的言論是怎么影響到其他人的認知的?!?/p>
演示二
就好比在自然界中,動物在學會走路、跑步前必須先學會爬行,我們要分析股票這個問題也要先把它分解成一個個簡單問題。強化學習遵循的正是這種逐步漸進的學習方法,“你認為自己已經解決了一個難題,然后把‘經驗’丟給機器,這其實并沒有多大意義。算法必須先掌握一個挑戰,并把它所學到的知識用來掌握下一個挑戰,這是我們所說的‘課程學習’?!?/p>
“和DeepMind的交易不僅僅是出售軟件許可證,這是合作。當你構建一個游戲引擎時,它也許可以在iOS、Android、Xbox上快速運行。但DeepMind要做的是在數千甚至數萬臺服務器上運行Unity以推動深度學習,這是一項完全不同的任務,意味著我們要針對這些需求調整和配置Unity。”
只有大規模的深度學習才能帶來發展回報。訓練一只狗只需5分鐘,如果只是這樣的任務,DeepMind絕不會選擇Unity,但是,如果他們的目標是以10,000 FPS訓練1000只狗24小時,觀察這些狗的詭異動作,然后從中找出很快學會如何跨欄的狗,那么這樣的合作是必須的。
無論是DeepMind還是Unity,這樣的合作都是共贏。
-
人工智能
+關注
關注
1792文章
47497瀏覽量
239211 -
機器學習
+關注
關注
66文章
8428瀏覽量
132835 -
Unity
+關注
關注
1文章
127瀏覽量
21842
原文標題:Unity和DeepMind達成合作,利用虛擬世界推進AI研究
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論