OpenAIFive在Dota2中以2:0擊敗了世界冠軍團隊,人機大戰(zhàn)人類最終不敵AI。OpenAIFive在去年輸?shù)舯荣惡筮M行了優(yōu)化,訓練時間相當于人類玩了4.5萬年。
OpenAI可以宣布自己是世界第一了。
今天凌晨,OpenAIFive在Dota2中以2:0擊敗了世界冠軍團隊OG,再次顯示出了AI的強大威力,也正式宣告人類在Dota這種高難度游戲中成為AI的手下敗將。
這次比賽,OpenAIFive的表現(xiàn)出是迄今為止展示出的最高水平:人類對手去年贏得了世界上最令人垂涎的電子競技賽事TI8的冠軍;OpenAIFive在去年輸?shù)舯荣惡筮M行了優(yōu)化,訓練時間相當于人類玩了4.5萬年,贏得比賽也并不出乎意料。
人類對手OG團隊
2:0,AI戰(zhàn)勝人類
在這場人機大戰(zhàn)中,每隊只有17個英雄可供選擇。OpenAI還選擇了所謂的“Captain'sDraft”游戲模式。與之前的比賽一樣,OpenAI也禁用了召喚和幻覺功能,這兩項功能都涉及以英雄副本的形式引入其他變量,以及OpenAI訓練系統(tǒng)時未考慮的一些特殊因素和單位。
除此之外,這場比賽與正常的Dota2比賽一樣,其最終目標是摧毀敵方隊伍的“基地”,即每個團隊領土末端的大型塔樓,在敵人的隊伍成功摧毀其他小型塔后,基地是很脆弱的,整個比賽過程的中心是對塔的攻防,以及英雄與英雄之間的團戰(zhàn)。
在第一場比賽中,OpenAIFive讓對手OG大吃一驚,通過一系列激進戰(zhàn)術獲得了勝利,其中包括對游戲中獲取的金幣的花費方式,在本方英雄死亡時立即買活,即使在比賽初期也是如此。
對此,OpenAI首席技術官GregBrockman指出,OpenAI喜歡有利于短期收益的戰(zhàn)略,說明在長期規(guī)劃上不如人類,而且DOTA2這種游戲通常要依賴于長期規(guī)劃才能獲勝。然而,在這場比賽中,這種早期的買活策略得到了回報,OpenAIFive獲得了優(yōu)勢,當比賽拖入30分鐘時,OG頂不住了。
在第二場比賽中,OpenAI表現(xiàn)更好,在最初的幾分鐘內即獲得了對OG的早期優(yōu)勢,然后無情碾壓了人類玩家,在第一場比賽時間剛剛過半的時間點上即取得勝利。
值得注意的是,OpenAIFive在第二場比賽中開始玩得異常激進,以及OG在AI全圖范圍內的推進時有些無力對抗。OpenAIFive能夠利用其特定的英雄選擇帶來的優(yōu)勢。
飛速進化的OpenAIFive:已經訓練4.5萬年
去年8月,OpenAIFive曾以3:2擊敗半職業(yè)人類玩家,不過當面對職業(yè)對手時,OpenAI便輸給了paiNGaming戰(zhàn)隊,帥不過三秒。
根據(jù)OpenAI聯(lián)合創(chuàng)始人兼主席GregBrockman(也是該組織的CTO)的說法,在輸?shù)舯荣愔螅琌penAIFive是通過在加速的虛擬環(huán)境中進行自我改進而變得更加強大的。
OpenAIFive由深度強化學習提供支持,也就是說它的編碼目的不是“如何游戲”,而是“如何學習”。Brockman在比賽開始前表示。,AI在10個月中,已經玩了45000年的Dota2游戲,而且,玩了這么長時間也沒有覺得無聊。
這場比賽采用三局兩勝制,所有bot都使用相同的深度強化學習技術進行訓練,并由同一OpenAI系統(tǒng)的不同層獨立控制。
OpenAI向公眾開放與AI對決,終極目標是實現(xiàn)通用人工智能
對于OpenAI來說,值得慶祝的不僅僅是這次勝利,還因為其證明了對強化學習的態(tài)度及其關于AI的普適哲學樹立的里程碑。
研究團隊將不再公開展示其AI游戲bot,而是致力于開發(fā)軟件,讓人類與OpenAIFive軟件實時協(xié)作,與機器人一起玩游戲,并學習他們獨特的前所未有的戰(zhàn)略和行為。
OpenAIFive還發(fā)布了一個平臺,供公眾與OpenAIFive對戰(zhàn),這種模式稱為“競技場”模式,將于4月18日起開放三天。OpenAI表示,協(xié)作軟件可能永遠不會向公眾開放,不過大家可以在活動中親自嘗試一下。
OpenAI的聯(lián)合創(chuàng)始人兼首席執(zhí)行官SamAltman還表示,此類工作證明了與AI智能體的合作可能會在未來帶來巨大的利益。
Altman說:“對于世界如何運作,如何訓練這些智能體,令其實現(xiàn)協(xié)作上,這次活動是重要的一課。實現(xiàn)人類與AI的合作,是我們對未來世界更積極的愿景之一,人工智能與人類共同努力,使人類變得更好、更有趣、更有影響力。”
OpenAI可能會繼續(xù)涉足Dota2和其他視頻游戲,主要是因為這些游戲是人工智能的良好測試平臺,也是衡量AI技術進步的良好基準測試工具。
現(xiàn)在可能還沒有一個游戲像OpenAIFive這樣,AI系統(tǒng)最終無法具備超出人類能力的水平。對于更廣泛的AI行業(yè)而言,精通視頻游戲可能很快就會變得過時,我們需要簡單的方式來證明AI系統(tǒng)可以快速學習,并能夠更快速高效地的解決現(xiàn)實世界的困難任務,獲得更有意義的好處。
最終,OpenAI希望將其Dota2學習并擴展到游戲之外的新領域,并最終擴展到現(xiàn)實世界中。為此,OpenAI正致力于使用強化學習和其他技術,為機器人手提供更靈巧、更精細、更人性化的動作。
“OpenAI正在努力的方向建立通用人工智能(AGI),并與世界分享這些好處,同時確保其安全性。”Altman說的是建立一個能夠執(zhí)行任何人類任務的多功能AI系統(tǒng)。“我們的目標不是戰(zhàn)勝電子游戲,雖然這很有趣。我們的目標是揭開實現(xiàn)AGI道路上的秘密。”
-
機器人
+關注
關注
211文章
28632瀏覽量
207980 -
AI
+關注
關注
87文章
31490瀏覽量
269888 -
強化學習
+關注
關注
4文章
268瀏覽量
11281
原文標題:人類全面潰敗!AI訓練4.5萬年,DOTA 2人機大戰(zhàn)大結局
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論