在人工智能領(lǐng)域,打敗人類是過時的做法?,F(xiàn)在,頂尖的學(xué)者和科技公司想要想“人類”挑戰(zhàn)電子游戲。由Elon Musk和Sam Altman共同創(chuàng)立的研究實(shí)驗(yàn)室OpenAI宣布了其最新的里程碑:一個由人工智能代理商組成的團(tuán)隊(duì)在熱門的競技場游戲Dota 2中擊敗1%的業(yè)余玩家。
OpenAI在去年8月首次跨入Dota 2游戲世界的大門,推出了一種可以在1v1比賽中擊敗頂級玩家的系統(tǒng)。OpenAI現(xiàn)在升級了它的機(jī)器人,可以在5v5比賽中扮演人類,而OpenAI計劃在今年晚些時候在國際賽事上進(jìn)行機(jī)器人與“人類”之間的對決。
該項(xiàng)賽事意義所在
這場比賽的動機(jī)很簡單:如果我們能夠?qū)⑼骐娮佑螒蛩璧募寄軅魇诮o人工智能系統(tǒng),那么我們就可以用它們來解決現(xiàn)實(shí)世界中復(fù)雜的難題,例如管理一個城市的交通基礎(chǔ)設(shè)施。
人工智能在游戲中能夠打敗人類,雖然沒有打敗高級玩家,但至少這是可行的
電子游戲不同于以往的挑戰(zhàn),電子游戲帶來的挑戰(zhàn)是棋類游戲或圍棋之類的棋盤游戲所沒有的。它們向玩家隱藏信息,這意味著人工智能無法感知整個游戲環(huán)境,也無法計算出最可能的下一步動作。還有更多的信息需要處理,還有大量可能的動作。OpenAI表示,在任何時候,它的Dota 2機(jī)器人都必須在1000個不同的動作之間做出選擇,同時還要處理2萬個數(shù)據(jù)點(diǎn),這些數(shù)據(jù)點(diǎn)代表游戲中正在發(fā)生的事情。
強(qiáng)化機(jī)器人學(xué)習(xí)行為是一個巨大的嘗試
OpenAI的實(shí)驗(yàn)室采用了一種叫做“強(qiáng)化學(xué)習(xí)”的機(jī)器學(xué)習(xí)方法。這是一種看似簡單的技術(shù),可以產(chǎn)生復(fù)雜的行為。人工智能機(jī)器被投入到一個虛擬環(huán)境中,在這個環(huán)境中,他們通過不斷嘗試和犯錯來教會自己如何實(shí)現(xiàn)自己的目標(biāo)。程序員們設(shè)置了所謂的獎勵功能(獎勵機(jī)器人,比如殺死一個敵人)。
對于這批新的Dota機(jī)器人來說,自我學(xué)習(xí)的次數(shù)是驚人的。每天,這些機(jī)器人以加快了的速度玩游戲。他們以這種加快的速度訓(xùn)練了幾個月。它一開始完全是隨機(jī)的,在地圖上徘徊。然后,過了幾個小時,它開始掌握基本技能。OpenAI方面表示,如果一個人要花1.2萬到2萬小時才能學(xué)會成為一名專業(yè)的游戲選手,那么這就意味著OpenAI的機(jī)器人“每天都要體驗(yàn)100次人類生命過程”。
一方面,這證明了現(xiàn)代機(jī)器學(xué)習(xí)方法的可行性和認(rèn)可了最新計算機(jī)芯片處理大量數(shù)據(jù)的能力。另一方面,這也提醒了我們,智能人工智能的本質(zhì)是如何的。如果人類花了數(shù)千年的時間來學(xué)習(xí)玩電子游戲,那么我們這個物種也不會走得太遠(yuǎn)。
人工智能機(jī)器人比人類更快,更聰明
在dota2游戲中,OpenAI的人工智能機(jī)器人的反應(yīng)速度比人類快,他們可以快速而精確地獲取數(shù)據(jù),比如物品清單、英雄的健康狀況以及地圖上物體之間的距離,這對正確使用某些技能至關(guān)重要,這是所有人類玩家必須手動檢查或憑直覺判斷的信,但機(jī)器人則可以在很短的時間內(nèi)做出判斷。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28455瀏覽量
207263 -
人工智能
+關(guān)注
關(guān)注
1791文章
47336瀏覽量
238696 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8421瀏覽量
132703
原文標(biāo)題:人工智能進(jìn)一步挑戰(zhàn)人類! OpenAI的人工智能在dota2中打敗人類/173
文章出處:【微信號:DATADUOAI_CLUB,微信公眾號:人工智能領(lǐng)域】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論