2019年中國人工智能大會(Chinese Congress on Artificial Intelligence 2019,簡稱“CCAI 2019”)將于9月21日-22日在青島膠州召開。南京大學(xué)人工智能學(xué)院俞揚(yáng)教授將出席大會,并擔(dān)任人工智能青年論壇共同主席。
俞揚(yáng)在2011年博士畢業(yè)后,留校加入計算機(jī)科學(xué)與技術(shù)系、機(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘研究所(LAMDA)從事教學(xué)與科研工作,主要研究領(lǐng)域?yàn)槿斯ぶ悄堋C(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)。他還入圍了2018年度IEEE Intelligent Systems評選的國際“人工智能10大新星”名單,是該次國內(nèi)高校唯一入選者。
近年來的爆發(fā)讓人工智能成為當(dāng)下最火熱的風(fēng)口行業(yè)之一,機(jī)器學(xué)習(xí)又是其中的先驅(qū)領(lǐng)域。作為這方面的專家,俞揚(yáng)如何評價這一輪行業(yè)發(fā)展熱潮?我們對他的觀點(diǎn)和思考作了梳理,一起來看。
人工智能不是一蹴而就,要靠厚積薄發(fā)
2016年圍棋人機(jī)大戰(zhàn)中,DeepMind開發(fā)的AlphaGo以4:1的絕對優(yōu)勢,橫掃人類頂級選手柯潔、韓國名將李世石,讓世人對智能的力量大為驚嘆。
俞揚(yáng)通過拆解AlphaGo的訓(xùn)練“秘密”,指出了它驚艷亮相背后的成功路徑。
AlphaGo的基礎(chǔ)框架是“蒙特卡洛樹搜索”。在俞揚(yáng)看來,這是一種聰明的搜索算法,它可以成功避免很多無效搜索,但現(xiàn)在也只能達(dá)到業(yè)余棋手五段、六段的水平,遠(yuǎn)不具備與人類頂尖棋手對話交鋒的實(shí)力。
在此基礎(chǔ)上,AlphaGo引入了“機(jī)器學(xué)習(xí)”,通過學(xué)習(xí)人類歷史上高手對弈的棋局?jǐn)?shù)據(jù),模擬人類走法,如果碰到?jīng)]有見過的棋局,則以過往相似棋局作為參考。它雖然可以學(xué)習(xí),但無法理解這些走法背后的玄機(jī)。此外,AlphaGo還通過“強(qiáng)化學(xué)習(xí)”,自己與自己對弈來提升水平。
俞揚(yáng)指出,這種學(xué)習(xí)機(jī)制并不是新事物。AlphaGo涉及的所有算法部件都是現(xiàn)成的,“蒙特卡洛樹搜索”已經(jīng)發(fā)展了十年,強(qiáng)化學(xué)習(xí)也經(jīng)歷了數(shù)十年的發(fā)展。AlphaGo的突破在于,人們以卓越的工程水平實(shí)現(xiàn)了這些技術(shù)的結(jié)合,用成百上千的CPU和數(shù)百個顯卡實(shí)現(xiàn)了加速計算。
AlphaGo的例子清晰地表明,人工智能近年來的成功并不是一蹴而就的,而是許多年基礎(chǔ)研究的成果。既然我們希望人工智能的發(fā)展能夠更多的造福于未來生活,就要做好長期基礎(chǔ)研究的探索和積累,這樣才能做到厚積薄發(fā)。
人工智能發(fā)展的“奇點(diǎn)”還未來臨
人工智能在人機(jī)對弈、圖像識別、語音識別等領(lǐng)域的進(jìn)步,引發(fā)了行業(yè)內(nèi)外的強(qiáng)烈關(guān)注和熱切討論。作為機(jī)器學(xué)習(xí)領(lǐng)域的專家,俞揚(yáng)如何看待這些進(jìn)步呢?
俞揚(yáng)曾對媒體表示,雖然人工智能迎來了第3次發(fā)展熱潮,但“人工智能威脅論”尚不成立,人工智能發(fā)展“奇點(diǎn)”還未來臨。他提出,不要混淆“技術(shù)進(jìn)步”和“社會進(jìn)步”的概念。以蒸汽機(jī)為例,它帶來了工業(yè)革命,人類生產(chǎn)力得到巨大提高,顛覆性地改變了人類社會的生產(chǎn)生活面貌,但在這一過程中,要注意原理和工藝的區(qū)別。蒸汽機(jī)的原理自誕生起就不再出現(xiàn)變化,人類不斷改造和升級的,是蒸汽機(jī)的工藝水平。正是因?yàn)楹笳叩牟粩嗵嵘抛屨羝麢C(jī)效率更高、價格更低、使用更安全方便,進(jìn)而廣泛普及開來,推動了社會進(jìn)步。如果依照“奇點(diǎn)”理論來推算,蒸汽機(jī)應(yīng)當(dāng)迅速發(fā)展,但工程工藝的精化無法克服其原理上的先天缺陷,后來還是被內(nèi)燃機(jī)所取代。今天我們在汽車、飛機(jī)上已經(jīng)看不到蒸汽機(jī)的影子了。
人工智能的決定權(quán)依然在人
關(guān)于人工智能的能力邊界問題 ,一直以來都存在不同的聲音。人工智能有沒有權(quán)限做決策?如果有,這一權(quán)限應(yīng)該多大?
2018年3月,一輛自動駕駛的Uber在美國亞利桑那州撞倒了一位推著自行車的女性,致其身亡,這是自動駕駛導(dǎo)致行人死亡的第一例事故。事件迅速發(fā)酵,引發(fā)了關(guān)于人工智能安全問題的廣泛討論。
對此,俞揚(yáng)明確表示,人工智能作為一個工具,如何使用,目前來看決定權(quán)依然在人,系統(tǒng)的設(shè)計者和商業(yè)(應(yīng)用)的提供人員需要對此負(fù)責(zé)。他說,“我們必須清楚地知道人工智能會做出什么樣的決策。對人工智能的應(yīng)用范圍,以及應(yīng)用結(jié)果的預(yù)期,一定要有約束”。在人工智能決策相關(guān)的問題上,人類一定要慎之又慎,環(huán)境是否可控,是否經(jīng)過了可理解性的測試,決定了它是否可以用在關(guān)鍵的場所。否則,產(chǎn)品就存在重大缺陷。
在高效強(qiáng)化學(xué)習(xí)方面的探索
俞揚(yáng)介紹道機(jī)器學(xué)習(xí)可以有“機(jī)械學(xué)習(xí)”、“示教學(xué)習(xí)”、“類比學(xué)習(xí)”和“歸納學(xué)習(xí)”等多種類型。自20世紀(jì)80年代以來,歸納學(xué)習(xí)成為機(jī)器學(xué)習(xí)中被研究最多、應(yīng)用最廣的分支。歸納學(xué)習(xí)又分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)和介于二者之間的弱監(jiān)督學(xué)習(xí)。
強(qiáng)化學(xué)習(xí)可以看作是一種弱監(jiān)督學(xué)習(xí),它的數(shù)據(jù)標(biāo)記需要靠自己探索來獲得,往往需要經(jīng)過多次決策的探索才能獲得標(biāo)記。
俞揚(yáng)指出,強(qiáng)化學(xué)習(xí)在現(xiàn)實(shí)社會的應(yīng)用還很少。當(dāng)前強(qiáng)化學(xué)習(xí)主要有兩個經(jīng)典方法:一是對值函數(shù)的學(xué)習(xí);二是策略搜索方法。但這兩個方法對于樣本的需求量都極其大,在真實(shí)物理環(huán)境中的應(yīng)用很難得到滿足。俞揚(yáng)以狗舉例,讓狗聽懂“趴下”只需半個小時,這個過程大概有二十個樣本。由此可見機(jī)器強(qiáng)化學(xué)習(xí)的能力與生物相比,還有很大差距。即目前強(qiáng)化學(xué)習(xí)方法的樣本利用率很低,這種低效可能來源于優(yōu)化能力、方法論等多個方面的局限。
2017年,俞揚(yáng)介紹過自己在提高機(jī)器強(qiáng)化學(xué)習(xí)能力方面的一些探索。近期,他的研究更關(guān)注模擬器的構(gòu)建。俞揚(yáng)認(rèn)為強(qiáng)化學(xué)習(xí)落地的主要瓶頸在于需要大量試錯,而現(xiàn)實(shí)環(huán)境難以承受試錯代價,構(gòu)建模擬器可能是突破瓶頸的一條可行途徑。2017年開始,俞揚(yáng)與阿里巴巴合作,成功構(gòu)建了“虛擬淘寶”,模擬了購物的買家。“虛擬淘寶”模擬器用于訓(xùn)練強(qiáng)化學(xué)習(xí),從而避免了試錯代價,最終訓(xùn)練出的模型,直接上線測試,獲得了2%的性能提升。俞揚(yáng)認(rèn)為“零試錯”是強(qiáng)化學(xué)習(xí)能夠得以推廣應(yīng)用的關(guān)鍵門檻,并且看好強(qiáng)化學(xué)習(xí)未來落地應(yīng)用的前景。
-
人工智能
+關(guān)注
關(guān)注
1792文章
47399瀏覽量
238902 -
DeepMind
+關(guān)注
關(guān)注
0文章
130瀏覽量
10880
原文標(biāo)題:CCAI 2019 | 俞揚(yáng):人工智能的決定權(quán)依然在人
文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學(xué)會】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論