魔方可謂20世紀(jì)80年代的標(biāo)志性智力玩具,如今它正在被用作連接深度學(xué)習(xí)與高等數(shù)學(xué)之間的橋梁。
計算機(jī)科學(xué)教授Pierre Baldi是加州大學(xué)歐文分校(UCI)研究團(tuán)隊從事此項工作的負(fù)責(zé)人,他認(rèn)為深度學(xué)習(xí)與高等數(shù)學(xué)之間的“鴻溝”是當(dāng)今人工智能所面臨的最大難題。
“大家會抱怨深度學(xué)習(xí)是一個黑盒子,他們不知道這個網(wǎng)絡(luò)在做些什么。”Baldi說道,“而我們可以看到該網(wǎng)絡(luò)正在學(xué)習(xí)數(shù)學(xué)。”
自從匈牙利雕塑家兼建筑學(xué)教授Ern? Rubik于1974年發(fā)明了魔方之后,這種各個面色彩不一的立方體就開始讓人們?yōu)橹院屠Щ蟆?/p>
研究團(tuán)隊發(fā)現(xiàn),深度學(xué)習(xí)模型可以用于教會機(jī)器如何做數(shù)學(xué)題(這里是一種被稱為“群論”的代數(shù)概念),這就是Baldi所說的“AI 重大挑戰(zhàn)中的一小步”。
無心插柳
研究人員最初的目標(biāo)是構(gòu)建一個深度學(xué)習(xí)模型,可在無需任何人工協(xié)助的情況下解開魔方,就像早期的模型掌握了國際象棋的游戲方式一樣。
為了實現(xiàn)這一目標(biāo),他們像教小孩子一樣引導(dǎo)模型學(xué)習(xí)如何還原魔方。
從已還原的魔方開始,模型首先向后倒退一步,然后還原魔方。接著向后倒退兩步并還原魔方,隨后再向后倒退三步,如此類推。這會讓算法在每一次嘗試中逐漸學(xué)習(xí)。Baldi將這一過程比作學(xué)習(xí)高爾夫球,首先從近距離推桿進(jìn)球開始,然后隨著精確度的提升而逐漸遠(yuǎn)離球洞。
該研究團(tuán)隊最近發(fā)表了一篇論文,詳細(xì)介紹了他們的工作。該團(tuán)隊為其開發(fā)出的增強(qiáng)學(xué)習(xí)算法起了一個名字:“自學(xué)迭代(autodidactic iteration)”。該算法可在平均30步之內(nèi)完全還原被打亂的魔方,也可以實現(xiàn)人類玩家所能達(dá)到的最快速度。
研究人員在訓(xùn)練該模型時使用了搭載NVIDA GPU的機(jī)器,同時還使用了CUDA編程模型、TensorFlow機(jī)器學(xué)習(xí)框架和Keras神經(jīng)網(wǎng)絡(luò)API。
據(jù)Baldi估計,GPU將工作速度加快了5到10倍,并且其團(tuán)隊可以無限制地將更多GPU投入使用,進(jìn)一步推動深度學(xué)習(xí)研究。
“我們對GPU求之若渴,”他說道,“它們對于這項工作來說必不可少。”
充滿無限可能的一次進(jìn)步
Baldi表示,魔方展現(xiàn)了一個獨特的深度學(xué)習(xí)挑戰(zhàn):魔方的正確解法只有一種,但錯誤的組合形式卻有數(shù)百億億之多。這里用的還只是傳統(tǒng)的三階魔方,每個面各有9個方塊。
解開更高階的魔方是該團(tuán)隊的下一個奮斗目標(biāo)。他們想知道將這種“自學(xué)迭代”的方式應(yīng)用于四階和五階魔方的效果如何。但首先,團(tuán)隊必須對該方法進(jìn)行調(diào)整,以應(yīng)對大幅提高的復(fù)雜度。
“如果將速度降至原來的二分之一,則不會出現(xiàn)什么問題。”Baldi說道,“但如果將速度減慢到與大陸漂移的速度一樣,那么問題就來了。”
同時Baldi發(fā)現(xiàn),也可以利用這種方式教會自學(xué)迭代模型掌握其他游戲的玩法。
他認(rèn)為這項工作在其他數(shù)學(xué)領(lǐng)域也具有潛在的應(yīng)用機(jī)會,尤其是高中水平以上的數(shù)學(xué)內(nèi)容。他表示,AI一直在努力實現(xiàn)這一點。
而Baldi的團(tuán)隊對此的看法則是這種難題很快就會成為明日黃花。同時,解開更復(fù)雜、更困難的問題才是其奮斗目標(biāo)。
-
AI
+關(guān)注
關(guān)注
87文章
31493瀏覽量
270101 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5512瀏覽量
121455
原文標(biāo)題:通過魔方有望實現(xiàn)AI領(lǐng)域的重大突破
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論