人類識(shí)別物體的能力非常卓越。假如你在特殊光線下看一個(gè)杯子,或者從一個(gè)意想不到的方向去看杯子,你的大腦仍然很有可能認(rèn)出這是一個(gè)杯子。這種精確的物體識(shí)別能力對(duì)人工智能開發(fā)者來說是一個(gè)難以實(shí)現(xiàn)的夢(mèng)想,例如那些改進(jìn)自動(dòng)駕駛汽車導(dǎo)航的開發(fā)者。
雖然在視覺皮層中建立靈長(zhǎng)類動(dòng)物物體識(shí)別模型已經(jīng)徹底改變了人工視覺識(shí)別系統(tǒng),但是目前的深度學(xué)習(xí)系統(tǒng)相比生物系統(tǒng)已經(jīng)被簡(jiǎn)化,并且還是難以識(shí)別一些物體,。
近日,麻省理工學(xué)院麥戈文研究所的研究員 James DiCarlo 和他的同事在 Nature Neuroscience 上發(fā)表的研究成果中提到,有證據(jù)表明,反饋可以提高靈長(zhǎng)類動(dòng)物大腦識(shí)別難識(shí)別物體的能力,添加反饋回路可以改進(jìn)視覺應(yīng)用中所用到的人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)的性能。
圖丨人工智能和深度學(xué)習(xí)視覺識(shí)別系統(tǒng)的藝術(shù)渲染圖(來源:Christine Daniloff)
深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)是目前在快速時(shí)間尺度(小于 100 毫秒)上精確識(shí)別物體最成功的模型。它具有大體上與靈長(zhǎng)類動(dòng)物腹側(cè)視覺流、皮質(zhì)區(qū)域類似的結(jié)構(gòu),這一結(jié)構(gòu)用來逐步建立所觀察的物體的精確圖像。然而,跟靈長(zhǎng)類動(dòng)物的腹側(cè)神經(jīng)系統(tǒng)相比,大多數(shù)的 DCNN 都很簡(jiǎn)單。
“在很長(zhǎng)一段時(shí)間里,我們都沒有獲得一個(gè)基于模型的理解。因此,這一領(lǐng)域是通過將視覺識(shí)別建模作為前饋過程而開始的,”麻省理工學(xué)院大腦和認(rèn)知科學(xué)系的系主任DiCarlo 解釋道,“但是,我們知道,在跟物體識(shí)別相關(guān)的大腦區(qū)域中,存在著重復(fù)性解剖學(xué)連接。”
試想一下,前饋 DCNN 和視覺系統(tǒng)中首次嘗試捕捉物體信息的部分,就像一條穿過一系列車站的地鐵線,而反復(fù)出現(xiàn)的大腦網(wǎng)絡(luò)就像街道,相互連接,但又不是單向的。大腦精確識(shí)別物體只需 200 毫秒,所以這些反復(fù)出現(xiàn)的聯(lián)結(jié)是否在物體識(shí)別的關(guān)鍵步驟上起作用,目前仍不清楚。也許這些反復(fù)出現(xiàn)的聯(lián)結(jié)只是為了長(zhǎng)時(shí)間保持視覺系統(tǒng)協(xié)調(diào)。例如,街道上的排水溝緩慢地排出水和垃圾,但是并不需要很快地將人從小鎮(zhèn)的一邊轉(zhuǎn)到另一邊。
DiCarlo 和本研究的主要作者、CBMM 的博士后 Kohitij Kar 一起,開始驗(yàn)證快速識(shí)別物體過程中這些多次出現(xiàn)的結(jié)構(gòu)的微妙作用是否被忽略了。
首先,作者需要確認(rèn)靈長(zhǎng)類動(dòng)物大腦能詳細(xì)解碼的物體。識(shí)別物體這一過程對(duì)人工系統(tǒng)來說,充滿了挑戰(zhàn),結(jié)果證明這很關(guān)鍵。
Kar 進(jìn)一步解釋道,“我們意識(shí)到,人工智能模型實(shí)際上并不是對(duì)處理每一幅或被遮擋、或處于混亂狀態(tài)的圖像都有問題。”
作者分別讓深度學(xué)習(xí)系統(tǒng),還有猴子和人類識(shí)別一些“有挑戰(zhàn)性的”圖片,結(jié)果靈長(zhǎng)類動(dòng)物可以很輕易地識(shí)別物體,但是前饋 DCNN 就不行。但是,當(dāng)他們將合適的循環(huán)處理加入到這些 DCNN 中后,上述物體的識(shí)別突然變得輕而易舉了。
Kar 采用了空間和時(shí)間精度極高的神經(jīng)記錄方法,來確定這些圖片的處理對(duì)靈長(zhǎng)類動(dòng)物來說,是否真的如此瑣碎。值得注意的是,他們發(fā)現(xiàn),雖然對(duì)人類大腦來說,高難度圖片的識(shí)別似乎很簡(jiǎn)單,但是它們實(shí)際上涉及到了額外的神經(jīng)處理時(shí)間(大概是 30 毫秒),這表明循環(huán)在我們的大腦中也存在。
“計(jì)算機(jī)視覺界最近在人工神經(jīng)網(wǎng)絡(luò)上成功堆疊了越來越多的層次,并且具有循環(huán)連接的大腦結(jié)構(gòu)也已經(jīng)出現(xiàn)。”Kar 說。
心理學(xué)教授、貝克曼研究所智能系統(tǒng)主題的聯(lián)合主席、非本研究作者 Diane Beck 進(jìn)一步解釋道:“由于完全前饋的深度卷積神經(jīng)系統(tǒng)現(xiàn)在非常擅長(zhǎng)預(yù)測(cè)靈長(zhǎng)類動(dòng)物的大腦活動(dòng),這引起了人們對(duì)于反饋連接在靈長(zhǎng)類大腦中所起到的作用的疑問。這項(xiàng)研究表明,反饋連接很可能在物體識(shí)別中發(fā)揮作用。”
“這對(duì)自動(dòng)駕駛汽車意味著什么呢?研究表明,假如深度學(xué)習(xí)想要類比靈長(zhǎng)類大腦,那么深度學(xué)習(xí)中物體識(shí)別所涉及的結(jié)構(gòu)就需要循環(huán)組件,并且研究指出如何在下一代智能機(jī)器中使用這一程序。”
“隨著時(shí)間的變化,循環(huán)模型提供了對(duì)神經(jīng)活動(dòng)和行為的預(yù)測(cè),”Kar 說。“我們現(xiàn)在可以模擬更復(fù)雜的任務(wù)。也許有一天,這個(gè)系統(tǒng)不僅可以識(shí)別物體,比如人,還可以執(zhí)行人類大腦能夠輕松進(jìn)行的認(rèn)知任務(wù),比如體會(huì)他人的情緒。”
-
AI
+關(guān)注
關(guān)注
87文章
31463瀏覽量
269859 -
MIT
+關(guān)注
關(guān)注
3文章
253瀏覽量
23440
原文標(biāo)題:MIT最新研究:加上“反饋”,AI算法可以看得更清楚
文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論