人工智能看上去高高在上,實際上前沿科技公司都寄希望于這種長期研究為其目前的業(yè)務帶來新的發(fā)展機會,神經(jīng)網(wǎng)絡、機器學習、深度學習構建了人工智能基礎,本文闡述了三大基礎是如何運作和實現(xiàn)人工智能。
人工智能如今已經(jīng)成為科技產(chǎn)業(yè)所討論的普遍話題。這項技術已經(jīng)被應用在了Gmail、自動駕駛汽車和照片整理上面,Mark Zuckerberg甚至還打算開發(fā)一位人工智能管家。但問題在于,人工智能這個概念有點太科幻了,它總是讓人想起操縱宇宙飛船的超級計算機,而不是特別聰明的垃圾郵件過濾器。如此一來,人們已經(jīng)開始擔心人工智能會在何時造反并統(tǒng)治人類了。
科技公司在一定程度上也鼓勵著人們忽略人工智能到科幻人工智能之間的差距,但當你試圖去理解計算機所做的事情時,就會很容易了解到它們的區(qū)別。本文要講的就是人工智能在消費應用領域里最常見的應用方向,當前技術的限制,以及為什么說我們還沒必要擔心機器人的崛起。
神經(jīng)網(wǎng)絡、機器學習和深度學習到底是什么
這3個名詞如今擁有相當高的出現(xiàn)頻率。它們可以被看作是3個不同的層次:神經(jīng)網(wǎng)絡位于底層,它是建立人工智能的計算機結構;機器學習是下一層,它是可以在神經(jīng)網(wǎng)絡上運行的一個程序,可訓練計算機在數(shù)據(jù)當中尋找特定的答案;深度學習處在頂層,這是一種在最近10年里才流行起來的特性類型的機器學習,而它的流行主要得益于廉價處理性能和互聯(lián)網(wǎng)數(shù)據(jù)。
神經(jīng)網(wǎng)絡的概念可以追溯到50年代人工智能的開端。簡單來說,它是一種建造計算機的方式,使其看上去像是一個卡通化的大腦,當中由神經(jīng)一樣的節(jié)點連結成網(wǎng)絡。這些節(jié)點本身都很笨,只能回答最基本的問題。可一旦組合在一起,它們就可以解決復雜問題。更為重要的是,有了正確的算法之后,它們還能擁有學習能力。
紐約大學計算機科學教授ErnestDavis這樣介紹道,假如你想讓計算機學習如何過馬路,在傳統(tǒng)編程方式下,你需要給他一套非常具體的規(guī)則,告訴它如何左右看,等待車輛,使用斑馬線等等,然后讓它嘗試。而在面對機器學習時,你只需向它展示10000部安全橫穿馬路的視頻(以及10000部過馬路被車撞的視頻)就行了。
在這件事上面,如何讓計算機吸收視頻當中的所有信息是一大難點。在過去的幾十年里,研究者嘗試過各種辦法來教計算機,其中就包括增強學習和遺傳算法。前者需要你在計算機達成目標時給予其獎勵,以逐漸優(yōu)化最佳解決方案;后者則會以類似物競天擇的方式對解決問題的不同方法進行對比。
在如今的計算機領域,有一種教學方法變得特別實用,那就是深度學習。它是機器學習的一種類型,會利用神經(jīng)網(wǎng)絡中的諸多層面以不同的抽象化方法對數(shù)據(jù)進行分析。當深度學習系統(tǒng)面對著一幅畫時,神經(jīng)網(wǎng)絡的每一層會對其進行不同程度的放大。底層可能會關注5x5像素網(wǎng)格,然后判斷是否有東西在當中出現(xiàn)。如果有的話,它上面的那一層就會開始查看該網(wǎng)格是如何適配到更大的圖案中的。這個過程會逐漸累計起來,讓軟件利用逐步分解的方式去理解哪怕是最復雜的數(shù)據(jù)。
接下來,假設我們想要使用深度學習讓計算機了解到貓的樣子,我們首先需要利用神經(jīng)網(wǎng)絡的不同層面來識別貓身上的不同元素:爪子、腳掌和胡須等。然后,神經(jīng)網(wǎng)絡會觀察一大堆貓和其他動物的圖片,并被告訴哪些是貓哪些不是。隨著時間推移,它會記住哪些層面是重要的,并增強或忽略當中的部分聯(lián)系。比如說,它可能會發(fā)現(xiàn)爪子和貓具備強烈的關聯(lián),但同樣會出現(xiàn)在其他動物身上,因此它就知道去尋找爪子和胡須同時出現(xiàn)的情況。
這是一個漫長而又重復的過程,系統(tǒng)會根據(jù)反饋緩慢提升自身能力。在這個過程當中,人類可以去糾正計算機,而如果網(wǎng)絡本身擁有足夠多的標簽數(shù)據(jù),它也能自己進行測試,來查看如何利用自身的所有層面才能產(chǎn)生最準確的結果。認出一只貓已經(jīng)如此困難,那些需要去識別世間萬物的系統(tǒng)的復雜程度也可想而知。這也正是為什么微軟會推出一款應用來辨別不同品種的狗。在我們?nèi)祟惪磥恚刨e和雪納瑞之間的區(qū)別可能非常明顯,但計算機在能夠分清兩者之前需要去定義大量的區(qū)別。
這就是谷歌、Facebook和其他公司所使用的技術嗎?
大體上講的確如此。
深度學習技術如今已經(jīng)被應用在了各種日常任務上面。許多大公司都擁有自己的AI部門,F(xiàn)acebook和谷歌還通過軟件開源的方式公開了自己的研究成果。谷歌甚至推出了一個為其3個月的免費在線課程來介紹深度學習。學術研究者或許可以相對低調(diào)地進行研究,但這些企業(yè)幾乎每周都會為這項技術推出創(chuàng)新的應用方式,從微軟的情緒識別網(wǎng)頁應用到谷歌的超現(xiàn)實DeepDream圖像。這也正是我們在最近會頻繁看到深度學習相關信息的原因:大型消費類技術公司都在搗鼓這項技術,并向我們分享自己奇奇怪怪的工作成果。
但是,雖然深度學習在語音和圖像識別方面具備出色能力,但它同樣存在相當多的限制。這項技術不僅需要大量的數(shù)據(jù)和微調(diào),它們的智慧也是狹窄且脆弱的。就像認知心理學家GaryMarcus所說的,這種熱門技術“缺乏呈現(xiàn)因果關系(比如疾病和癥狀)的方式,在學習抽象概念上面也存在困難。它無法執(zhí)行邏輯推理,在整合抽象知識(比如某個物體的名稱、用途和使用方式)上面也還有很長的路要走。”換句話說,深度學習并沒有任何常識。
舉個例子,在谷歌的一個研究項目當中,他們首先向神經(jīng)網(wǎng)絡呈現(xiàn)啞鈴的樣圖,然后讓它獨立生成一張圖片。從結果來看,神經(jīng)網(wǎng)絡所生成的圖片還不錯:一根橫向握把連接著兩個灰色的圓環(huán)。但握把的中間總是會出現(xiàn)手臂肌肉的輪廓,這是因為訓練時所用圖片當中通常都有健身愛好者舉著啞鈴。深度學習或許可以了解到成千上萬圖片當中啞鈴的基本視覺屬性,但它永遠都不能作出認知上的跨越,認識到啞鈴并沒有長胳膊。這種問題并不單單存在于常識的范疇。由于檢驗數(shù)據(jù)的具體方式,深度學習網(wǎng)絡還能被隨機的像素圖案所欺騙。
不過這種限制可以被巧妙地隱藏。就拿Siri這樣的數(shù)字助手為例,它們經(jīng)常可以理解用戶的命令,或是抖點小機靈。但就像計算機科學家HectorLevesque說指出的那樣,這些小花招恰好顯示出了人工智能和真正的智能之間巨大的差距。他提到了圖靈測試,稱在這項挑戰(zhàn)中取得最佳成績的機器都會利用小花招來讓人們認為它正在和自己講話。它們會使用笑話、引用、情緒爆發(fā)、錯誤引導和所有的語言回避來混淆和干擾提問者。沒錯,在去年通過圖靈測試的計算機號稱自己是一位13歲的烏克蘭男孩,這也成為了它偶爾出現(xiàn)無知遣詞不當?shù)慕杩凇?/p>
Levesque認為,測試人工智能的一種更好方式是向計算機提出超現(xiàn)實但邏輯合理,同時需要廣泛因果知識才能回答的問題,比如“鱷魚可以參加越野障礙賽馬嗎?”,或者是“棒球運動員可以在帽子上粘上小翅膀嗎?”可想而知,計算機在嘗試回答這些問題之前需要擁有多么大的知識儲備。
如果這不是人工智能,那它是什么?
這正是使用人工智能這個名詞的困難之一:它太難以去定義了。業(yè)界對此所達成的共識是,只要機器完成了一項之前只有人類才能做到的任務——比如玩國際象棋或認臉——那它就不再被認為是智能的標志了。就像計算機科學家LarryTesler所說,智能指的是那些機器還做不到的事情。而即便計算機能夠完成某些任務,它們也無法取代人類智慧。“我們說神經(jīng)網(wǎng)絡就像人類大腦,但事實并非如此,”Facebook人工智能研究團隊主管YannLeCun說道,“這就好像飛機不是鳥一樣。它們不能扇動翅膀,也沒有羽毛或肌肉。”如果我們真得創(chuàng)造出了人工智能,它也“不會像人類或動物的智慧”。比如說,我們就很難去想象一個智慧體會沒有自我保護的意識。
許多AI領域的業(yè)內(nèi)人士都不認為我們會創(chuàng)造出具備真正有感知能力的人工智能。“目前的方式無法(讓人工智能)具備靈活性,或是處理多任務和執(zhí)行編程范圍之外任務的能力。”MIT大腦、思維和機器中心Andrei Barbu教授這樣說道。他還提到,效率的AI搜索不過是創(chuàng)造出為解決特定問題微調(diào)過的系統(tǒng)。盡管研究者曾經(jīng)嘗試過無人監(jiān)管的機器學習——讓系統(tǒng)觀察未被分類和標記的數(shù)據(jù)——但這目前還處于非常初級的階段。谷歌就有一個類似的神經(jīng)網(wǎng)絡項目,通過隨機觀察來自1000萬部視頻的縮略圖,它最終教會自己貓的樣子,但制作者并未公布任何除此之外的能力。就像LeCun在2年前出席Orange Institute的一場活動時所說的:“我們不知道如何進行無監(jiān)督學習,這是最大的障礙。”
作為一個研究項目,人工智能還經(jīng)常會受到夸張宣傳的影響。當一種新方法被發(fā)現(xiàn)且研發(fā)進度加快時,評論者(通常還包括計算機科學家)會大膽假設這種發(fā)展速度會很快讓機器人管家成為現(xiàn)實。紐約時報早在1958年就曾有過類似報道,當中把一種非常早期的AI形式——可以分辨左和右的區(qū)別——描述為電子“胚胎”,未來某天將能夠“走路、交談、觀察、書寫、繁殖,并具備自我存在意識。”當這類承諾未能兌現(xiàn)時,該領域便會陷入所謂的AI寒冬,也就是悲觀主義盛行和資金減少的時期。歷史上出現(xiàn)過十幾次小規(guī)模的AI寒冬,70年代末和90年代初還有兩次大寒冬。雖說每一個科研領域都會經(jīng)歷類似的時期,但值得注意的是,很少有一門學科會如此“可靠地”讓自己的信徒一再失望,以至后者為此想出了一個專有名詞。
人工智能只不過是噱頭和糊弄人的把戲嗎?
這樣說有些以偏概全了。如何看待人工智能取決于你對它有著怎樣的期待。我們的機器的確越來越智能,但這并不是我們可以輕松歸類的。就拿特斯拉的自動駕駛軟件為例,公司總裁ElonMusk將其描述為一種匯集數(shù)據(jù)的“快速學習網(wǎng)絡”,好讓旗下所有汽車在同時進行學習。這個研究項目的最終目的不會是一般的人工智能,但它的整個計算機網(wǎng)絡的確會具備相當高的智能性,這也就是被LeCun稱作是“隱形智能”的東西。
試想一下,未來你將擁有一臺不會出差錯的自動駕駛汽車,當中還有一位先進的數(shù)字助手。這或許是Levesque教授看不上眼的那種欺騙把戲,但卻能讓任何人將其當作人類來對待。你們會在早上上班時互相說笑話,聊聊新聞,安排自己的行程表,或是在需要時改變目的地——一切都會在這部不僅了解道路規(guī)則、還能應對其他車輛的自動駕駛汽車中進行。到了那時,我們真的還會在乎這種人工智能到底是真是假嗎?
-
神經(jīng)網(wǎng)絡
+關注
關注
42文章
4777瀏覽量
100995 -
人工智能
+關注
關注
1793文章
47567瀏覽量
239418 -
機器學習
+關注
關注
66文章
8434瀏覽量
132873
原文標題:一篇文章解讀人工智能的原理及產(chǎn)業(yè)升級機會
文章出處:【微信號:indRobot,微信公眾號:工業(yè)機器人】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論