近年來,人工智能迅猛發展,即便是沒有深入了解過人工智能技術的人,想必也或多或少地聽過兩個術語——符號人工智能和神經網絡。隨著人工智能的發展不斷成熟,MIT-IBM 沃森人工智能實驗室主任 David Cox 認為,如今人們需要重新審視人工智能,他提出將上述二者結合,開發一種「神經符號人工智能」(Neuro-Symbolic AI)。
本文將詳細介紹神經符號人工智能背后的原理,作者為英國科技作家 Luke Dormehl ,雷鋒網在不改變原意的基礎上對原文進行了編譯。
想象一下,一個托盤上有 8 個物體:有立方體,有球體,材質不同,大小不一。那么我的問題是,托盤上的大件物體和金屬球的數量是否相同?
你可能會感到不解,覺得我的問題有點兒刁鉆。相反,這并不難,甚至學齡前兒童都能輕松回答。但對于當今最先進的神經網絡來說,這太難回答了。因此,即使人工智能對我們來說已經再熟悉不過,它還是需要重新開發。
以上并非我的觀點,而是美國馬薩諸塞州劍橋的 MIT-IBM 沃森人工智能實驗室(MIT–IBM Watson AI Lab)主任 David Cox 的觀點。早前, David Cox 是哈佛大學教授,他的團隊憑著對神經科學的洞見,建立了一個受大腦啟發的機器學習計算機系統。目前,在 IBM,他主要負責沃森人工智能(Watson A.I.)的相關事務。
提到沃森,不了解的人只知道它是人工智能,曾在美國問答節目《Jeopardy》中一戰成名。但其實,沃森首先是一個機器學習系統,通過大量數據而非人為規則接受訓練。
說回主題,在人工智能準備在未來十年大放異彩的時候,David Cox 說世界需要重新審視它,這聽起來是有點兒奇怪。畢竟,過去十年可以說是人工智能史上最成功的十年——這十年里,幾乎每周都會有新突破,沒有任何“人工智能寒冬”的跡象。但這也正是他認為人工智能需要改變的原因。
對此,他的建議是一個目前還不確定的術語——“神經符號人工智能”——這也很可能會成為 20 年代結束時大眾熟知的一個詞。
符號人工智能的起與落
嚴格地說,神經符號人工智能不是一種全新的人工智能,而是把建立“會思考的機器”的兩種現有的、相互對抗的方法相結合。
這個名字中的“符號” 指的是創造人工智能的第一種主流方法。從 20 世紀 50 年代到 80 年代,符號人工智能是至高無上的。對于一個符號人工智能研究者來講,所謂智能,是建立在人類通過形成內在的符號表征來理解周圍世界的能力之上的。然后,研究者制定規則處理這些符號表征,而這些規則可以通過捕獲日常知識的方式被形式化。
如果說大腦類似于計算機,那么不論我們遇到任何情況,都需要運行自身的計算機程序,因為程序會一步步地解釋如何完全基于邏輯來執行操作。因此,符號人工智能研究者認為,如果是這樣,他們也能夠發現那些關于世界如何組成的相同規則,然后以算法的形式編碼,以便計算機執行。
實際上,符號人工智能在過去表現不錯,令人印象深刻。1964 年,計算機科學家 Bertram Raphael 開發了一個 SIR 系統,即“語義信息檢索”(Semantic Information Retrieval)。SIR 是一個計算推理系統,它似乎能夠以一種類似于真正智能的方式來學習對象之間的關系。比如,你告訴它一些基礎信息——John 是個男孩,男孩是人,一個人有兩只手,一只手有五個手指。然后你問他 John 有幾根手指,它的答案是 10。
雷鋒網了解到,“專家系統”的基礎堅實,但也存在問題:這些系統價格昂貴,需要不斷更新;而最糟糕的是,規則越多,系統的準確性就越低。
神經網絡的世界
那么,我們再來看看神經符號人工智能里的“神經”是什么?
實際上,“神經”指的是深度學習神經網絡,它是受大腦啟發的計算類型,驅動了過去十年許多人工智能領域出現的突破——比如人工智能駕駛汽車、把文本翻譯成幾十種不同的語言、智能音箱能夠聽懂指令等等。
【 圖片來源: DIGITAL TRENDS 所有者:DIGITAL TRENDS 】
神經網絡與符號人工智能的工作方式不同。因為神經網絡由數據驅動,而非基于規則。
正如 David Cox 對《數字趨勢》雜志所說:
不可否認,深度學習神經網絡帶來了驚人的進步,但同時也出現了一些問題,令人擔憂。
實際上,David Cox 提到的問題恰恰依賴于讓今天的神經網絡變得如此強大的東西——數據。就像人一樣,神經網絡是根據例子學習的。但是,一個人可能只需根據一兩個例子就能正確地記住一件事,但人工智能需要更多例子。同時,準確性的高低取決于是否具有大量的注釋數據,因為學習每個新任務都基于這些數據。
燃燒的交通燈
正是因為神經網絡的上述特點,它們并不擅長“黑天鵝”問題,由 Nassim Nicholas Taleb 提出的黑天鵝事件在統計學上是罕見的。David Cox 表示:
目前許多深度學習解決方案盡管非常驚人,但都基于二八定律(雷鋒網注:這一定律認為在任何一組東西中,最重要的只占其中一小部分,約 20%,其余 80% 盡管是多數,卻是次要的)。深度學習在 80% 的情況下是對的,但重要的實際上占少數。如果你看到一個物體本不該處于目前所在的位置,或者方向有點奇怪,這種情況下,即便是再驚人的系統,也起不了作用。
在加入 IBM 之前,David Cox 與別人共同創辦了 Perceptive Automata 公司,為自動駕駛汽車開發軟件。該團隊在他們名為 Slack 的頻道發布了數據收集過程中偶然發現的有趣圖片。其中一張照片是在十字路口拍的,照片上的交通燈著火了,對此 David Cox 表示:
這真是一輩子難遇的事情。我不知道 Waymo 和 Tesla 在訓練神經網絡的數據集中是否有交通燈著火的圖像,但我敢打賭,就算他們有,數量也會很少。
其實,這就是一件無關緊要的事,因為它很少發生,即便發生了,也并不是很緊要。如果系統推薦一個人去了一家很糟糕的餐廳,這樣自然不太好,但可能還不足以毀掉他的一天,只要系統以前提出的 99 條建議都是不錯的,就沒必要特別沮喪。
但是,如果一輛自主駕駛汽車在十字路口面對燃燒的交通燈或一輛馬車不能做出正確的反應,后果則不堪設想。這可能是小概率事件,但我們也希望它能夠很好地應對這類情況。
David Cox 解釋說:
如果有能力推理、判斷,我們就能輕松應對。如果我看到交通燈著火了,我最起碼會有一些基本判斷,比如目前不能根據交通燈判斷我是該停還是該走,但我知道要注意安全,因為周圍的司機也會感到困惑。但我可以根據另一個方向行駛的車輛判斷接下來的行動。在這種以安全完成任務為關鍵的環境中,深度學習還不能很好地服務我們。這就是我們需要其他解決方案的原因。
將邏輯與學習相結合
因此 David Cox 便提出了神經符號人工智能的想法。
所謂神經符號人工智能,其實就是把以上方法結合起來,把學習和邏輯結合起來。
神經網絡可以幫助符號人工智能系統變得更聰明——通過將世界分解成符號,而不是依靠人類程序員來為它們做這件事。同時,符號人工智能算法可以結合常識推理和行業知識,并運用到深度學習中。這些都會使人工智能更好地處理從自動駕駛汽車到自然語言處理的一切復雜任務,同時訓練所需的數據也要少得多。
David Cox 說:
神經網絡和符號化的概念之間,存在著非常完美的互補關系。因為神經網絡可以給你答案,將混亂的現實世界變成一個系統性的符號表征,在圖像中找到所有關聯。只要有了這種符號表征,就能在推理方面有所突破。
同時,這不僅適用一小部分情況,越來越重要的是,人工智能系統在必要時是可解釋的。神經網絡可以非常好地執行某些任務,但它的許多內部推理是“黑箱”式的,對于那些想知道它是如何做出決定的人來說是難以理解的。
同樣,如果一個機器人在音樂流媒體平臺 Spotify 上推薦錯誤,其實并不太重要。但是,如果你被拒絕銀行貸款,被拒絕工作申請,或者有人在涉及自動駕駛汽車的事故中受傷,我們則需要了解為什么人工智能會提出相關的建議。這個時候神經符號人工智能便能派上用場了。
人工智能研究的未來
幾十年前,符號人工智能和神經網絡還是完完全全的兩個世界,相互對立。人工智能領域的大佬們常常各執一詞,在支持一種方法的同時,必將否定另一種方法。實際上,他們的做法未必不妥,畢竟資金有限,要解決同樣的問題,兩派必定會競爭。而如今看來,情況似乎正好相反。
另外,David Cox 還表示:
看到年輕一代真的很有意思,我團隊中的很多人都比較年輕,有的剛剛博士畢業,對這個領域保持著新鮮勁兒和興奮感。他們沒有經歷過符號人工智能和神經網絡相互對立的時代,也不在乎二者曾經對立過——其實這種不在乎就非常好,因為它能讓人打開心扉,消除偏見。他們很樂意探索未知,用人工智能做點很酷的事。
如果一切按計劃進行,所有人都將從中受益。
責任編輯:Ct
評論
查看更多