(文章來源:36氪)
對人工智能最新進展的批評者抱怨說,盡管這些進展已經給AI系統中帶來了顯著進步,但這些系統依然未能展現出“真實”、“正確”或者“真正”的理解。像“真實”、“正確”以及“真正”之類詞匯的使用意味著“理解”是二進制的。一個系統要么表現出“真正”的理解,要么就是沒有理解。
這種思維方式的困難在于,人類的理解永遠都不是完整和完美的。在本文中,我將提出“理解”是能力的系列連續譜。比方說,不妨考慮一下“水”的概念。大多數人都理解水的許多特性:水是濕的,水可以喝,植物需要水,溫度很低的話水會結成冰,等等。但不幸的是,很多人不理解,水是導電體,所以,淋浴的時候不應該用風筒。盡管如此,我們不會說這些人對誰缺乏 “真實”、“正確”或“真正”的理解。相反,我們會說他們對水的理解是不完整的。
我們也應該以同樣的態度來評估我們的AI系統?,F有的系統已經表現出了某些類型的理解。比方說,當我讓Siri“打電話給Carol”,然后它能夠撥打正確的號碼時,你就很難說服我說Siri并不理解我的要求。當我問Google“IBM的深藍系統擊敗了誰?”,后者返回一個信息框,給出用大寫字母寫成的“卡斯帕羅夫”時,它就已經正確地理解了我的問題。當然,這種理解是有限的。如果我接著問它“什么時候?”的時候,它只會給我提供一個“when”的字典定義——而不會把我的問題解釋成對話的一部分。
關于“理解”之爭可以追溯到亞里斯多德,也許John Searle的“中文房間”思想實驗對此闡述得最清楚。我鼓勵大家可以去看看《斯坦福哲學百科全書》里面科爾的那篇出色的文章。我的態度是一種功能主義的形式。我們從功能上去表示理解,并且根據大腦或者某AI系統各種內部結構在產生所衡量的功能中存在的因果關系來評估它們所做的貢獻。
從軟件工程的角度來看,功能主義鼓勵我們設計一系列測試去衡量系統的功能。我們可以問一個系統(或一個人),“如果把水冷卻到–20度會發生什么?”或者“如果在洗澡的時候用吹風機會發生什么?”然后對回應進行衡量。就回應恰當而言,我們可以說系統理解了,而如果說回答錯誤的話,我們可以說發現了系統存在不理解的情況。
為了讓一套系統能夠理解,它必須建立不同概念、狀態和動作之間的關聯。今天的語言翻譯系統可以正確地把英語的“水”跟西班牙語的“agua”關聯到一起,但是它們沒有在“水”和“電擊”之間建立起任何的關聯。
對于最新的AI進展,批評大都來自兩個方面。第一個是,(研究人員、前者所在的組織,甚至政府以及資助機構)圍繞著人工智能的炒作已經達到了極端水平。這種炒作甚至引發了對“超級智能”或“機器人末日”迫在眉睫的恐懼。批評對于抵制胡說八道至關重要。
對深度學習的批評已經把我們帶到了新的方向。尤其是,一方面已經證明深度學習系統在各種基準任務上跟人類的表現可以相匹敵,但另一方面又不能將其推廣到表面上非常相似的任務上,這已經導致了對機器學習的批評。研究人員正在用新想法予以回應,比方說學習不變性(learning invariants),發現因果模型(discovering causal models)等。這些想法既適用于機器學習的符號主義也適用于聯結主義。
我相信我們不應該去爭論什么才算是“真正的”理解。相反,我鼓勵大家把那個先放到一邊,去尋求人工智能的科技進步,把焦點放在未來5、10或者50年內應該努力去實現哪些系統功能上面。我們應該根據可以在AI系統上進行的測試來定義這些功能,來衡量它是否具備這些功能。為此,這些功能必須是可操作的。簡而言之,我的觀點是要AI開發要以測試為驅動。這需要我們把我們對“理解”和“智能”的模糊概念轉化為具體的,可衡量的能力。這本身就是一個非常有用的練習。
與此同時,人工智能的研發正在為我們提供可以為社會帶來價值的,功能越來越強大的系統。無論是出于學術誠信還是為了繼續獲得資助,人工智能的成功要歸功于那些研究人員,而存在的問題也需要他們站起來負責,這一點很重要。我們一方面必須壓一壓那些圍繞著AI新進展進行的炒作,另一方面,不管我們的系統是怎么理解或者不理解用戶、目標以及所處的更廣闊世界的,我們也必須客觀地予以衡量。我們不要再把我們的成功視為“假的”,不夠“真實”而摒棄,而應該繼續以誠實的、富有成效的自我批評去推進AI發展。
(責任編輯:fqj)
-
人工智能
+關注
關注
1792文章
47436瀏覽量
238981 -
深度學習
+關注
關注
73文章
5508瀏覽量
121295
發布評論請先 登錄
相關推薦
評論