心理學是通用人工智能最好的腳注。
現在,隨手翻閱任何心理學和人工智能的教材,都很難從學科內容上窺探出二者存在何種關聯。但事實上,若論對人工智能研究的影響,大概沒有哪門學科能夠與心理學相媲美。從人工智能創立之初的紐厄爾(Allen Newell)、西蒙(Herbert A. Simon)及尼爾森(Nils J. Nilsson),到中期的安德森(John Anderson)、霍金斯(Jeff Hawkins)、巴赫(Joscha Bach),再到近期的辛頓(Geoffrey Hinton)、馬庫斯(Gary Marcus),這些人工智能的翹楚不是心理學家就是具有心理學背景。在推動人工智能進步的過程中,心理學都在直接或間接地發揮著重要的作用。然而,在當前的語境下,二者的背離卻無疑比其聯系更為突出。
1、人工智能與心理學融合的“貌合神離”
在大數據基礎上,深度學習和強化學習技術勢如破竹,正引領著時下人工智能的熱潮。一方面,相比于上世紀八十年代的淺層神經網絡,深層神經網絡不僅在圖像、語音及自然語言處理等方面大放異彩,而且與人類大腦神經系統的多層結構更加相似;另一方面,強化學習通過與環境互動所獲得的獎懲而調節系統權重結構,使主體在最大化期望獎勵誘導下不斷修訂從狀態到動作的映射策略,從而實現快速提升系統性能的目的。前者受到認知神經科學的啟發,后者則與心理學中經典的行為主義范式如出一轍。更不必說,為了改進深度學習和強化學習技術而引入的注意力、長短時記憶等機制幾乎是直接照搬了心理學術語,用心理學詞匯和理論武裝人工智能之勢現已蔚然成風。
這并不奇怪,畢竟人工智能的核心目標就是研發愈加接近人類的高級的智能系統,而真正的智能也必然具有一定的心理活動。在這種情況下,公眾對人工智能的期望水漲船高,人工智能“友善論”或“威脅論”的論調層出不窮,文學和影視作品則及時將其呈現到人們的眼前,仿佛類人智能機器人明天就會到來一般。
與此同時,人工智能產品也迅速地向心理學領域滲透。基于面部表情的情緒識別系統,基于大數據分析技術的輿情分析或自殺預警系統,基于GIS的大規模人群跟蹤調查系統,基于VR技術的心理健康干預系統,基于行為特征的測謊系統等等。遺憾的是,琳瑯滿目的各色項目解決的只是心理學的應用問題,而對于心理學核心的理論問題卻沒有什么實質性的幫助。實際上,當前人工智能領域中主流的深度學習和強化學習與人腦和心理差距甚遠。
首先,從構成單位上看,人腦的神經網絡與深度神經網絡非常不同,深度神經網絡最小單元一般為同類的神經元,但人腦的神經元不僅類型眾多、功能各異,而且神經元也不是最底層的加工單位;從網絡結構上看,深度神經網絡中大部分節點是等同的,但人腦不同的腦區甚至腦區內部,都可能存在很大的差別;從編碼方式上看,人腦神經元雖然能夠產生可表征為[0,1]的動作電位,卻是通過動作電位的頻率對信號進行編碼的,而人工神經網絡卻不都是如此;從信息加工方向上看,深度神經網絡最經典的訓練方式為反向傳播,但大腦中似乎不存在類似的反向傳播機制。
其次,人的注意力和記憶系統具有很強的語義性加工導向,而深度學習中的注意力機制靠的是輸入與當前上下文信息的統計映射而非語義理解。長短時記憶網絡(LSTM)中的記憶和遺忘也與心理學中對應概念所指內容完全不同,比如長短時記憶網絡中的遺忘是主動控制的,而人腦的遺忘過程卻是在人們控制之外的自發性行為。有趣的是,人們往往越想遺忘就越忘不了。
再次,人類的學習過程遠非刺激-反應這般簡單。無數心理學和教育學證據指出,人類學習是非常復雜的行為,是內隱和外顯兩種方式有機的融合,是對環境主動的加工,也是新信息與已有經驗不斷動態建構的一種生態表現。然而,類似巴普洛夫的狗和斯金納的鼠,在強化學習中要求對行為結果必須具有確定性的獎懲判斷以鞏固經驗。但是,在真實的開放世界中,人腦中經驗往往具有模糊性,甚至有時是對抗和矛盾的,難以清晰辨識好壞優劣。當然,教育心理學中行為主義范式的沒落就是一例最好的證明。
因此,有人調侃道:總結近年人工智能進展,就是沒有進展。雖說也有些言過其實,畢竟33億個詞匯、1億個參數的Bert模型還是在NLP領域中令人眼前一亮,很多無人駕駛汽車也穿著“滑板鞋”在真實的路面不斷“摩擦”,OpenAI則開啟微軟云計算這頓“最后的晚餐”。但這既與人類心理活動遙不可及,也依舊對微妙篡改的對抗數據束手無策,更未能添補神經網絡模型在泛化性、可解釋性上的理論黑洞。也便不難理解,MIT和IBM發布ObjectNet這一更加貼合現實的新圖庫,各路算法便像中了妖術一般折戟沙常
2、人工智能與心理學交叉的“主戰場”──類腦智能
基于一個似乎不言自明的前提,有些人工智能研究者為自己設定了一個可行目標:既然人腦肯定有智能,那么只要能夠在軟件中復現或部分復現人腦,也一定能夠實現或者部分實現智能。也就是說,智能源于生理結構,“模擬出類似人的大腦,機器才能產生真正的智能”。
于是,計算機與計算神經學在此攜手匯合,并出現“類腦智能”的新分支,又因所需模擬尺度的差異分為局部和全腦兩個不同的類別,前者往往是具有計算機功底的神經心理學家,通過構建小型計算模型來模擬和解釋人類的心理問題,優點是針對性強、運算量孝開發難度低,缺點是模型的泛化性差且生態效度不高。國內代表性工作有華東師范大學心理學院郭秀艷教授的內隱學習模型及華南師范大學陳奇教授心理數量表征的計算模型。后者則聚集了具有神經心理學功底的計算機科學家,認為智能是整體涌現的功能,局部性的向下分解將失去智能特性。因此,這一學派學者從一開始就強調“全腦計算”,試圖在全尺寸上整體仿真人腦。考慮到人腦生理的復雜性,模型的建立一般由易到難,大多從低等動物開始,然后由低等哺乳類動物向高等哺乳類動物過渡,最終實現對人腦系統的模擬。優點是通用性強、模型擴展性和泛化性強,缺點是開發、運行和維護難度大、成本高,同時模型的可解釋力較弱。國內代表性工作是中科院計算所曾毅教授團隊的鼠腦和猴腦模型,已經可以在猴腦模型控制下實現機械眼和機械臂對陌生物體識別和抓取的高效學習[1]。
螳螂大臂的鋸齒和木工鋸子如出一轍,魚鰾和潛水艇的壓載水艙也是異曲同工;然而,同樣也很明顯,蝙蝠的耳朵和雷達長相完全不同,人類通過捆扎翅膀并不能飛行,而最終制造出來飛機既沒有羽毛,也沒有翅膀的上下扇動。這說明,仿生是人類向自然求教、收獲知識并改造世界的一條有效路徑,卻未必是唯一路徑。因為飛行能力背后的依據是抽象的空氣動力學,這種抽象能力的實現固然需要載體,但載體之間的差異可能非常大。
事實上,所有種類的能力在本質上都是抽象的。比如:生命是一種生存延續的能力,其載體既可是動物、植物、微生物,也可以是計算機病毒之類的虛擬人工生命形態。而人腦恰好是智能與生命兩種能力的統一實現,因此腦科學的所有研究成果同時具有兩種不同能力的成分,很難在純粹的心理和純粹的生理作用下劃清邊界。這便是人工智能視域下心理學和腦科學相關研究所面臨的第一個難關:智能的能力和智能的載體之間耦合所產生的矛盾。因此,從某種意義上講,“仿腦”有可能是“仿心”道路上最艱難、最曲折、最漫長的一條彎路。
其實,類腦并不等同于仿腦,仿腦只是類腦研究中的一個組成部分。類腦研究分為兩個不同的導向:“仿生”和“仿心”。心理學家和計算機學家在其中又扮演著不同的角色:
“仿生”就是仿刻大腦的生理活動[2],是由計算機學家主導的,或者實現部分或整體的軟件腦,或者制作含有某種認知功能的軀體機器人,甚至模擬神經遞質系統而得到諸如情感之類的心理功能;
“仿心”則是描繪大腦的心智活動,這是由心理學家所主導的,用以解釋人類認知的一般規律。
其中,一部分“仿心”學者特別強調認知中元規則的基元特點,他們認為:“理性”和“非理性”、“創新性”和“非創新性”、“意識性”和“無意識性”之間非但沒有明晰的劃分,而且從本質上看都是一致的。這樣的理論有很多,代表性工作有奧爾松(Ohlsson)的深層學習假說、巴爾斯(Baars)的全局工作空間理論、迪昂(Dehaene)的全局神經元工作空間理論以及托諾尼(Tononi)的整合信息理論等。然而,二者優劣互補卻毫不兼容“仿生”的操作性強、容易落地,但難以生成高級認知功能;“仿心”理論性強操作性差,系統很難落地實現。這一死局直到通用人工智能的壯大才出現了重要的轉機。
3、通用人工智能類腦智能戰場上的“突擊隊”
類腦智能另一種“仿心”的派別便是通用人工智能。通用人工智能認為存在一般性的智能能力,而其實現的載體也未必非得壘筑于血肉之軀,計算機軟件系統同樣可以具備這一能力。通用人工智能正是人工智能的原初意義和目標,但隨著人工智能領域的曲折發展,“人工智能”一詞現已逐漸偏離了最初的內涵,而被賦予了更為混雜的含義。為確保通用人工智能討論的清晰性,有必要先對人工智能進行明確的限定和說明。
在常見討論中,對人工智能內部的領域有三種區分方式[3]:第一種,分為計算智能、感知智能和認知智能三個領域;第二種,分為弱人工智能和強人工智能兩塊,而強人工智能也正是通用人工智能;第三種則分為專用人工智能和通用人工智能兩塊。第一種分類常見于行業演講和報告中,既缺乏理論依據又具有誤導性。實際上,所謂的計算智能和感知智能并不是真正意義的智能,但卻錯誤地將智能實現分成三步,而且認為當前已經完成前兩步即將走完最后一步,殊不知認知智能根本不是如此實現的。第二種則始于哲學討論,“強弱”意指智能的真假之分,卻被誤讀為智能的寬與窄之分,事實上,三種概念體系之間不存在等同關系。只有第三種分類──“專用人工智能”和“通用人工智能”才是真正符合和適合當下語境交流的正確概念分類,即:
人工智能(AI)= 專用人工智能(SAI)+ 通用人工智能(AGI)
人工智能本質上為類人智能,即追求設計和開發像人腦那樣工作的軟硬件系統。對于“智能”理解的差異,使人工智能分化為專用和通用兩個不同分支。其實,專用和通用存在根本性差異:專用人工智能的目標是行為層面上“看起來像有智能”,通用人工智能關注系統從內在層面上“如何才能實現真正的智能”。專用人工智能先做后思,即開始并不深究智能也不對智能做清晰的定義,而是通過技術迭代漸進式地提升智能化的程度,分為符號主義、聯結主義和行為主義三個學派。通用人工智能則認為智能的存在代表著可以被認知的理性原則,采取先思后做的路徑。
實際上,通用人工智能內部也存在不同學說和派別。本文基于的“智能的一般理論”及其“非公理邏輯推理系統(NARS)”的工程實現,便是通用人工智能領域中一個具有代表性和影響力的方案。其對智能的工作定義為:智能就是在知識和資源相對不足的條件下主體的適應能力[4]。
智能絕非全知全能或定然比人更聰明。正是基于知識和資源相對不足的假設,而非某種預設的高深叵測的算法,NARS系統才“恰好”不但具有感知、運動等低層活動(配備機械軀體和傳感器),也具有類似人腦的情感、記憶、推理、決策乃至自我意識等高級認知活動。同時,系統尤其強調經驗的可塑性,以及經驗與系統個性和自我發展的相互影響。然而,這些自生的高級認知活動是專用人工智能系統根本不具有的。一言以蔽之,那便是:能思考、有情感、有自我意識的智能系統已經存在。
4、通用人工智能與心理學融合的“貌離神合”
與專用人工智能和心理學之間的“貌合神離”正好相反,通用人工智能與心理學則是“貌離神合”。通用人工智能理論對心理學相關研究具有重要的推動作用,畢竟在思維層面上對人腦的運行機理、認知的基本機制、學習的基本機制以及精神疾病等問題的研究和探索,遠比行為(行為實驗、口頭報告)和生理層面(眼動、腦電、肌電、fMRI等)來得更為直接和有效。
基于通用人工智能的基本假設,在認知科學框架內可得到如下基本理論假設:
1. 大腦的智力有先天和后天兩種成分,先天遺傳的是元水平的智能,后天養成的是經驗水平的技能;
2. 先天與后天的結合使得大腦以任務加工系統的形式存在。經驗系統具有耦合的內部結構,即記憶空間和加工空間是耦合的。由于知識和資源的相對不足,相關記憶通常不會全部參與認知加工;
3. 因受限于資源所導致的記憶和加工的矛盾,必然表現出并行和串行兩種不同的處理方式,但背后卻只有統一的、一種內在的元認知機制(NARS采用非公理邏輯實現了這種元認知,當然也存在其他形式);
4. 任務的加工和保持需要認知資源的投入,由于知識和資源的相對不足,任務的執行具有不同的優先等級;
5.任務與經驗(記憶、知識)同源同形,認知加工表現出內涵和外延有機結合的整體性特征,核心實現方式并非基于概率,而是基于證據的度量。
理論的生命力突出表現在解決悖論的能力上,且不說NARS先天具備諸如演繹、歸納、歸因、例示等與人類相一致的強弱推理的“理性”能力,更能夠在“非理性”方面也表現出跟人類高度相似的特點。最顯著的例子莫過于“合取謬誤”了,現以心理學經典的Linda悖論為例進行說明:
給定如下背景信息,“Linda是一位31歲的單身女性,直率并且非常聰明。在大學期間,她主修哲學,對種族歧視問題和社會偏見非常關注,同時也參加過反核示威游行”。然后,要求被試基于這些信息對Linda的身份進行判斷,哪種說法更能成立:
(A)Linda 是一名銀行出納員;
(B)Linda 是一名信奉女權主義的銀行出納員
被試不論老幼幾乎都壓倒性地選擇了B,但從概率上看,很明顯,兩個事件共同發生的概率要低于其中任何一個單獨事件,就是說“信奉女權主義的銀行出納員”只是“銀行出納員”中的一小部分,所以A應該比B可能性更高。但不論經濟學家還是心理學家對這個結果都非常頭疼,絕大多數心理學家試圖在概率論和“非理性”心理活動之間進行調和。盡管相關學說和理論層出不窮,也僅僅能夠合理地解釋其中個別案例,局限性依舊突出。因此,人類思維的選擇一次又一次被扣上“非理性”的帽子。
但是,如果換做NARS的理論視角,人們對于某個事物的判斷源于對其的理解,而對事物的理解則是該事物在當前這個人經驗體系中內涵性證據和外延性證據的總和。對于(A)而言,所有已知背景信息都與銀行出納沒有直接關系,因此未能提供外延性證據;但對于(B)而言,背景信息給出的幾乎都是美國女權主義者的典型描述,因此直接提供了許多內涵性證據。雖然概率論只承認外延性證據,這個題目卻誘導人們做出內涵性判斷,而這項實驗結果的秘密就在于此。人腦的認知同時加工內涵和外延,但概率論卻只是外延性的[5]。
因此,“錯誤的”和“非理性的”并不是人腦,而是概率論本身的局限。心理學諸多悖論實驗所印證的不是人類的“非理性”,而恰恰是人類的“理性”。當前,專用人工智能以概率論為基石,甚至有人喊出“人工智能就是概率論”的口號,心理學亦受極大影響,值得學界高度警惕。
更進一步地,并非所有人對Linda問題都有一致的回答,相關研究發現“具有高認知能力的人”就能避免框架效應,而具有統計學背景的被試尤其突出,因為他們可以有意識地遵循概率論而拒斥內涵性證據。其實,在NARS系統中當然也可以復現這個結果,與之前普通人之間的差異僅在于是否具有概率框架的先驗經驗。貌似這只是一件無足輕重的小事,但實際上反映的卻是人工智能視域下心理學和腦科學相關研究所面臨的第二個難關:智能的能力和智能的內容之間耦合所產生的矛盾。
與人一樣,通用人工智能系統并不能直接產品化,就像我們無法要求一個剛出生的嬰兒去統計財務報表或進行天文學研究一樣,需要后天的教育和培養過程才能讓其掌握領域專長并像人一樣地從事相關工作。這就意味著,僅有先天智能并不能夠直接體現出主體的智力水平(或者只能夠在種群層面上得以體現),只有充實和建構了主體經驗這些智能的內容之后主體才能夠在開放世界展現出智能的外在表現。
值得注意的是,已有心理學和腦科學的相關實驗,既包含了智能的能力本身,又包含了智能的內容,但智能的內容對于每位被試都不完全一致,隨機取樣差異更大。因此,相關實驗的結論反映了穩定的部分(如智能的能力及智能內容中共有的部分),從而使得結論達到統計學要求。但是,如果實驗本身涉及被試智能內容中異質性的部分,那么心理學實驗結果的重復就變得更加困難。這也是近年來心理學諸多研究成果因無法復現而被人詬病,并被批評“偽科學”的根本原因所在。
總之,通用人工智能的優勢為人工打造出一個在思維層次上運行的類腦系統,具有與人類似的思維模式、決策機制等,這是對心智研究的理想仿真平臺,其理論對心理學也具有重要的啟發。反過來,心理學既是人類心智最直接的刻畫,同時也是通用人工智能最好的腳注。
責任編輯:ct
評論
查看更多