人們在日常生活中經常需要識別不同的面孔,其中既包括我們所熟悉的親屬、朋友、同事及知名人士等的面孔,也包括陌生人的面孔。人臉識別是一項非常復雜的任務,值得眾多學科研究。俄羅斯心理語言學研究表明,視角、光色、情感、心理和言語行為等都影響人臉識別。此外,隨著人的成長和衰老,頭部、面部的結構和特征也會發生變化,皮膚、輪廓以及毛發顏色等都是人臉識別的參考因素。因此,在探討人臉識別問題的過程中,學界需要不斷創新研究方法,從不同角度挖掘人臉識別機制。
多視角思考人臉識別機制
人臉識別的本質是復雜的,其研究是現代認知科學的關鍵構成要素之一。人工智能研究者和心理語言學家都試圖了解如何從心理圖像角度來探討人臉識別問題。了解面部表情背后的心理運作機制有助于深入認識人類的大腦是如何處理、存儲相關信息的。人類所擁有的識別陌生人臉的能力涉及許多復雜的問題,目前科學家所開發出的最好的人臉識別算法也還無法完全解答所有的相關問題。
因為,每個個體的面孔都是特殊的,承載著不同人物的心理、生理和社會背景等諸多層面的信息。人類的人臉識別能力可以讓我們的大腦處理眾多人臉識辨問題,遠超現有各類機器對單個對象的識辨能力。可以說人臉識別意味著對面孔進行感知編碼,并將此特定代碼存儲在人腦中,有時甚至無需參考姓名、身份、國籍等社團族群信息。
由于其所涉及的問題較為復雜多樣,在人臉識別研究方面,不同領域的專家學者會使用不同的研究方法。心理學領域的學者研究人臉識別問題,主要從人臉感知所涉及的心理和神經生理機制視角來進行,如對參與者健康狀況的認知研究、對新生兒及青少年的發育情況、神經心理和精神病學研究等,當然也涉及大腦成像技術、計算機模擬比較研究、鑒定物種同源物等實際應用領域。神經影像學相關技術讓科學家們對人腦的結構、功能有了更深層次的了解。俄羅斯心理語言學界近年來的大量實證研究表明,人臉識別是其關注的焦點問題。
有關學者進行了許多嘗試,利用心理學、神經學數據來修改、優化自動面部識別系統。近年來,在俄羅斯普通心理學、社會心理學、心理生理學、心理語言學和臨床心理學等領域,人臉識別研究得到了長足發展。信息學、神經科學、人類學、醫學和美學等學科的學者也對這個問題表現出了很大的興趣。
深度挖掘人臉識別的心理維度
人的面部和表情特征等與主體的性格、身份、自我意識直接相關,可傳遞復雜的個體情感和社會文化特征。在人類的大腦內部有專門負責人臉識別的區域,只在進行人臉識別時才會被激活。視覺研究人員和心理學家都試圖揭示出這種特殊的視覺工作機制,以了解應該如何創建科學的人臉識別系統。而掌握和理解面部識別機制,提高人工智能的面部識別質量,也是人工智能研究人員所關注的問題,因此,心理學家在此領域所獲得的研究數據,經常會被應用到人工智能研究者的工作中。
從心理學角度看,人臉識別是人在感知事物時為特殊對象創建心理圖像,然后在處理信息時將其替換為另一對象物的過程。因此,這種心理圖像是客觀世界的反映。學界普遍稱之為“心理意向”,將其視為準感知體驗。它一般在沒有外部刺激的情況下發生,在一定程度上起到了心理表征作用。心理學研究者早已對視覺圖像的思維屬性有所涉獵,認為心理或大腦中存在的圖片形式表征是由心理圖像引起的。通常圖像體驗與主體過去的真實感知體驗相呼應。
重視人臉識別語義微分實驗
人類在交際過程中主要通過觀察對話者的臉部特征信息,來評估其性格和情緒。知覺主體將對話者視為一個獨立統一體,窺探情緒符號和個人特征。此外,在交流過程中,交際各方會不斷透過面部表情等讀取人的內心世界。因此,一些研究人員將其與文字進行比較。當交際參與者“閱讀”彼此的臉時,我們對人的心理印象會發生變化。人在觀察到他人的面部特征信息后對其看法可能會發生根本改變。實際上,一個物理對象替代另一個物理對象或演變成為某事物時,人腦中會產生相應的符號交替。
人臉也是一種物理對象,可以表現出個體的內部心理活動。交際過程中,個體信息的主要來源是觀察。對他人心理肖像及情緒感知的判斷,不僅涉及觀察者所看到的對話者的面部特征和結構,還涉及主體智力、情感和意志等因素。因此,面部可以被認為是由不同的“生理層”組成的多維、多層次結構實體。人臉的狀態反映了特定情況下人的情緒狀態,但也存在影響臉部穩定的因素,如歲月流逝造成的變形、褶皺等。
俄羅斯心理語言學界進行了一系列實驗來探尋面部感知涉及的心理語義機制。這種人臉識別的實驗實質是語義微分實驗的變體。實驗受試者往往被限定在某一社團群體中,男女比例大致相等。所有受訪者均來自特定國家,其人數足以使用語義微分法,一般使用人的臉部圖像作為實驗材料。研究人員使用從互聯網上搜集到的真實人物面部照片(受試者一般不認識這些人物),對其進行編輯,去掉除頭部圖像以外的所有部分;同時另外選取現實生活中存在的某個社會團體的典型代表形象。
實驗的受試者一般都是同一母語承載者,在看到、感知、記憶人像后,他們會被要求填寫表格以評估心理語義等級,一般是從-3到3。其中負數表示負面特征,正數表示正面特征。具體來講,如果受試者認為圖片中的人是“邪惡的”就用負數,如果想表示“他是好人”則用正數,而0表示不持有心理語義等級或看不出其面部折射的心理語義特征,也就是說0可以表示“非善非惡”。通過這種由負到正的遞歸可以建構受試者的心理語義等級,這就是人臉識別過程中語義刻度微分的縮影。
實驗后研究人員會使用數據分析方法和統計軟件處理從受訪者處獲得的數據。這種方法起源于心理語言學先驅、美國心理學家查爾斯·埃杰頓·奧斯古德的語義微分研究,多用于測量詞義。它以雙極形容詞的通用性和簡單性特征為基礎,在俄羅斯心理語言學界頗受歡迎。
當然,感知圖像和記憶圖像之間存在差異。一部分受試者收到圖片,并被要求在填寫問卷的同時仍要保留圖片;另一部分受試者則被要求審視給定圖片1分鐘,然后將圖片上交,憑借記憶回答問題。結果證明,人的心理圖像特征因其理解方式而異。人的面部視覺特征本身具有闡釋力,可刺激形成心理圖像。受試者不僅會判斷所看到的人臉外觀,也會根據外貌來描繪人物的性格。這說明人類的大腦不僅可以準確存儲個體圖像特征,還可處理心理和外表特征,優化存儲并提取此類信息。
綜上所述,筆者認為,從包括心理語義學的跨學科的視角,開展綜合性的廣泛研究,將有助于人臉識別研究的發展。
責編AJX
-
圖像處理
+關注
關注
27文章
1293瀏覽量
56777 -
人臉識別
+關注
關注
76文章
4012瀏覽量
81961
發布評論請先 登錄
相關推薦
評論