是否有一個(gè)程序可以通過(guò)讀取潛在的***的面部表情和行為來(lái)發(fā)現(xiàn)他們?
這是美國(guó)交通安全管理局(TSA)于2003年提出的一個(gè)假設(shè),當(dāng)時(shí)它開(kāi)始測(cè)試一個(gè)新的監(jiān)控程序,稱為“通過(guò)觀察技術(shù)篩查乘客”,簡(jiǎn)稱SPOT。
在制定該計(jì)劃時(shí),他們咨詢了舊金山加利福尼亞大學(xué)心理學(xué)榮譽(yù)教授Paul Ekman。幾十年前,Ekman開(kāi)發(fā)了一種識(shí)別微小面部表情并將其映射到相應(yīng)情緒的方法。這種方法被用來(lái)訓(xùn)練“行為檢測(cè)人員”,以掃描面部是否有欺騙跡象。
但是當(dāng)該計(jì)劃于2007年推出時(shí),卻遇到了問(wèn)題。官員們或多或少地隨意運(yùn)用該技術(shù)對(duì)人進(jìn)行審訊,而且少數(shù)逮捕行動(dòng)是與恐怖主義無(wú)關(guān)。更令人擔(dān)憂的是,該計(jì)劃據(jù)稱被用來(lái)證明種族相貌的合理性。
Ekman試圖將自己與Spot保持距離,聲稱他的方法被誤用了。但其他人認(rèn)為,該計(jì)劃的失敗是由于過(guò)時(shí)的科學(xué)理論支撐了Ekman的方法。
近年來(lái),科技公司已經(jīng)開(kāi)始使用Ekman的方法來(lái)訓(xùn)練從面部表情中檢測(cè)情緒的算法。一些開(kāi)發(fā)人員聲稱,自動(dòng)情緒檢測(cè)系統(tǒng)不僅比人類更好地通過(guò)分析面部表情來(lái)發(fā)現(xiàn)真實(shí)的情緒,而且這些算法將適應(yīng)我們內(nèi)心的感受,極大地改善了與設(shè)備的交互。
但是,許多研究情緒科學(xué)的專家擔(dān)心這些算法根據(jù)錯(cuò)誤的科學(xué)理論會(huì)做出高風(fēng)險(xiǎn)的決定,也將可能再次失敗。
識(shí)別你的臉:一個(gè)200億美元的行業(yè)
情緒檢測(cè)需要兩種技術(shù):
計(jì)算機(jī)視覺(jué),精確識(shí)別面部表情;
機(jī)器學(xué)習(xí)算法,分析和解釋這些面部特征的情緒內(nèi)容。
通常,第二步采用一種稱為監(jiān)督學(xué)習(xí)的技術(shù),通過(guò)這種技術(shù),一個(gè)算法被訓(xùn)練來(lái)識(shí)別它以前見(jiàn)過(guò)的東西。基本的想法是,如果你在看到一張新的快樂(lè)臉譜圖時(shí),用標(biāo)簽“快樂(lè)”來(lái)顯示成千上萬(wàn)張快樂(lè)臉譜圖的算法,它會(huì)再次將其識(shí)別為“快樂(lè)”。
研究生Rana el Kaliouby是第一批開(kāi)始嘗試這種方法的人之一。2001年,在從埃及搬到劍橋大學(xué)攻讀計(jì)算機(jī)科學(xué)博士學(xué)位后,她發(fā)現(xiàn)自己花在計(jì)算機(jī)上的時(shí)間比其他人更多。她認(rèn)為,如果她能教電腦識(shí)別情緒并對(duì)她的情緒狀態(tài)做出反應(yīng),那么她遠(yuǎn)離家人和朋友的時(shí)間就不會(huì)那么孤獨(dú)。
Kaliouby致力于這項(xiàng)研究,并最終開(kāi)發(fā)出一種輔助阿斯伯格綜合癥兒童閱讀和回應(yīng)面部表情的設(shè)備。她稱之為“情緒助聽(tīng)器”。
2006年,Kaliouby加入麻省理工學(xué)院的情緒計(jì)算實(shí)驗(yàn)室,與實(shí)驗(yàn)室主任Rosalind Picard一起繼續(xù)改進(jìn)和完善該技術(shù)。然后,在2009年,他們共同創(chuàng)辦了一家名為Affectiva的創(chuàng)業(yè)公司,這是第一家營(yíng)銷“人工情緒智能”的公司。
起初,Affectiva將他們的情緒檢測(cè)技術(shù)作為市場(chǎng)研究產(chǎn)品出售,為廣告和產(chǎn)品提供實(shí)時(shí)的情緒反應(yīng)。他們找到了客戶,如Mars、凱洛格和哥倫比亞廣播公司等客戶。Picard于2013年離開(kāi)了Affectiva,并加入了一家不同的生物識(shí)別創(chuàng)業(yè)公司,業(yè)務(wù)繼續(xù)增長(zhǎng),圍繞它的行業(yè)也是如此。
亞馬遜、微軟和IBM一直將“情緒分析”作為他們面部識(shí)別產(chǎn)品的主要功能進(jìn)行宣傳,并且許多小公司,如Kairos和Eyeris已經(jīng)出現(xiàn),為Affectiva提供類似的服務(wù)。
除了市場(chǎng)研究,情緒檢測(cè)技術(shù)現(xiàn)在被用于監(jiān)測(cè)和檢測(cè)駕駛員損傷,測(cè)試視頻游戲的用戶體驗(yàn)以及幫助醫(yī)療專業(yè)人員評(píng)估患者的健康狀況。
Kaliouby看到情緒檢測(cè)從一個(gè)研究項(xiàng)目發(fā)展成為一個(gè)價(jià)值200億美元的行業(yè),她對(duì)這種增長(zhǎng)的持續(xù)性充滿信心。她預(yù)測(cè),在不久的將來(lái),當(dāng)這項(xiàng)技術(shù)無(wú)處不在并融入我們所有的設(shè)備中時(shí),能夠“利用我們的內(nèi)心、潛意識(shí)做出瞬間的反應(yīng)”。
來(lái)自87個(gè)國(guó)家的750萬(wàn)個(gè)面孔數(shù)據(jù)
與大多數(shù)機(jī)器學(xué)習(xí)應(yīng)用程序一樣,情緒檢測(cè)的進(jìn)展取決于訪問(wèn)更高質(zhì)量的數(shù)據(jù)。
根據(jù)Affectiva的網(wǎng)站,他們擁有世界上最大的情緒數(shù)據(jù)存儲(chǔ)庫(kù),來(lái)自87個(gè)國(guó)家的面孔,數(shù)量超過(guò)750萬(wàn),其中大部分是從人們收看電視或開(kāi)車每天上下班的選擇性錄像中收集的。
這些視頻由位于開(kāi)羅的Affectiva辦公室的35名貼標(biāo)人進(jìn)行分類,他們觀看鏡頭并將面部表情轉(zhuǎn)化為相應(yīng)的情緒。例如,如果他們看到低垂的眉毛、緊繃的嘴唇和凸出的眼睛,他們會(huì)附上標(biāo)簽“憤怒”。這個(gè)被標(biāo)記的人類情緒數(shù)據(jù)集然后將用于訓(xùn)練Affectiva的算法,該算法學(xué)習(xí)如何將憤怒的臉、笑臉與幸福等聯(lián)系在一起。
這種標(biāo)記方法,被情緒檢測(cè)行業(yè)的許多人認(rèn)為是測(cè)量情緒的黃金標(biāo)準(zhǔn),它由Paul Ekman和Wallace V Friesen在20世紀(jì)80年代開(kāi)發(fā)的一種叫“情緒面部動(dòng)作編碼系統(tǒng)(Emfacs)”衍生而來(lái)。
這個(gè)系統(tǒng)的科學(xué)根源可以追溯到20世紀(jì)60年代,當(dāng)時(shí)Ekman和兩位同事假設(shè)有六種普遍的情緒——憤怒、厭惡、恐懼、快樂(lè)、悲傷和驚訝——這些情緒與我們有著緊密的聯(lián)系,并且可以通過(guò)分析面部肌肉的運(yùn)動(dòng)在所有文化中被發(fā)現(xiàn)。
為了驗(yàn)證這一假設(shè),他們向全世界不同的人群展示了面部照片,要求他們辨別他們所看到的情緒。他們發(fā)現(xiàn),盡管存在巨大的文化差異,人類還是會(huì)將相同的面部表情與相同的情緒相匹配。一張眉毛低垂、嘴唇緊閉、眼睛凸出的臉對(duì)美國(guó)的銀行家和巴布亞新幾內(nèi)亞的半游牧獵人來(lái)說(shuō)都意味著“憤怒”。
在接下來(lái)的二十年里,Ekman利用他的發(fā)現(xiàn)開(kāi)發(fā)了一種識(shí)別面部特征并將其映射到情緒的方法。潛在的前提是,如果一個(gè)人的普遍情緒被觸發(fā),那么一個(gè)相關(guān)的面部動(dòng)作就會(huì)自動(dòng)出現(xiàn)在臉上。即使那個(gè)人試圖掩飾他們的情緒,真實(shí)的本能的感覺(jué)也會(huì)“泄露”。
整個(gè)20世紀(jì)后半葉,這一理論被稱為“經(jīng)典情緒理論”,開(kāi)始主導(dǎo)著情緒科學(xué)。Ekman將他的情緒檢測(cè)方法作為專利,并開(kāi)始將其作為培訓(xùn)項(xiàng)目出售給CIA、FBI、海關(guān)和邊境保護(hù)局以及TSA。真實(shí)情緒在臉上可讀的觀念甚至滲透到大眾文化中,形成了“Lie to me”節(jié)目的基礎(chǔ)。
然而,許多研究情緒本質(zhì)的科學(xué)家和心理學(xué)家質(zhì)疑經(jīng)典理論和Ekman的相關(guān)情緒檢測(cè)方法。
情緒檢測(cè)理論備受質(zhì)疑
近年來(lái),心理學(xué)教授Barret提出了一個(gè)特別強(qiáng)烈而持久的批評(píng)。
Barret作為研究生首先遇到了古典理論。她需要一種客觀地測(cè)量情緒的方法,并且遇到了Ekman的方法。在回顧文獻(xiàn)時(shí),她開(kāi)始擔(dān)心潛在的研究方法有缺陷——特別是,她認(rèn)為通過(guò)為人們提供與照片匹配的預(yù)選情緒標(biāo)簽,Ekman無(wú)意中“準(zhǔn)備”了他們給出的某些答案。
她和一組同事通過(guò)重演Ekman的測(cè)試來(lái)檢驗(yàn)這個(gè)假設(shè),而不提供標(biāo)簽,讓受試者可以自由地描述他們所看到的圖像中的情緒。具體的面部表情和具體的情緒之間的關(guān)系直線下降。
從那時(shí)起,Barret發(fā)展了她自己的情緒理論,這在她的書(shū)《情緒是如何產(chǎn)生的:大腦的秘密生活》中有所闡述。她認(rèn)為,大腦中沒(méi)有由外部刺激觸發(fā)的普遍情緒。相反,每一次情緒體驗(yàn)都是由更基本的部分構(gòu)成的。
她寫(xiě)道:
“它們是你身體物理特性的結(jié)合,是一個(gè)靈活的大腦,它將自己連接到它所處的任何環(huán)境中,以及你的文化和成長(zhǎng)環(huán)境中。”
“情緒是真實(shí)的,但在客觀意義上不是分子或神經(jīng)元是真實(shí)的。它們的真實(shí)性與金錢(qián)的真實(shí)性是相同的,也就是說(shuō),這不是幻覺(jué),而是人類一致同意的產(chǎn)物。”
Barret解釋說(shuō),把面部表情直接映射到所有文化和環(huán)境中的情緒是沒(méi)有意義的。當(dāng)一個(gè)人生氣時(shí)可能會(huì)皺眉,而另一個(gè)人可能會(huì)在策劃敵人倒臺(tái)時(shí)禮貌地微笑。因此,評(píng)估情緒最好理解為一種動(dòng)態(tài)實(shí)踐,包括自動(dòng)認(rèn)知過(guò)程、人與人的互動(dòng)、具體經(jīng)驗(yàn)和文化能力。她說(shuō):“這聽(tīng)起來(lái)像是很多工作,但確實(shí)如此。”
“情緒是復(fù)雜的。”
Kaliouby也同意情緒是復(fù)雜的,這就是為什么她和她在Affectiva的團(tuán)隊(duì)一直在努力提高他們數(shù)據(jù)的豐富性和復(fù)雜性的原因。除了使用視頻而不是靜止圖像來(lái)訓(xùn)練算法外,他們還嘗試著捕捉更多的上下文數(shù)據(jù),比如聲音、步態(tài)以及人類感知之外的面部細(xì)微變化。她相信更好的數(shù)據(jù)將意味著更準(zhǔn)確的結(jié)果。一些研究甚至聲稱機(jī)器在情緒檢測(cè)方面已經(jīng)優(yōu)于人類。
但據(jù)Barret說(shuō),這不僅與數(shù)據(jù)有關(guān),而且與數(shù)據(jù)如何被標(biāo)記有關(guān)。情緒檢測(cè)公司和其他情緒檢測(cè)公司用來(lái)訓(xùn)練算法的標(biāo)記過(guò)程,只能識(shí)別Barret所說(shuō)的“情緒刻板印象”,就像表情符號(hào)一樣,這些符號(hào)符合我們文化中熟悉的情緒主題。
紐約大學(xué)人工智能研究所的聯(lián)合主任Whittaker認(rèn)為,基于Ekman過(guò)時(shí)的科學(xué)構(gòu)建機(jī)器學(xué)習(xí)應(yīng)用程序不僅僅是一種糟糕的實(shí)踐,它還轉(zhuǎn)化為真正的社會(huì)危害。
“你已經(jīng)看到招聘公司使用這些技術(shù)來(lái)衡量應(yīng)聘者是否是一個(gè)好員工。”
她說(shuō):“在學(xué)校環(huán)境中,你也可以看到一些實(shí)驗(yàn)性的技術(shù)被提出,以觀察學(xué)生在課堂上是積極的、無(wú)聊的還是憤怒的。”“這些信息可以用來(lái)阻止人們獲得工作或改變他們?cè)趯W(xué)校的待遇和評(píng)估方式,如果分析不十分準(zhǔn)確,那將是一種具體的物質(zhì)傷害。”
Kaliouby說(shuō),她意識(shí)到情緒檢測(cè)可能被濫用的方式,并將認(rèn)真對(duì)待她的工作道德。“與公眾就這一切的運(yùn)作方式——在哪里應(yīng)用以及在哪里不應(yīng)用進(jìn)行對(duì)話至關(guān)重要。”
Kaliouby過(guò)去戴過(guò)頭巾,她也敏銳地意識(shí)到建立不同數(shù)據(jù)集的重要性。她說(shuō):“我們確保當(dāng)我們訓(xùn)練這些算法時(shí),訓(xùn)練數(shù)據(jù)是多樣的。”“我們需要代表白種人、亞洲人、膚色較深的人,甚至是戴頭巾的人。”
這就是為什么Affectiva從87個(gè)國(guó)家收集數(shù)據(jù)的原因。通過(guò)這個(gè)過(guò)程,他們注意到在不同的國(guó)家,情緒表達(dá)似乎呈現(xiàn)出不同的強(qiáng)度和細(xì)微差別。例如,巴西人用寬而長(zhǎng)的微笑來(lái)表達(dá)幸福,而在日本,微笑并不表示幸福,而是表示禮貌。
Affectiva通過(guò)在系統(tǒng)中添加另一層分析來(lái)解釋這種文化差異。匯編了Kaliouby所說(shuō)的“基于種族的基準(zhǔn)”,或編纂了關(guān)于不同種族文化中如何表達(dá)情緒的假設(shè)。
但正是這種基于種族等標(biāo)記的算法判斷,讓W(xué)hittaker最擔(dān)心情緒檢測(cè)技術(shù)暗示了自動(dòng)化“相面”的未來(lái)。事實(shí)上,已經(jīng)有公司對(duì)某人成為***或戀童癖者的可能性進(jìn)行了預(yù)測(cè),同時(shí)也有研究人員聲稱,他們擁有的算法能夠單獨(dú)從臉上檢測(cè)到性行為。
最近幾項(xiàng)研究還表明,面部識(shí)別技術(shù)會(huì)產(chǎn)生更可能傷害少數(shù)族裔群體的偏見(jiàn)。去年12月發(fā)表的一篇文章顯示,與白人相比,情緒檢測(cè)技術(shù)給黑人臉上的負(fù)面情緒更多。
Kaliouby表示,情緒系統(tǒng)確實(shí)有一個(gè)“種族分類器”,但是他們現(xiàn)在沒(méi)有使用它。相反,他們使用地理位置作為確定某人來(lái)自哪里的基準(zhǔn)。這意味著他們將巴西的微笑與巴西的微笑進(jìn)行比較,而日本的微笑與日本的微笑進(jìn)行比較。
“如果巴西有一個(gè)日本人呢?難道系統(tǒng)能識(shí)別出禮貌微笑和幸福微笑的細(xì)微差別嗎?“
Kaliouby承認(rèn),在這個(gè)階段,這項(xiàng)技術(shù)并不是百分之百的萬(wàn)無(wú)一失。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7102瀏覽量
89283 -
機(jī)器
+關(guān)注
關(guān)注
0文章
784瀏覽量
40765 -
情緒識(shí)別
+關(guān)注
關(guān)注
0文章
3瀏覽量
1654
原文標(biāo)題:87個(gè)國(guó)家、750萬(wàn)個(gè)面孔數(shù)據(jù),『情緒識(shí)別機(jī)器』催生200億美元“財(cái)富夢(mèng)”
文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論