相信很多朋友在嘗試調戲Siri、小冰等AI助手時,應該都獲得過令人捧腹大笑的回答,Siri甚至一度榮獲“最佳段子手”稱號。但是當你嘗試對它們使用一些連人類都得思考一會兒的雙關語時,他們往往就只能無奈回答“抱歉請您再說一遍”了。創造性語言,尤其是具備基本的幽默感,是人工智能目前仍難以逾越的瓶頸之一。有些研究者認為無法理解幽默感是人工智能與人類在自然交互上面臨的最大障礙。近日,斯坦福大學的一個華人研究團隊結合神經網絡與心理語言學,提出了以surprise為核心的神經網絡雙關語訓練方法。
神經網絡作為一項自帶模仿屬性的技術,通過大量文本來學習人類的語言模式,對于一致性問題,這種方法比較行得通。不過問題來了,學得好并不意味著有意思。舉個栗子,“該不該在新聞內容生產方面大量使用AI”一直是個比較熱議的話題。但即使AI可以通過學習產生令人信以為真的新聞,由此產生的內容基本就會和訓練它們的維基百科、嚴肅文學一樣令人索然無味,拋開“AI撰寫新聞”的噱頭,其內容本身可能未必能夠抓住人們的眼球。也就是說,神經網絡遵守規則,但卻不太擅長講笑話、抖包袱。
所以,斯坦福大學的研究團隊的目標是創造出一款真實自然、生動有趣的機器人,不僅是可以播報新聞、預報天氣的“播音員”,還能成為既會get到笑點、又會寫詩的“文藝青年”,甚至還能講述一個引人入勝的故事。
不過這并不容易。
先來看看下面這句話:
The greyhound stopped to get a hare cut.
Google把它翻譯成“灰狗停下來砍兔子”???沒看懂這句話不要緊,這不是你的問題,要怪就怪計算機還沒完全理解人類語言中的雙關語。
該研究團隊認為一個精心設計的笑話在把握一個巧勁兒,會在一致性與合理性之間達到平衡,又不會完全無厘頭。此外,創造性語言的核心是新穎,而不是循規蹈矩。如何賦予神經網絡創意?這就對研究人員提出了更高的要求,“即使我們有一長串的雙關語供它學習模仿,但終究比不過具有獨創性的內容生產 。”上面的例子就說明了這一點。
如何走出這個死循環呢?斯坦福的研究團隊試圖利用有關“幽默”的理論賦予他們的AI一些創造性的智慧,即教會AI什么是“幽默感”。大多數研究者都認為幽默的產生和理解都與感知到的失諧(Incongruity)有關,即有別于心理常規,出現和期望不同或相反的因素,也就是讓感受者感到驚訝的因素(surprise)。
為了使雙關語起作用,斯坦福的研究團隊認為應該在具體的語言環境(local context)中制造出其不意的效果。上面那個例子中stopped to get a hare cut就其本身來說沒有太大意義,團隊決定借鑒一些學術理論來解決這個難題:關于驚訝的“局部-全局原理”(local-global surprisal principle)。為了生成雙關語,神經網絡被賦予一對同音異義詞(hair頭發/hare野兔),基于第一個單詞hair生成一個句子,但是當第二個單詞hare替換掉hair時會讓人摸不著頭腦,之后它會插入另一個帶有hare的句子,使整個句子更加邏輯。
為了驗證這種方法是否可行,研究團隊還舉行了一場雙關語競賽,讓AI與人類幽默大師PK,大眾評委對其進行評分。按人類的標準來說,機器人的表現不算很好。雖然這個AI系統生成的雙關語比以往的更加“幽默”,但在比賽中它戰勝人類的機率只有10%。有時它生成的雙關語會卡在一個基本結構中,語法還會發生錯亂。比如說:
That’s because negotiator got my car back to me in one peace.
Even from the outside, I could tell that he’d already lost some wait.
Well, gourmet did it, he thought, it’d butter be right.
(下劃線處是我們認為有bug的地方,歡迎大家在評論區施展拳腳一起debug)
盡管研究人員稱暫時無法解決這個問題,麻省理工學院計算心理語言學實驗室主任Roger Levy表示,構建雙關語神經網絡對于建立更人性化的AI來說是很振奮人心的一步。“盡管賦予機器人類的幽默感非常具有挑戰性,但這也是我們之所以成為人類的基礎。”
四年前,Levy嘗試了用一種計算方法來表示并判斷雙關語是否有趣,這也是斯坦福研究團隊笑話生成方法(joke-generation)的基礎。他也希望可以借鑒local-global surprisal principle的概念,來完成比他論文更精確的測試,雖然目前還沒有數據證明這一概念的可行性,但“如果真的可以用這個思路成功實現雙關語的測試,想想就是一件很酷的事情!”
從更大的層面來看,幽默感研究的困境恰恰也強調了為神經網絡賦予更多人類智慧的必要性。最近,他嘗試用“surprise”作為研究AI如何理解語言的方法。Levy認為,不論在人工智能還是認知科學領域,surprise都是核心的概念之一。對于人類來說,surprise反映為我們遇到事情的反應,這是可以測量的,比如跟蹤我們在閱讀時的眼球運動。在機器中,surprise的程度可以用概率測量:在給定的上下文中出現概率較低的詞更令人感到驚訝。
這就使得surprise成為一種比較人類大腦和機器如何通過語言推理的有效指標——探索各自黑盒子內部運作的方式。Levy也發現,當把神經網絡放到研究人類如何處理模棱兩可的語言的一系列心理語言學(psycholinguistic)測試中時,對計算機以非人類的方式“出人意料”展現出來的內容進行調整,這些差異可能也會是設計具有更人性化行為的AI的關鍵。
與此同時,斯坦福的研究團隊還希望將其研究的雙關語方法應用于更復雜的場景,讓AI完成更具創造性的任務,比如編故事。這個想法是讓神經網絡做它擅長的事情,然后再結合人類的智慧二次加工。打個比方,訓練神經網絡先生成一連串完美連貫的句子,然后再根據人類的敘事理論進一步寫出一部具有一定創意的短篇小說。“我們的目標倒不至于一定要求訓練神經網絡具備理解和生產雙關語的能力,我們更希望讓AI擺脫我們固有的套路和框框,寫出更具創意和趣味的故事。”
-
機器人
+關注
關注
211文章
28501瀏覽量
207472 -
神經網絡
+關注
關注
42文章
4773瀏覽量
100890 -
人工智能
+關注
關注
1792文章
47409瀏覽量
238923
原文標題:下一屆喜劇大師會是機器嗎?Stanford研究員在努力訓練神經網絡理解人類的俏皮話和雙關語
文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論