君子以泽,欢乐颂小说结局是什么,完美世界辰东

脫離上下文時，每個英文單詞都有多重含義。例如，“bank”可以指銀行或河岸；“Fair”可以指展覽會，也可以指對展覽會的評價；“Duck”可以是躲避傷害的動作，也可以指鴨子。

對于人類來說搞清楚一個單詞在某場景中適用的含義是非常簡單的。但是，對于自然語言處理模型就是另一回事了。

近些年已經出現很多用于解析文本的AI工具，但是當涉及到多重含義的單詞時，這些工具往往會陷入困境。來自艾倫人工智能研究所（Allen Institute for Artificial Intelligence）和華盛頓大學的研究人員正在努力解決這一難題，他們使用了可以根據上下文來確定英文單詞含義的神經網絡。

向前和向后閱讀

通常，NLP模型通過詞向量（在每個單詞中附加語言含義和單詞語法的基礎元素）中的結構化數據進行訓練。此算法基于假設每個單詞只有一種向量表示，但實際上英文單詞并非如此。

研究人員利用名為“ELMo”的神經系統打破了這一假設，此神經系統可以為每個單詞創造出無限數量的向量。

“‘ELMo’是‘Embeddings from Language Models’的縮寫，而不是毛茸茸的紅色芝麻街角色”，論文“Deep contextualized word representations”的第一作者Matthew Peters解釋道。

ELMo喜歡閱讀：這不是美國幼兒教育電視節目《芝麻街》中的Elmo，而是使用雙向語言模型的神經系統ELMo。

常規語言模型嘗試預測句子中即將出現的下一個單詞。如果片段是“The people sat down on the …,”，那么算法將預測出“bench”或“grass”之類的單詞。為了給單詞附加所有潛在含義的詞向量，這個團隊使用了雙向語言模型。

使用雙向模型意味著，該模型可以通過一個二次的回顧性算法，獲取句子的結尾并嘗試預測出現在句子結尾前邊的單詞。當模型嘗試分析的單詞出現在句首，并且相關上下文隨即出現時，這會非常有用。

“就像‘He lies to his teacher’與‘He lies on the sofa’這種情況”，Peters說道。

為測試ELMo的技能，該團隊利用六種不同的NLP任務（包括情緒分析和問答等）對算法進行測試。與之前使用相同訓練數據的方法相比，ELMo每次都會得到更新、更出色的結果，在某些情況下可以比之前的領先模型提升25%的速度。

“在NLP中，很重要的一點是，單一的方法能夠提高多樣化任務的性能”，Peters指出。

ELMo在半監督式學習領域大放異彩

在進行自然語言處理時，訓練數據的類型非常關鍵。例如，問答系統使用的模型無法在任何舊文本上進行訓練。通常，此類模型需要在由帶標注的問題和答案對組成的大型數據庫中訓練，以學習如何做出正確的回答。

標注數據非常耗時并且成本高昂。因此，研究人員首先選擇使用包含大約十億個單詞的大型無標記學術數據庫來訓練ELMo。然后，針對特定任務（例如問答）將此數據庫調整為一個帶標注的小型數據庫。對于這種結合使用大量無標記數據和一小部分已標記數據的方法，統稱為“半監督式學習”。

減少對已標記和帶標注數據的依賴后，研究人員可以更輕松地在現實問題中應用其NLP模型應用。

“在我們的示例中，我們選擇了一個未標記的學術數據庫來訓練語言模型”，Peters說道。但是研究人員能夠調整算法，以便在任何其他未標記的數據庫中運行該算法，也可以將其應用于生物醫學論文、法律合同或其他語言等專業領域中。

與之前最先進(SOTA)的基準相比，ELMo在六個基準NLP任務中都增強了神經模型的性能。從左到右，這些任務依次是：語義推理、命名實體識別、問題回答、指代消解、語義角色標注和情感分類。

研究人員通過Amazon Web Service，使用NVIDIA Tesla V100和K80 GPU助力訓練和推理。

在后續論文中，研究人員指出其僅使用了幾百個已標記示例，便可應用ELMo模式回答幾何問題。人工需要花費幾個小時便能完成此標記工作，但卻會顯著提高NLP模型的性能。

ELMo已作為開源庫提供。Peters表示其他的NLP研究人員已經將此模型應用到了他們自己的工作中，包括除英語外的其他語言。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
30896

瀏覽量
269110
模型

模型

+關注

關注
1

文章
3244

瀏覽量
48842
深度學習

深度學習

+關注

關注
73

文章
5503

瀏覽量
121170

原文標題：“躲避”or“鴨子”：看深度學習如何解釋多義詞

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達】歡迎添加關注！文章轉載請注明出處。

NPU在深度學習中的應用

隨著人工智能技術的飛速發展，深度學習作為其核心驅動力之一，已經在眾多領域展現出了巨大的潛力和價值。NPU（Neural Processing Unit，神經網絡處理單元）是專門為深度學習

發表于 11-14 15:17 ?582次閱讀

GPU深度學習應用案例

GPU在深度學習中的應用廣泛且重要，以下是一些GPU深度學習應用案例：一、圖像識別圖像識別是深度學習

發表于 10-27 11:13 ?398次閱讀

AI大模型與深度學習的關系

AI大模型與深度學習之間存在著密不可分的關系，它們互為促進，相輔相成。以下是對兩者關系的介紹：一、深度學習是AI大模型的基礎技術支撐：深度

發表于 10-23 15:25 ?743次閱讀

FPGA做深度學習能走多遠？

。FPGA的優勢就是可編程可配置，邏輯資源多，功耗低，而且賽靈思等都在極力推廣。不知道用FPGA做深度學習未來會怎樣發展，能走多遠，你怎么看。 A：FPGA 在深度

發表于 09-27 20:53

深度學習中的時間序列分類方法

時間序列分類（Time Series Classification, TSC）是機器學習和深度學習領域的重要任務之一，廣泛應用于人體活動識別、系統監測、金融預測、醫療診斷等多個領域。隨著深度

發表于 07-09 15:54 ?921次閱讀

深度學習中的無監督學習方法綜述

深度學習作為機器學習領域的一個重要分支，近年來在多個領域取得了顯著的成果，特別是在圖像識別、語音識別、自然語言處理等領域。然而，深度學習模型

發表于 07-09 10:50 ?736次閱讀

深度學習在視覺檢測中的應用

深度學習是機器學習領域中的一個重要分支，其核心在于通過構建具有多層次的神經網絡模型，使計算機能夠從大量數據中自動學習并提取特征，進而實現對復雜任務的處理和理解。這種

發表于 07-08 10:27 ?730次閱讀

深度學習與nlp的區別在哪

深度學習和自然語言處理（NLP）是計算機科學領域中兩個非常重要的研究方向。它們之間既有聯系，也有區別。本文將介紹深度學習與NLP的區別。深度

發表于 07-05 09:47 ?933次閱讀

深度學習中的模型權重

在深度學習這一充滿無限可能性的領域中，模型權重（Weights）作為其核心組成部分，扮演著至關重要的角色。它們不僅是模型學習的基石，更是模型智能的源泉。本文將從模型權重的定義、作用、優化、管理以及應用等多個方面，深入探討

發表于 07-04 11:49 ?1314次閱讀

深度學習常用的Python庫

深度學習作為人工智能的一個重要分支，通過模擬人類大腦中的神經網絡來解決復雜問題。Python作為一種流行的編程語言，憑借其簡潔的語法和豐富的庫支持，成為了深度學習研究和應用的首選工具。

發表于 07-03 16:04 ?653次閱讀

深度學習與傳統機器學習的對比

在人工智能的浪潮中，機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步，為眾多領域帶來了革命性的變化。然而，盡管它們都屬于機器學習的范疇，但

發表于 07-01 11:40 ?1381次閱讀

深度解析深度學習下的語義SLAM

隨著深度學習技術的興起，計算機視覺的許多傳統領域都取得了突破性進展，例如目標的檢測、識別和分類等領域。近年來，研究人員開始在視覺SLAM算法中引入深度學習技術，使得

發表于 04-23 17:18 ?1292次閱讀

為什么深度學習的效果更好？

導讀深度學習是機器學習的一個子集，已成為人工智能領域的一項變革性技術，在從計算機視覺、自然語言處理到自動駕駛汽車等廣泛的應用中取得了顯著的成功。深度

發表于 03-09 08:26 ?624次閱讀

【技術科普】主流的深度學習模型有哪些？AI開發工程師必備！

接近于人工智能。它通過學習樣本數據的內在規律和表示層次，對文字、圖像和聲音等數據進行解釋。深度學習的目標是讓機器像人一樣具有分析學習能力，能

發表于 01-30 15:26 ?629次閱讀

什么是深度學習？機器學習和深度學習的主要差異

2016年AlphaGo 擊敗韓國圍棋冠軍李世石，在媒體報道中，曾多次提及“深度學習”這個概念。

發表于 01-15 10:31 ?1077次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

“躲避”or“鴨子”：看深度學習如何解釋多義詞

評論

NPU在深度學習中的應用

GPU深度學習應用案例

AI大模型與深度學習的關系

FPGA做深度學習能走多遠？

深度學習中的時間序列分類方法

深度學習中的無監督學習方法綜述

深度學習在視覺檢測中的應用

深度學習與nlp的區別在哪

深度學習中的模型權重

深度學習常用的Python庫

深度學習與傳統機器學習的對比

深度解析深度學習下的語義SLAM

為什么深度學習的效果更好？

【技術科普】主流的深度學習模型有哪些？AI開發工程師必備！

什么是深度學習？機器學習和深度學習的主要差異