在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

利用算法開發了一種新的自然語言生成解碼方式

深度學習自然語言處理 ? 來源:夕小瑤的賣萌屋 ? 作者:Yimin_飯煲 ? 2022-08-02 14:44 ? 次閱讀

相信大多數學習過人工智能課程的讀者,當聽到算法的時候,都會有一種既熟悉又陌生的感覺。說算法熟悉,是因為一聽到這個算法,就想起那本厚厚的《人工智能——一種現代的方法》,想起這個算法似乎是人工智能課程考試的重點;說算法陌生,是因為大家現在在從事人工智能相關的研究和開發工作時,似乎又很少用到這個算法,大部分時間都花在了研究數據處理和處理實驗設置上面。而在NAACL2022上,一群來自AI2的自然語言處理研究者們利用算法開發了一種新的自然語言生成解碼方式,還被授予了NAACL2022 Best New Method paper。看起來已經過時的A*算法,居然能在深度學習時代有如此的妙用,看完這篇論文,筆者情不自禁地打開了《人工智能——一種現代的方法》,想看看還有什么經典算法可以深挖一下!

論文標題:
NEUROLOGIC A*esque Decoding: Constrained Text Generation with Lookahead Heuristics

論文鏈接:
https://arxiv.org/pdf/2112.08726.pdf

問題背景

自然語言生成任務一般指給定一個輸入序列,生成一個輸出序列。目的是解出使得目標函數最大化的序列,其中, , 而衡量對約束條件的滿足。傳統的Beam Search不考慮全局的最優,而是最優化當前步驟添加的Token.

為了達到全局最優的效果,需要滿足如下的優化目標

主要方法

前向啟發算法

直接優化全局最優目標面臨著搜索空間過大的問題。而A算法可以被用來解決這個搜索問題。A算法是一個最優優先的搜索算法,可以解決這樣形式的搜索問題:

其中是迄今為止的分數,是對于未來分數的啟發式估計。因此我們將優化目標修改為如下形式

同時,需要限制前向搜索的長度為,避免模型無限制地向前搜索

在前向生成的過程中有幾種不同的方法。方法只生成一個序列,從開始,每次選擇概率最大的Token。方法采用插值的思想,混合方法和隨機選擇一個Token的概率分布。方法從開始進行步的Beam Search,選擇前個概率最大的序列, 而方法則是直接從按照概率進行采樣。

無限制生成

在無限制生成的場景下,使用的優化函數為

其中控制的是對未來估計的重視程度,類似于加權算法

受限制生成

在受限制生成任務上,作者們基于之前的工作NeuroLogic進行改進。首先我們簡要介紹一下NeuroLogic方法。首先,將對生成文本的限制表示為合取范式。其中每一個表示一個限制條件,。NeuroLogic的優化目標可以寫為

其中遠大于0,用來懲罰不滿足的約束。在每一步搜索時,NeuroLogic利用如下的打分函數進行計算

其中是約束條件的前綴,這個優化函數的目標是獎勵那些滿足約束條件的樣本。接下來,作者們加入了前向啟發函數

這樣的前向啟發函數有兩個好處,如果是滿足多Token約束的一個Token,前向啟發函數包含了全部約束的分數,如果不是約束的一部分,如果被選中,這一前向策略能考慮到未來約束的分數。

實驗結果

無限制生成

0b4c6ef6-118e-11ed-ba43-dac502259ad0.png

作者們在故事生成任務上開展了實驗,可以發現提出的方法不論是在流暢性,豐富性還是人工評估上都有著很好的表現。

受限制生成

在受限制生成方面,作者們在常識生成,機器翻譯,表格到文本生成,問題生成等任務上開展了實驗。在這里展示常識生成方面的結果。這一任務的主要內容是給定一系列概念,利用全部概念生成一個合理的句子.

0b65b0be-118e-11ed-ba43-dac502259ad0.png

可以發現,作者們提出的方法在多個指標上都明顯超越了基線模型,取得了很好的效果。

0b779a5e-118e-11ed-ba43-dac502259ad0.png

從文章中給出的例子來看,作者們提出的方法確實有著更好的生成效果。

結語

本文的方法實現并不復雜,所用到的原理和思想也是非常經典的人工智能算法,但卻取得了非常不錯的性能,一舉摘得了NAACL2022的最佳方法論文。看來,好的研究并不是追逐熱點,調參魔改結構的增量式創新,而是打好數學基礎,深入地思考研究問題,廣泛接觸各個領域的算法,才能在發現領域的關鍵待解決問題時取得成果~

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4625

    瀏覽量

    93143
  • 人工智能
    +關注

    關注

    1793

    文章

    47539

    瀏覽量

    239392
  • 深度學習
    +關注

    關注

    73

    文章

    5511

    瀏覽量

    121373

原文標題:NAACL最佳方法論文 | 課本上的A*搜索算法可以提升文本生成效果!

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    自然語言處理與機器學習的關系 自然語言處理的基本概念及步驟

    Learning,簡稱ML)是人工智能的個核心領域,它使計算機能夠從數據中學習并做出預測或決策。自然語言處理與機器學習之間有著密切的關系,因為機器學習提供了一種強大的工具,用于從大量文本數據中提取模式和知識,從而提高NLP系
    的頭像 發表于 12-05 15:21 ?599次閱讀

    ASR與自然語言處理的結合

    ASR(Automatic Speech Recognition,自動語音識別)與自然語言處理(NLP)是人工智能領域的兩個重要分支,它們在許多應用中緊密結合,共同構成了自然語言理解和生成的技術體系
    的頭像 發表于 11-18 15:19 ?490次閱讀

    自然語言處理與機器學習的區別

    是計算機科學、人工智能和語言學領域的分支,它致力于使計算機能夠理解、解釋和生成人類語言。NLP的目標是縮小人類語言和計算機之間的差距,使計算機能夠處理和
    的頭像 發表于 11-11 10:35 ?683次閱讀

    使用LLM進行自然語言處理的優缺點

    自然語言處理(NLP)是人工智能和語言學領域的個分支,它致力于使計算機能夠理解、解釋和生成人類語言。大型
    的頭像 發表于 11-08 09:27 ?571次閱讀

    圖像識別技術包括自然語言處理嗎

    圖像識別技術與自然語言處理是人工智能領域的兩個重要分支,它們在很多方面有著密切的聯系,但也存在些區別。 、圖像識別技術與自然語言處理的關系 1.1 圖像識別技術的定義 圖像識別技術
    的頭像 發表于 07-16 10:54 ?906次閱讀

    nlp自然語言處理的應用有哪些

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領域的個分支,它致力于使計算機能夠理解和生成自然語言。隨著技術的發展,NLP已經在許多領域
    的頭像 發表于 07-05 09:55 ?2737次閱讀

    自然語言處理技術有哪些

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領域的個分支,它致力于使計算機能夠理解、解釋和生成人類語言
    的頭像 發表于 07-03 14:30 ?1280次閱讀

    自然語言處理模式的優點

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領域的個重要分支,它致力于使計算機能夠理解、生成和處理人類語言。隨著技術的發展,
    的頭像 發表于 07-03 14:24 ?836次閱讀

    自然語言處理技術的核心是什么

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領域的個重要分支,其核心目標是使計算機能夠理解、生成和處理人類語言。NLP技術的發展已經取
    的頭像 發表于 07-03 14:20 ?841次閱讀

    自然語言處理是什么技術的一種應用

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能和語言學領域的個分支,它涉及到使用計算機技術來處理、分析和生成
    的頭像 發表于 07-03 14:18 ?1074次閱讀

    自然語言處理包括哪些內容

    自然語言處理(Natural Language Processing,簡稱NLP)是人工智能領域的個重要分支,它涉及到計算機與人類語言之間的交互。NLP的目標是讓計算機能夠理解、生成
    的頭像 發表于 07-03 14:15 ?1091次閱讀

    自然語言列舉法描述法各自的特點

    自然語言文本。在自然語言處理中,列舉法和描述法是兩常見的方法。 列舉法 列舉法是一種基于規則的方法,它通過列舉所有可能的情況來解決問題。在自然語言
    的頭像 發表于 07-03 14:13 ?1137次閱讀

    自然語言處理屬于人工智能的哪個領域

    之間的交互,旨在使計算機能夠理解、生成和處理自然語言自然語言處理:人工智能的皇冠上的明珠 引言 人工智能作為門跨學科的研究領域,涵蓋了計算機科學、數學、心理學、
    的頭像 發表于 07-03 14:09 ?1472次閱讀

    什么是自然語言處理 (NLP)

    自然語言處理(Natural Language Processing, NLP)是人工智能領域中的個重要分支,它專注于構建能夠理解和生成人類語言的計算機系統。NLP的目標是使計算機能
    的頭像 發表于 07-02 18:16 ?1283次閱讀

    神經網絡在自然語言處理中的應用

    自然語言處理(NLP)是人工智能領域中的個重要分支,它研究的是如何使計算機能夠理解和生成人類自然語言。隨著人工智能技術的飛速發展,神經網絡在自然語
    的頭像 發表于 07-01 14:09 ?559次閱讀
    主站蜘蛛池模板: 手机看片1024福利| 天天干天天操天天透| 精品国产免费人成高清| 精品爱爱| aa黄色大片| 天天天天添天天拍天天谢| 天天综合网天天综合色| 天天摸天天看天天爽| 免费福利午夜影视网| 国产成人1024精品免费| 欧美激情αv一区二区三区| 中文字幕亚洲一区二区va在线| cijilu刺激 国产免费的| 97超在线| 日日爱网址| 国产精品福利午夜在线观看| 男人日女人视频免费看| 日本一级高清不卡视频在线| 亚洲综合情| 欧美综合在线视频| 国产亚洲午夜精品a一区二区| 四虎国产精品永久地址51| 欧美性天堂| 国产美女动态免费视频| 天天射天天搞| 西西人体www303sw大胆高清| 年下系列高h文| 特级aaa毛片| 久久国产乱子伦精品免| 亚洲午夜综合网| 成人福利在线视频| 免费伦费一区二区三区四区| 天堂一区二区在线观看| 老司机51精品视频在线观看| 2018国产一级天天弄| 国产破苞合集 magnet| 日本一区二区免费看| 色无五月| 爱爱小说视频永久免费网站| 久操视频免费观看| 皇帝受h啪肉np文|