在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹兩個(gè)few-shot NER中的challenge

深度學(xué)習(xí)自然語言處理 ? 來源:AI Station ? 作者:QI ? 2022-08-24 10:01 ? 次閱讀

01

Introduction-現(xiàn)有什么問題、怎么解決

此部分著重介紹了兩個(gè)few-shot NER中的challenge:limited information challenge和knowledge mismatch challenge。前者主要是指樣本數(shù)少,后者是指不同的數(shù)據(jù)集中同一個(gè)實(shí)體可能被分成了不同的類別標(biāo)簽。(比如“America”在Wikipedia被分為geographic , 在 OntoNotes中被分為GPE, 在WNUT17被分為location )

本文最重要的思想基于這樣一個(gè)假設(shè):不論是否是未知的實(shí)體類別,都可以用一個(gè)概念集中的若干概念來描述(all entity types can be described using the same set of concepts)。這樣可以解決knowledge mismatch challenge,而且在給了幾個(gè)少樣本后,可以根據(jù)這幾個(gè)少樣本構(gòu)建新實(shí)體類別到概念集的映射,這樣可以直接用映射后的若干概念識(shí)別實(shí)體,進(jìn)而解決limited information challenge。下圖是實(shí)體類別到概念集的映射舉例。

93bd0394-22ce-11ed-ba43-dac502259ad0.jpg

02

SDNet: Self-describing Networks for FS-NER

2.1 SDNet核心部分: Mention describing、Entity generation

這部分將主要介紹SDNet怎么進(jìn)行命名實(shí)體識(shí)別的,主要包括:Mention describing(從給的sentence構(gòu)建該實(shí)體的concept description)和Entity generation(根據(jù)給的實(shí)體類型逐個(gè)生成句子中的實(shí)體詞)。

以下圖為例,輸入一個(gè)sentence(以[MD]作為起始符),SDNet將輸出novel series這樣的concept description。輸入一個(gè)以[EG]作為起始符、實(shí)體類別名+相關(guān)的concept description以及待識(shí)別的sentence作為內(nèi)容的文本,SDNet將輸出Harry Potter is creative work.這樣的回答。這兩個(gè)過程分別對(duì)應(yīng)Mention describing和Entity generation。

93d176ee-22ce-11ed-ba43-dac502259ad0.png

2.2 模型工作流程

93dc6414-22ce-11ed-ba43-dac502259ad0.jpg

a、預(yù)訓(xùn)練階段

左上角的維基百科上有大量的句子,句子中的人物、地點(diǎn)、公司等都有相應(yīng)的維基百科給的標(biāo)簽和描述。預(yù)訓(xùn)練階段根據(jù)2.1部分介紹的模板,進(jìn)行[MD]和[EG]兩個(gè)任務(wù)的Seq2Seq任務(wù)的訓(xùn)練。

b、微調(diào)與解碼階段

這部分對(duì)應(yīng)于Few-shot NER的少樣本階段。給了一些帶標(biāo)注的少量樣本句子,我們知道了這些句子中那些單詞是實(shí)體部分,把這些實(shí)體部分添加到以[MD]開頭的模板并輸入到SDNet中,模型會(huì)生成這些實(shí)體部分描述,并將生成的描述加入到新類別的概念描述集中,并在預(yù)測(cè)階段輸入添加了新類別的[EG]開頭的模板,根據(jù)生成的結(jié)果判斷待預(yù)測(cè)的句子中哪些單詞部分是該類別的實(shí)體。

以上圖中為例,給的少樣本中Iran是GPE類別的實(shí)體,SDNet先用[MD]開頭的模板生成了Iran是country的描述,將country加入到屬于GPE這個(gè)新類別的概念描述集合中,在預(yù)測(cè)階段用[EG]開頭的模板輸入GPE這個(gè)類別名、其包含的概念描述以及待識(shí)別的句子,生成屬于GPE的實(shí)體詞,完成實(shí)體識(shí)別。

c、Filtering Strategy

在眾多下游任務(wù)中,SDNet可能會(huì)遇到難以生成新實(shí)體類別描述的情況(或者或生成不準(zhǔn)確的描述),因此SDNet在訓(xùn)練階段可以對(duì)于那些不去確定的instance生成other的描述詞。如果給少量樣本生成的描述詞中有0.5以上的other,將在最后的decode階段直接使用新實(shí)體類別名(如GPE)。(實(shí)驗(yàn)部分可以看到這個(gè)策略帶來了一定的提升)

具體實(shí)現(xiàn)過程將不再贅述,可以看原文的第4部分,有對(duì)預(yù)訓(xùn)練和fintune階段的詳細(xì)介紹。

03

實(shí)驗(yàn)部分

93f542f4-22ce-11ed-ba43-dac502259ad0.jpg

這種借助先驗(yàn)知識(shí)的方式,在6個(gè)數(shù)據(jù)集上都取得了很好的效果,尤其是對(duì)一些之前的識(shí)別效果一直很差的(比如I2B2),這說明這種通用的實(shí)體概念集合在各種類別間是通用的。

04

評(píng)價(jià)

優(yōu)點(diǎn)

為少樣本NER引用外部知識(shí)提供了新思路,且提供了可直接使用的,通用的預(yù)訓(xùn)練模型,可以為后來的研究工作提供參考。

可能的缺陷

在很多新領(lǐng)域下(尤其涉及到domain transfer)的,可能會(huì)出現(xiàn)很多無法描述成概念集合的實(shí)體類別,出現(xiàn)大量的other,這時(shí)只能用實(shí)體類別名了,在完全不重疊的領(lǐng)域之間可能效果會(huì)不佳。

另外,預(yù)訓(xùn)練階段使用的維基百科,大量的是事件人物地點(diǎn)等這些廣泛且常用的,面對(duì)實(shí)際應(yīng)用中的非常見實(shí)體類別時(shí),可能做不到很好的描述。

在大量的語料中進(jìn)行訓(xùn)練,可能出現(xiàn)了“泄露”,當(dāng)然這只是一個(gè)猜測(cè)。




審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SDNet
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    5638

原文標(biāo)題:ACL2022 | 基于自描述網(wǎng)絡(luò)的小樣本命名實(shí)體識(shí)別

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    ads1013有兩個(gè)模擬輸入,可以接不同的兩個(gè)模擬輸入嗎?

    ads1013有兩個(gè)模擬輸入,可以接不同的兩個(gè)模擬輸入嗎,驅(qū)動(dòng)程序怎么分別讀兩個(gè)模擬輸入的轉(zhuǎn)換結(jié)果?
    發(fā)表于 12-02 08:02

    單相電機(jī)兩個(gè)繞組都在定子上嗎

    單相電機(jī)的兩個(gè)繞組,即起動(dòng)線圈(或稱為輔助繞組、副繞組)和運(yùn)行線圈(或稱為主繞組),都位于定子上 。這兩個(gè)繞組在電機(jī)起著關(guān)鍵作用,共同協(xié)作以產(chǎn)生旋轉(zhuǎn)磁場(chǎng),從而使電機(jī)能夠運(yùn)轉(zhuǎn)。 單相電機(jī)通常由一
    的頭像 發(fā)表于 09-03 15:10 ?857次閱讀

    ad如何設(shè)置兩個(gè)元器件的距離

    在Altium Designer(簡稱AD)設(shè)置兩個(gè)元器件之間的距離,主要是通過設(shè)置元器件間的安全間距(Clearance)規(guī)則來實(shí)現(xiàn)的。這個(gè)規(guī)則定義了元器件之間、元器件與走線之間以及其他設(shè)計(jì)元素
    的頭像 發(fā)表于 09-02 15:31 ?7497次閱讀

    功放機(jī)AB兩個(gè)聲道輸出怎么接

    功放機(jī)AB兩個(gè)聲道輸出的接線方式,主要取決于您想要實(shí)現(xiàn)的音頻效果以及音箱的配置。以下將詳細(xì)介紹幾種常見的接線方式,以及它們各自的特點(diǎn)和適用場(chǎng)景。 一、基礎(chǔ)接線方式 在大多數(shù)情況下,功放機(jī)的AB兩個(gè)
    的頭像 發(fā)表于 08-23 10:40 ?3097次閱讀

    觸發(fā)器的兩個(gè)穩(wěn)定狀態(tài)分別是什么

    觸發(fā)器作為數(shù)字電路的基本邏輯單元,具有兩個(gè)穩(wěn)定狀態(tài),這兩個(gè)狀態(tài)通常用于表示二進(jìn)制數(shù)碼的0和1。
    的頭像 發(fā)表于 08-12 11:01 ?1373次閱讀

    雙穩(wěn)態(tài)電路的兩個(gè)穩(wěn)定狀態(tài)是什么

    雙穩(wěn)態(tài)電路是一種具有兩個(gè)穩(wěn)定狀態(tài)的電子電路,廣泛應(yīng)用于數(shù)字電路、通信系統(tǒng)、存儲(chǔ)器等領(lǐng)域。 雙穩(wěn)態(tài)電路的基本概念 雙穩(wěn)態(tài)電路是一種具有兩個(gè)穩(wěn)定狀態(tài)的電路,即在沒有外部輸入信號(hào)的情況下,電路可以保持在
    的頭像 發(fā)表于 08-11 15:00 ?1537次閱讀

    雙穩(wěn)態(tài)觸發(fā)器的兩個(gè)基本性質(zhì)是什么

    雙穩(wěn)態(tài)觸發(fā)器(Bistable Trigger)是一種具有兩個(gè)穩(wěn)定狀態(tài)的邏輯電路,廣泛應(yīng)用于數(shù)字電路設(shè)計(jì)。它具有兩個(gè)基本性質(zhì):記憶性和切換性。 一、雙穩(wěn)態(tài)觸發(fā)器的基本概念 1.1 雙穩(wěn)態(tài)觸發(fā)器
    的頭像 發(fā)表于 08-11 10:08 ?732次閱讀

    兩個(gè)PLC之間如何交互信號(hào)

    在工業(yè)自動(dòng)化系統(tǒng),PLC(Programmable Logic Controller,可編程邏輯控制器)是核心的控制設(shè)備。在許多復(fù)雜的應(yīng)用場(chǎng)景,需要兩個(gè)或多個(gè)PLC之間進(jìn)行信號(hào)交互,以實(shí)現(xiàn)更高
    的頭像 發(fā)表于 06-14 16:57 ?4511次閱讀

    怎么讓工程同時(shí)存在兩個(gè)ioc文件?

    你好,我現(xiàn)在需要在一個(gè)工程兼容兩個(gè)不同的項(xiàng)目,這兩個(gè)項(xiàng)目有不同的配置文件,請(qǐng)問可否讓兩個(gè)ioc文件同時(shí)存在,通過修改路徑之類的方法來使需要
    發(fā)表于 05-23 07:50

    兩個(gè)銅片可以形成原電池嗎

    兩個(gè)銅片本身不能形成原電池,因?yàn)樵姵氐墓ぷ髟硪蕾囉?b class='flag-5'>兩個(gè)不同電位的電極材料之間的氧化還原反應(yīng)。
    的頭像 發(fā)表于 05-21 16:23 ?1003次閱讀

    為什么在交流電橋至少需要兩個(gè)可調(diào)參數(shù)?

    在交流電橋的測(cè)量,至少需要兩個(gè)可調(diào)參數(shù)的原因與電橋的工作原理、測(cè)量的準(zhǔn)確性以及校準(zhǔn)過程有關(guān)。
    的頭像 發(fā)表于 05-15 17:49 ?1910次閱讀

    原電池中的兩個(gè)電極能是相同的嗎?

    在原電池的設(shè)計(jì)和運(yùn)作兩個(gè)電極是否可以相同,這取決于電池的類型和所需的電化學(xué)反應(yīng)。
    的頭像 發(fā)表于 04-26 17:32 ?2494次閱讀

    arcgis如何關(guān)聯(lián)兩個(gè)屬性表

    在ArcGIS,關(guān)聯(lián)兩個(gè)屬性表是一個(gè)重要的操作,可以通過此操作將兩個(gè)的數(shù)據(jù)關(guān)聯(lián)起來,以便進(jìn)行分析和查詢。下面是詳細(xì)
    的頭像 發(fā)表于 02-25 11:01 ?4304次閱讀

    兩個(gè)電位器地控制一個(gè)變頻器,如何接線?

    兩個(gè)電位器地控制一個(gè)變頻器,如何接線? 接線方式如下: 1. 首先,明確需要使用的電器設(shè)備。在這個(gè)場(chǎng)景,我們需要兩個(gè)電位器(即可變電阻器
    的頭像 發(fā)表于 02-05 10:13 ?5422次閱讀

    兩個(gè)機(jī)器的時(shí)鐘怎么同步?

    多個(gè)機(jī)器的時(shí)鐘保持同步。在本文中,我們將詳細(xì)介紹如何同步兩個(gè)機(jī)器的時(shí)鐘,并討論其原理、方法和實(shí)施。 一、時(shí)鐘同步的重要性 1.數(shù)據(jù)一致性:在分布式系統(tǒng),確保多個(gè)機(jī)器的時(shí)鐘同步可以保證數(shù)據(jù)在不同機(jī)器上的一致性,
    的頭像 發(fā)表于 01-16 14:26 ?1726次閱讀
    主站蜘蛛池模板: 国产精品视频你懂的| 2021韩国理论片ok电影天堂| 亚洲a在线观看| 五月伊人婷婷| 日本三级理论| 六月婷婷在线| 国产免费一区二区三区在线| 成人永久免费视频| 一级大片免费看| 日本黄色大全| 国产精品9999| 在线观看视频一区| 男女草逼视频| 性欧美zoz0另类xxxx| 日韩三级免费看| 久久综合色婷婷| 97av免费视频| 美妇乱人伦性| 一区二区三区无码高清视频| 伊人网综合在线| 日本高清视频在线www色| 精品国产免费一区二区| 伊人狼人综合| 国产精品理论片在线观看| 91大神精品长腿在线观看网站| 男人午夜| 色多多网站在线观看| 久久国产精品永久免费网站| 97人人视频| 国产特黄一级一片免费| 亚洲一级免费视频| 无人区理论片手机看片| 六月综合网| 天天操天天玩| 456亚洲人成影院在线观| 亚洲色图狠狠干| 免费人成网站| 天天天操| 一区二区三区免费精品视频| 性色a| 国产一二三区精品|