在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

在風(fēng)格遷移中如何進(jìn)行數(shù)據(jù)增強(qiáng)

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:深度學(xué)習(xí)自然語(yǔ)言處理 ? 作者:丁磊 ? 2021-01-13 09:41 ? 次閱讀

這是一篇關(guān)于風(fēng)格遷移中如何進(jìn)行數(shù)據(jù)增強(qiáng)的論文。在introduction部分,informal-->formal 的風(fēng)格遷移問(wèn)題,最大的障礙是訓(xùn)練數(shù)據(jù)的不足。為了解決此問(wèn)題,本篇論文提出三種數(shù)據(jù)增強(qiáng)的方法來(lái)獲得有用的語(yǔ)句對(duì),分別為

back translation (BT)

我們使用原始語(yǔ)料庫(kù)訓(xùn)練一個(gè)seq2seq模型。其中將formal語(yǔ)句作為模型的輸入,讓seq2seq模型有能力輸出對(duì)應(yīng)的informal句子。則 模型輸入的formal語(yǔ)句和輸出的informal語(yǔ)句就構(gòu)成了一個(gè)新的語(yǔ)句對(duì)。

formality discrimination (F-Dis)

F-Dis方法使用機(jī)器翻譯模型,將一個(gè)informal句子重寫(xiě)為formal句子。首先使用Google翻譯API 將這些informal語(yǔ)句翻譯成 其他語(yǔ)種(比如法語(yǔ)),然后又翻譯回英語(yǔ)。如下圖所示:

831f1182-549c-11eb-8b86-12bb97331649.jpg

其中,informal語(yǔ)句可以從網(wǎng)上論壇上收集得到。

表示收集到的第i條句子(informal), 是最后翻譯回的句子(formal), 二者構(gòu)成了一個(gè)新的語(yǔ)句對(duì)。

本方法同時(shí)使用CNN構(gòu)建了一個(gè)“格式判別器”:用來(lái)給一個(gè)句子的“正規(guī)”程度 打分。就是上圖中右邊括號(hào)內(nèi)的小數(shù)。最終選出的新數(shù)據(jù)集要求如下:

837b0564-549c-11eb-8b86-12bb97331649.png

其中表示句子的“正規(guī)”程度, 是閾值

multi-task transfer (M-Task)

我們觀察到,formal語(yǔ)句通常語(yǔ)法正確,而informal語(yǔ)句的語(yǔ)法經(jīng)常出錯(cuò)。

前人研究表明,對(duì)FST的輸出再使用一個(gè)語(yǔ)法錯(cuò)誤糾正模型( grammatical error correction model,GEC)可以提高模型效果。受此啟發(fā),本論文直接使用GEC的訓(xùn)練數(shù)據(jù)作為增強(qiáng)的新數(shù)據(jù)集。如下圖

83e7497c-549c-11eb-8b86-12bb97331649.png

模型訓(xùn)練

上面提到的seq2seq模型為T(mén)ransformer (base)。

本論文首先使用增強(qiáng)的新數(shù)據(jù)用于 預(yù)訓(xùn)練,然后使用原始語(yǔ)料數(shù)據(jù)做微調(diào),將這稱(chēng)為pre-training & finetuning (PT&FT)方法。下面結(jié)果證明了PT&FT的效果優(yōu)于ST方法。ST是把增強(qiáng)數(shù)據(jù)和原數(shù)據(jù)一起訓(xùn)練。

843ca7b4-549c-11eb-8b86-12bb97331649.jpg

下圖展現(xiàn)了三種數(shù)據(jù)增強(qiáng)方法的效果:

84b0048e-549c-11eb-8b86-12bb97331649.jpg

下圖展現(xiàn)了我們的方法與前人模型的比較結(jié)果:

84cef614-549c-11eb-8b86-12bb97331649.jpg

責(zé)任編輯:xj

原文標(biāo)題:【ACL2020】關(guān)于正式風(fēng)格遷移的數(shù)據(jù)增強(qiáng)方法

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:【ACL2020】關(guān)于正式風(fēng)格遷移的數(shù)據(jù)增強(qiáng)方法

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    HarmonyOS Next 應(yīng)用元服務(wù)開(kāi)發(fā)-分布式數(shù)據(jù)對(duì)象遷移數(shù)據(jù)文件資產(chǎn)遷移

    數(shù)據(jù)對(duì)象組網(wǎng)進(jìn)行數(shù)據(jù)恢復(fù)。 創(chuàng)建空的分布式數(shù)據(jù)對(duì)象,用于接收恢復(fù)的數(shù)據(jù); 從want讀取分布式數(shù)據(jù)
    發(fā)表于 12-24 10:11

    HarmonyOS Next 應(yīng)用元服務(wù)開(kāi)發(fā)-分布式數(shù)據(jù)對(duì)象遷移數(shù)據(jù)權(quán)限與基礎(chǔ)數(shù)據(jù)

    向用戶申請(qǐng)授權(quán)。 二、基礎(chǔ)數(shù)據(jù)遷移 使用分布式數(shù)據(jù)對(duì)象,與上述開(kāi)發(fā)步驟類(lèi)似,需要在源端onContinue()接口中進(jìn)行數(shù)據(jù)保存,并在對(duì)端的onCreate()/onNewWant()
    發(fā)表于 12-24 09:40

    使用CAN總線進(jìn)行數(shù)據(jù)采集的方法

    是汽車(chē)內(nèi)部各個(gè)模塊之間進(jìn)行通信的一種協(xié)議,通過(guò)它可以獲取到車(chē)輛的各種狀態(tài)信息、傳感器數(shù)據(jù)等。因此,進(jìn)行數(shù)據(jù)采集之前,需要熟悉CAN總線的工作原理、通信協(xié)議以及
    的頭像 發(fā)表于 12-20 18:18 ?844次閱讀

    zeta的定義和應(yīng)用 如何使用zeta進(jìn)行數(shù)據(jù)分析

    Zeta(ζ)電位是描述懸浮粒子液體中移動(dòng)時(shí)所產(chǎn)生的電位差的一個(gè)物理量,以下是對(duì)其定義、應(yīng)用以及如何進(jìn)行數(shù)據(jù)分析的詳細(xì)解釋?zhuān)?Zeta電位的定義 Zeta電位是通過(guò)理論推導(dǎo)和實(shí)驗(yàn)測(cè)量得到的,它反映
    的頭像 發(fā)表于 12-19 18:10 ?1037次閱讀

    如何使用ddc進(jìn)行數(shù)據(jù)分類(lèi)

    探討如何使用DDC(Dewey Decimal Classification,即杜威十進(jìn)制分類(lèi)法)進(jìn)行數(shù)據(jù)分類(lèi)時(shí),我們首先需要明確DDC是一種用于圖書(shū)館分類(lèi)和組織圖書(shū)的體系,它按照一定的體系將各種
    的頭像 發(fā)表于 12-18 15:05 ?306次閱讀

    如何使用cmp進(jìn)行數(shù)據(jù)庫(kù)管理的技巧

    使用 cmp 命令時(shí)進(jìn)行有效的數(shù)據(jù)庫(kù)管理。 1. 理解 cmp 命令 cmp 命令用于比較兩個(gè)文件是否在內(nèi)容上完全相同。它逐字節(jié)比較文件,并在找到第一個(gè)不同的地方時(shí)停止。這對(duì)于檢查數(shù)據(jù)
    的頭像 發(fā)表于 12-17 09:31 ?151次閱讀

    如何使用SQL進(jìn)行數(shù)據(jù)分析

    使用SQL進(jìn)行數(shù)據(jù)分析是一個(gè)強(qiáng)大且靈活的過(guò)程,它涉及從數(shù)據(jù)庫(kù)中提取、清洗、轉(zhuǎn)換和聚合數(shù)據(jù),以便進(jìn)行進(jìn)一步的分析和洞察。 1. 數(shù)據(jù)提取(Da
    的頭像 發(fā)表于 11-19 10:26 ?361次閱讀

    ADS1299與STM32f407通過(guò)SPI進(jìn)行數(shù)據(jù)傳輸?shù)臅r(shí)候,可以直接使用HAL庫(kù)的HAL_SPI_Receive函數(shù)進(jìn)行數(shù)據(jù)傳輸嗎?

    與STM32f407通過(guò)SPI進(jìn)行數(shù)據(jù)傳輸?shù)臅r(shí)候,可以使能SPI之后,直接使用HAL庫(kù)的HAL_SPI_Receive函數(shù)進(jìn)行數(shù)據(jù)
    發(fā)表于 11-13 08:29

    使用TMS320C6000 MCBSP進(jìn)行數(shù)據(jù)打包

    電子發(fā)燒友網(wǎng)站提供《使用TMS320C6000 MCBSP進(jìn)行數(shù)據(jù)打包.pdf》資料免費(fèi)下載
    發(fā)表于 10-26 10:54 ?0次下載
    使用TMS320C6000 MCBSP<b class='flag-5'>進(jìn)行數(shù)據(jù)</b>打包

    使用AI大模型進(jìn)行數(shù)據(jù)分析的技巧

    使用AI大模型進(jìn)行數(shù)據(jù)分析的技巧涉及多個(gè)方面,以下是一些關(guān)鍵的步驟和注意事項(xiàng): 一、明確任務(wù)目標(biāo)和需求 使用AI大模型之前,首先要明確數(shù)據(jù)分析的任務(wù)目標(biāo),這將直接影響模型的選擇、數(shù)據(jù)
    的頭像 發(fā)表于 10-23 15:14 ?964次閱讀

    如何利用海外爬蟲(chóng)IP進(jìn)行數(shù)據(jù)抓取

    利用海外爬蟲(chóng)IP進(jìn)行數(shù)據(jù)抓取需要綜合考慮多個(gè)方面。
    的頭像 發(fā)表于 10-12 07:54 ?233次閱讀

    何進(jìn)行IP檢測(cè)

    排查網(wǎng)絡(luò)連接問(wèn)題,并及時(shí)的防范潛在的網(wǎng)絡(luò)攻擊。 那么,如何進(jìn)行 IP 地址檢測(cè)呢?接下來(lái)我將進(jìn)行圖示哦~ 使用操作系統(tǒng)自帶的工具 ① Windows 系統(tǒng),按win+R,輸入“ipconfig”命令。 ② Mac 系統(tǒng)
    的頭像 發(fā)表于 07-26 14:09 ?603次閱讀
    如<b class='flag-5'>何進(jìn)行</b>IP檢測(cè)

    求助,IR615可以選用哪種vpn協(xié)議?如何進(jìn)行配置?

    現(xiàn)有多臺(tái)IR615路由器,希望將其配置為vpn客戶端,連接云服務(wù)器的vpn服務(wù)端 工程師遠(yuǎn)程連接云服務(wù)器對(duì)IR615進(jìn)行管理 IR615可以選用哪種vpn協(xié)議?如何進(jìn)行配置? 服務(wù)
    發(fā)表于 07-25 07:53

    ESP32-C3SPI-AT模式下進(jìn)行數(shù)據(jù)透?jìng)鳎詈笠粋€(gè)數(shù)據(jù)包的數(shù)據(jù)偶爾會(huì)出現(xiàn)錯(cuò)誤,為什么?

    目前采用SPI-AT的方式兩個(gè)硬件板之間進(jìn)行數(shù)據(jù)的無(wú)線傳輸,一個(gè)作為AP開(kāi)啟TCP服務(wù)器,一個(gè)作為STA連接到對(duì)應(yīng)的服務(wù)器,傳輸?shù)?b class='flag-5'>數(shù)據(jù)量為3000000字節(jié),測(cè)試的過(guò)程
    發(fā)表于 06-26 06:07

    stm32f105自動(dòng)生成的USB主機(jī), 如何進(jìn)行數(shù)據(jù)的接收?

    stm32f105自動(dòng)生成的USB 主機(jī), 如何進(jìn)行數(shù)據(jù)的接收? /** * @briefThe function informs user that data have been sent
    發(fā)表于 03-26 07:29
    主站蜘蛛池模板: 国产精品免费久久久久影院| 久久人成| 1024手机在线看片| 97黄网| 老色批在线播放视频网站免费| av网站免费线看| 免费看啪| 国产一级一级片| 天天摸天天碰天天碰| 国产成人综合久久| 免费一级特黄a| 色中涩| 成年男人午夜片免费观看| 色橹橹| 午夜影院免费| www.黄视频| bt种子搜索-bt天堂| 午夜黄色毛片| 午夜性福| 精品午夜久久影视| 狠狠干狠狠操| 91久操| 亚洲黄色在线网站| 夜夜嘿视频免费看| 亚洲丝袜一区二区| 伊人久色| 一级做a爱片久久毛片| 深爱五月激情网| 网红和老师啪啪对白清晰| 亚洲欧美综合一区| 69堂在线观看国产成人| 天堂在线网| 色视频免费看| 日韩毛片在线| 日本免费大黄| 欧美三级手机在线| 欧美福利精品| 久久ww| 国产免费一级高清淫曰本片| 国产人人艹| 日本免费人成黄页在线观看视频|