在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用于改進文本分類的特征投影

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2021-03-05 15:35 ? 次閱讀

TL; DR

在情感分類中,一些good features,比如”good“、”nice“表示積極,”bad“、“terrible”表示消極。但是,還有許多common features,比如voice、screen就沒有特別的情感性。

盡管深度學習擁有強大的representation learning(表征學習,即同一個數據用不同的表示形式)。但我們認為還有可以改進的地方。

在本文中,我們提出了一種新的角度來進一步改善這種表示學習,即特征投影(feature projection):將現有特征投影到common特征的正交空間中。

所得的投影向量垂直于common特征,能更好的進行分類。

將該方法用于改進基于CNN,RNN,Transformer和Bert的文本分類模型,獲得更好的結果。

網絡結構

Feature Purification Network 特征凈化網絡

模型分為兩部分:

projection network (P-net);

common feature learning network (C-net)

P-net:計算凈化的向量特征,通過將學習到的輸入文本的信息向量投影到更具區分性的語義空間中來消除共同特征的影響。

C-net:提取common features。

P-net由四部分組成:

輸入層X

特征提取器Fp

正交投影層(OPL,Orthogonal Projection Layer)

分類層Cp

C-net也由四部分組成:

輸入層X

特征提取器Fc(Fp和Fc的參數不共享)

漸變反向層(GRL,Gradient Reverse Layer)

分類層Cc

技術的關鍵思想如下:

P-Net中特征向量fp投影到C-Net的fc的正交方向上。也就是說,將fp(從輸入文檔中提取的完整信息)投影到更具區分性的語義空間中,以進行最終分類。

圖2:正交投影層的工作方式。這里的示例是在二維空間中。

fp表示傳統特征向量;

fc表示公共特征向量;

fp?是投影特征向量;

fp~是最終的正交投影特征向量。

我們首先將傳統特征向量fp投影到共同特征向量fc,得到fp?。

等式9中的fp?即表示對共同特征向量fc的約束。

再將fp投影到fp-fp*得到fp~

也就是說:通過將輸入的傳統特征向量fp投影到公共特征向量fc來限制公共特征向量的模,因此新的公共特征向量fp*的語義信息僅包含xi的公共語義信息。

這使得最終的純化特征向量fp~來自傳統特征向量fp,而不是與公共特征向量fc正交的任何平面中的任何向量。

最后,我們使用純化的特征向fp~進行分類。

Experiments實驗

1 實驗使用數據集

2 Baselines模型

用LSTM、CNN、Transformer和BERT等基準模型進行對比實驗,已驗證特征投射的有效性。

3 實施細節

首先,我們將實驗中的所有詞嵌入隨機初始化為200維向量,然后在訓練過程中進行修改(Bert除外)。對于每種類型的特征提取器,我們具有以下配置:

對于RNN模型,使用兩層LSTM進行特征提取,每層的hidden state=256;

對于CNN模型,為了獲得更多的細粒度特征,我們分別使用了[2,3,4,5,6]的濾波器大小,每個濾波器都有100個特征圖。

對于Transformer的模型,我們使用Transformer的編碼器作為特征提取器,使用單頭和3個block。

對于Bert模型,我們微調了預訓練的基于Bert的參數。這些設置與FP-Net中的基線完全相同。

在C-net模塊的訓練中,我們以0.9為初始學習率的隨機梯度和隨后的退火學習率(Ganin and Lempitsky,2014)。

其中,訓練進度p從0線性變化為1,l0 = 0.01,α= 10和β= 0.75。在GRL中,超參數λ為[0.05,0.1,0.2,0.4,0.8,1.0]。

4 實驗結果

5 消融實驗與分析

消融實驗類似于“控制變量法”。假設在某任務中,使用了A,B,C,取得了不錯的效果,但是這個時候你并不知道效果是由A,B,C中哪一個起的作用,于是你保留A,B,移除C進行實驗來看一下C在整個任務中所起的作用。

結論

在本文中,我們提出了一種新的特征凈化網絡(FP-Net),以改進文本分類的表示;

該方法基于特征投影。所提出的模型使用兩個子網,一個用于識別對分類沒有區別的共同特征common features,另一個用于將傳統特征投射到共同特征的正交方向的特征投影;

我們當前的方法僅用于傳統文本分類方法,例如LSTM,CNN和Transformer。在未來的工作中,我們將考慮將其擴展到基于圖的方法(例如用于圖形數據的GCN),以及擴展到基于生成的方法(例如用于對抗性學習的GAN)。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 文本分類
    +關注

    關注

    0

    文章

    18

    瀏覽量

    7332
  • 深度學習
    +關注

    關注

    73

    文章

    5510

    瀏覽量

    121343
  • cnn
    cnn
    +關注

    關注

    3

    文章

    353

    瀏覽量

    22267

原文標題:【ACL2020】用于改進文本分類的特征投影

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何使用自然語言處理分析文本數據

    媒體、新聞報道、用戶評論等)收集你感興趣的文本數據。 數據清洗 :去除無關字符(如HTML標簽、特殊符號等),確保文本數據干凈且一致。 2. 預處理 分詞 :將文本分割成有意義的單元(單詞、短語或句子),這取決于使用的語言和分析
    的頭像 發表于 12-05 15:27 ?348次閱讀

    DMD芯片應用于投影儀的優勢

    DMD(Digital Micromirror Device)芯片是數字光學投影技術(DLP)的核心組件,它將數字信號轉換成可見的投影圖像。DMD芯片應用于投影儀時,具有顯著的優勢,具
    的頭像 發表于 12-05 10:47 ?545次閱讀

    圖紙模板中的文本變量

    進行定義。無論是系統內置的變量,還是用戶自定義的變量,都以這種方式表述。 系統內置文本變量 以下表格展示系統內置的文本變量,無需定義,可以直接使用: 比如說,如果在圖紙編輯器中定義了以下標題欄: 當該圖紙模板應用于原理圖或PCB
    的頭像 發表于 11-13 18:21 ?201次閱讀
    圖紙模板中的<b class='flag-5'>文本</b>變量

    雷達的基本分類方法

    電子發燒友網站提供《雷達的基本分類方法.pdf》資料免費下載
    發表于 09-11 09:09 ?6次下載

    利用TensorFlow實現基于深度神經網絡的文本分類模型

    要利用TensorFlow實現一個基于深度神經網絡(DNN)的文本分類模型,我們首先需要明確幾個關鍵步驟:數據預處理、模型構建、模型訓練、模型評估與調優,以及最終的模型部署(盡管在本文中,我們將重點放在前四個步驟上)。下面,我將詳細闡述這些步驟,并給出一個具體的示例。
    的頭像 發表于 07-12 16:39 ?916次閱讀

    BP神經網絡在語言特征信號分類中的應用

    隨著人工智能技術的飛速發展,語言特征信號分類作為語音識別、語種識別及語音情感分析等領域的重要基礎,正逐漸受到研究者的廣泛關注。BP神經網絡(Back Propagation Neural
    的頭像 發表于 07-10 15:44 ?446次閱讀

    深度學習中的時間序列分類方法

    的發展,基于深度學習的TSC方法逐漸展現出其強大的自動特征提取和分類能力。本文將從多個角度對深度學習在時間序列分類中的應用進行綜述,探討常用的深度學習模型及其改進方法,并展望未來的研究
    的頭像 發表于 07-09 15:54 ?1072次閱讀

    全息投影呈現什么影像特征

    全息投影技術是一種利用光的干涉和衍射原理,將物體的三維信息記錄在全息圖上,并通過適當的光源再現物體的三維影像的技術。全息投影技術具有許多獨特的影像特征,以下是對這些特征的介紹: 三維性
    的頭像 發表于 07-08 11:15 ?750次閱讀

    卷積神經網絡在文本分類領域的應用

    顯著成就后,也逐漸被引入到文本分類任務中。卷積神經網絡通過模擬人類視覺系統的信息處理方式,能夠有效地提取文本中的局部特征,進而實現高精度的文本分類。本文將對卷積神經網絡在
    的頭像 發表于 07-01 16:25 ?773次閱讀

    交換機的基本分類

      交換機作為網絡通訊中的核心設備之一,其在網絡架構中起著至關重要的作用。隨著信息技術的飛速發展,交換機也在不斷演進和革新,以滿足日益復雜的網絡需求。本文將對交換機的分類及其特點進行詳細介紹,以期為讀者提供清晰、深入的理解。
    的頭像 發表于 06-06 11:06 ?2201次閱讀

    基于神經網絡的呼吸音分類算法

    分類器、呼吸(或異常)分類器和某種稱為MASK的注意力。該模型的示意圖如圖1所示。 首先,在模型訓練之前,將每個聲音樣本分割在長度相等的幀上。對于聲音樣本只有一個異常標簽,對于每個幀只有一個噪聲標簽
    發表于 05-31 12:05

    咳嗽檢測深度神經網絡算法

    哮喘、支氣管炎和百日咳發生時的咳嗽音頻信號的方法。在此,使用巴特沃斯高通濾波器進行預處理,并使用MFCC進行特征提取。此外,使用咳嗽特征的訓練數據集,使用改進的CNN完成了咳嗽聲音的分類
    發表于 05-15 19:05

    不同種植設施背景蔬菜作物無人機高光譜精細分類2.0

    SVM-Linear方法,SVM-RBF模型采用RBF核函數將原始特征光譜空間投影到更加高維空間,以解決線性不可分問題,理論上應該可以得到更好的分類結果。然而在本實驗中,SVM-RBF模型并沒有體現出更加強大的優勢,反而在西瓜、
    的頭像 發表于 03-21 11:19 ?542次閱讀

    了解如何使用PyTorch構建圖神經網絡

    圖神經網絡直接應用于圖數據集,您可以訓練它們以預測節點、邊緣和與圖相關的任務。它用于圖和節點分類、鏈路預測、圖聚類和生成,以及圖像和文本分類
    發表于 02-21 12:19 ?804次閱讀
    了解如何使用PyTorch構建圖神經網絡

    投影融合系統:技術解析與未來展望

    投影融合系統是一種先進的投影技術,它將多臺投影儀投射出的畫面進行邊緣重疊,并通過融合技術形成一個無縫、高分辨率的整幅畫面。這種技術廣泛應用于商業展覽、家庭娛樂、教育等領域,為人們帶來了
    的頭像 發表于 02-01 14:50 ?1241次閱讀
    主站蜘蛛池模板: 国产综合在线视频| 伊人久久大香线蕉影院95| 天天干国产| 亚洲精品mv在线观看| 男女www视频在线看网站| 一级@片| 男人女人真曰批视频播放| 免费视频现线观看| 天天躁狠狠躁夜躁2021| 美国69bj| 免费一级视频在线播放| 精品噜噜噜噜久久久久久久久| 三级视频网| 奇米色影院| 精品视频免费看| 女人的天堂网站| 久久成人免费网站| 亚洲一级影院| 免费一级特黄欧美大片勹久久网| 天天操天天干天天做| 美妇乱人伦性| 五月婷婷俺也去开心| 哥也操| 看黄视频网站| 99久久精品国产免费| 国产又黄又爽又猛的免费视频播放| 在线视频毛片| 34pao强力打造免费永久视频| 男人午夜小视频| 免费黄视频网站| 色综合天天网| 日本色片视频| 日本在线一级| 国内精品久久久久影| 天天色天天色天天色| 神马午夜51| 久久久免费精品| 亚洲综合在线一区| 免费黄视频网站| 色香蕉在线观看网站| 都市激情亚洲综合|