在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何計算模型對預測結果的信心

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2022-09-28 11:46 ? 次閱讀

在很多問題中,獲取標注準確的大量數據需要很高的成本,這也往往限制了深度學習的應用。主動學習通過對未標注的數據進行篩選,可以利用少量的標注數據取得較高的學習準確度。本文將提供代碼實現,展示實驗效果及一些思考。

1. 原理

通過命名實體識別模型對未標注數據進行預測,根據不同的評價標準計算模型對該數據預測結果的信心(概率)。對于信心較低的樣本,往往包含模型更多未知的信息,挑選出這些信心較低的樣本進行優先標注。更詳細的原理可以閱讀參考文章:基于深度主動學習的命名實體識別[1](這篇小喵很早之前已經拜讀過了,非常推薦大家閱讀,相信大家一定會有所收獲)。

2. 模型設計

模型的上游采用Bert,采用最普通的序列標注的方式,即在 token-level 進行多標簽分類

另一方面,為了解決實體重疊的問題,使用 Sigmoid 代替 SoftMax。

此外,我們沒有使用 crf 層,在原論文中也沒有使用 crf 層。這樣做的原因主要是因為主動學習是為了挑選出最有標注價值的數據,而不是為了追求模型的準確率。crf 層會增加模型預測的時間,所以沒有選擇使用。

3. 如何計算模型對預測結果的信心

這里介紹論文中提及的兩種計算方式 Least Confidence(簡稱 LC)和 Maximum Normalized Log-Probality(簡稱 MNLP):

LC:是計算預測中最大概率序列的對應概率值。

MNLP:基于 LC 并且考慮到生成中的序列長度對于不確定性的影響,我們做一個 normalization(即除以每個句子的長度),概率則是用每一個點概率輸出的 log 值求和來代替。

在論文中作者表示 MNLP 是非常理想的方法。在實際實驗中 MNLPLC 更為”公平“。原因是:句子越長,對于 LC 這種評價標準來說,分數會更高;而 MNLP 不會。

但是在研究 MNLP 給出評分較高和較低的case后,會發現 MNLP 對于句子中預測出的實體數量很敏感,如果預測出的實體很少,分數往往很高,相對的,實體數量很多,分數會很低。

所以本文的實現中提供了一種補償方案,在 MNLP 的基礎上根據實體數量進行補償,讓其對實體數量不那么敏感。具體的做法是除以一個補償參數 ,這個參數主要由句子中預測出的實體數決定。

代碼

lc_confidence=0
MNLP_confidence=0

forlableinlabels:
lc_con=1
mnlp_con=1
forlinlable:
ifl<=?0.5:
????????????????l?=?1?-?l
????????????lc_con?*=?l
????????????mnlp_con?+=?math.log(l)
????????lc_confidence?+=?lc_con???
????????MNLP_confidence?+=?mnlp_con

????MNLP_confidence?=?MNLP_confidence/(len(labels))
????entry_MNLP_confidence?=?1?-?(1?-?MNLP_confidence)/((len(res)?+?2)**0.5)?*?(2)

其中 labels 是模型對句子序列預測的結果 可以參考下圖示例。其中,單元格中的數字代表:對應標簽類別對當前位置是否屬于自己類別的預測概率。

3dbdf588-398b-11ed-9e49-dac502259ad0.png

舉個例子,0.9 代表模型預測 ‘北’ 字是 ‘B-地名’ 標簽的概率為0.9。對于B-地名標簽來說,就有

4. 結果與思考

結果示例

"'公告編號:2021-067中南紅文化集團股份有限公司關于公司職工代表監事辭職暨補選職工代表監事的公告本公司及監事會全體成員保證信息披露內容真實、準確和完整,沒有虛假記載、誤導性陳述或者重大遺漏。中南紅文化集團股份有限公司(以下簡稱“公司”)監事會于2021年6月11日收到公司職工代表監事王哲女士提交的書面辭職報告。王哲女士因個人原因申請辭去公司第五屆監事會職工代表監事職務。王哲女士辭職后,不再擔任公司任何職務。截至本公告發布之日,王哲女士未持有公司股份。":{
"res":[
[
"中南紅文化集團股份有限公司",
"職位變動_辭職_公司"
],
[
"職工代表監事",
"職位變動_辭職_職位"
],
[
"王哲",
"職位變動_辭職_人物"
]
],
"LC":217.5803241119802,
"MNLP_confidence":0.9695068267227575,
"entry_MNLP_confidence":0.9863630383404811
},
"3月31日,金剛玻璃再次發布公告,董事會于3月29日收到汕頭市公安局送達的《拘留通知書》,董事莊毓新因涉嫌違規披露、不披露重要信息罪被刑事拘留。圖片來源:深交所面對董秘辭職、董事被刑拘,金剛玻璃4月7日發布公告,公司董事會將提前換屆選舉。此前,金剛玻璃還曾因信披違規等被證監會處罰。2020年4月,廣東證監局對金剛玻璃下發《行政處罰決定書》和《市場禁入決定書》。經查,2015年-2018年間,金剛玻璃存在虛增營收、利潤、貨幣資金以及未按規定披露關聯交易等違法行為。":{
"res":[
[
"金剛玻璃",
"職位變動_辭職_公司"
]
],
"LC":219.0427916272391,
"MNLP_confidence":0.9781149683847055,
"entry_MNLP_confidence":0.9873646711056863
},

思考

通過主動學習的結果,我們可以得到信心最少的樣本進行標注。同時信心最大的樣本也需要我們關注,如果這些樣本中存在明顯的錯誤,是否我們可以認為模型學到了一些錯誤信息,并且特別的自信呢。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7104

    瀏覽量

    89294
  • 模型
    +關注

    關注

    1

    文章

    3279

    瀏覽量

    48974
  • 代碼
    +關注

    關注

    30

    文章

    4809

    瀏覽量

    68817
  • nlp
    nlp
    +關注

    關注

    1

    文章

    489

    瀏覽量

    22064

原文標題:寫在前面

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    經濟預測模型

    該資料是由幾篇論文和一個講義組成,具體講解了回歸分析預測、時間序列預測、宏觀計量經濟模型
    發表于 08-15 10:47

    關于BP神經網絡預測模型的確定!!

    請問用matlab編程進行BP神經網絡預測時,訓練結果很多都是合適的,但如何確定最合適的?且如何用最合適的BP模型進行外推預測
    發表于 02-08 14:23

    PaddlePaddle使用預測模型預測圖片報錯及解決方法

    PaddlePaddle使用預測模型預測圖片時出現輸出數據維度錯誤
    發表于 05-31 09:39

    永磁同步電機模型預測控制matlab/simulink仿真模型

    出售永磁同步電機(pmsm)模型預測控制(MPC)matla b/simulink仿真模型,轉速控制,電流控制,轉矩控制,有PI矢量控制,直接預測控制(有限集
    發表于 07-05 07:18

    模型預測控制+邏輯控制

    模型預測控制(MPC)+邏輯控制(相平面分區控制)–matlab例程介紹MATLAB-模型模糊神經網絡預測控制demo(訓練數據用):鏈接:目錄構建思想matlab simulink框
    發表于 08-17 07:09

    模型預測控制介紹

    這篇主要講一下模型預測控制,如果對PID控制了解的同學,那效果更好。如果不了解PID控制,還是熟悉下比較好。模型預測控制,顧名思義,基于模型
    發表于 08-18 06:21

    什么是有限集模型預測控制

    應用于電壓型逆變器饋電的永磁同步電機驅動系統中。有限集模型預測控制在當前控制周期內對每個開關狀態所產生的電機輸出結果進行預測,將預測
    發表于 08-27 06:05

    什么是MPC模型預測控制?

    什么是MPC模型預測控制?
    發表于 11-22 06:10

    LabVIEW進行癌癥預測模型研究

    LabVIEW進行癌癥預測模型研究 癌癥是一種細胞異常增生的疾病。隨著年齡的增長,細胞分裂速度放緩,但癌細胞會失去控制地不斷分裂,形成可能良性或惡性的腫瘤。 2012年的國際癌癥數據顯示,新發癌癥
    發表于 12-13 19:04

    基于短波的天波傳播衰減預測模型

    摘要! 建立短波天波傳播衰減預測計算模型! 為保障短波通信電路的可靠性提供參考依據! 首先進行傳播路徑的判別!進而進行頻率預測! 最后建立傳播衰減
    發表于 02-11 14:23 ?30次下載

    計算優化支持向量機的風速預測

    經驗模式分解(CEEMD)將原始風電功率時間序列分解成幾個固有模態函數(IMFs);對每個IMF分量單獨建立膜計算優化算法優化支持向量機(MCO-SVR)的模型進行預測;疊加全部IMF分量的
    發表于 03-13 11:13 ?0次下載

    如何使用改進GM模型進行房價預測模型資料說明

    灰色GM (1, 1)模型適合對數據量較少、波動不大的短期數據進行預測,而馬爾可夫模型適用于數據波動較大的預測過程的特點,通過結合改進的GM (1, 1)
    發表于 12-19 11:44 ?7次下載
    如何使用改進GM<b class='flag-5'>模型</b>進行房價<b class='flag-5'>預測</b><b class='flag-5'>模型</b>資料說明

    工作流故障并了解如何預測它們

      獲得信心:當您開始看到有希望的結果時,請使用團隊內的領域知識根據成本和嚴重程度預測不同的結果。在現有維護程序的背景下運行預測性維護
    的頭像 發表于 06-08 09:14 ?745次閱讀
    工作流故障并了解如何<b class='flag-5'>預測</b>它們

    工作流故障并了解如何預測它們

      獲得信心:當您開始看到有希望的結果時,請使用團隊內的領域知識根據成本和嚴重程度預測不同的結果。在現有維護程序的背景下運行預測性維護
    的頭像 發表于 07-06 15:12 ?605次閱讀
    工作流故障并了解如何<b class='flag-5'>預測</b>它們

    matlab預測模型有哪些

    環境,使其成為預測模型開發和實現的理想平臺。本文將詳細介紹MATLAB中常用的預測模型及其應用。 線性回歸模型 線性回歸是一種簡單的
    的頭像 發表于 07-11 14:27 ?802次閱讀
    主站蜘蛛池模板: 免费一级e一片在线播放| 欧美性猛交xxxx免费| 一级免费看片| 天天夜夜爽| 黑人黄色大片| 日本三级视频| 99热免费| 亚洲免费三级| 色偷偷中文字幕| 伊人久久亚洲综合天堂| 伊人精品成人久久综合欧美| 新版天堂中文资源官网| 日本高清色视频在线观看免费| 婷婷丁香激情五月| 一区二区三区四区在线视频| 亚洲福利二区| 人人爱人人插| 狠狠色欧美亚洲狠狠色www| 成年女人毛片免费视频| 国产va免费精品观看| 黄a视频在线观看| aaaa欧美高清免费| 94在线| 日本一本高清视频| 人人操天天射| 亚洲综合在线最大成人| 国产一级大片免费看| 五月sese| 种子 在线播放| 日本免费网| 成年女人在线观看| 男女激情做爰叫床声视频偷拍| 男人天堂黄色| 亚洲视频在线播放| 亚洲色图日韩| 免费一级网站| 很色视频| 天天摸天天做天天爽在线| 西西午夜影院| 亚洲高清国产拍精品影院| 精品爱爱|