在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

了解BERT原理、技術、實踐,只需3分鐘

DPVg_AI_era ? 來源:lp ? 2019-03-01 08:58 ? 次閱讀

本文對BERT的原理、技術細節以及如何應用于實際場景中,做了簡明扼要的介紹。看完本文相信您會對BERT為什么被認為是當前最好的NLP模型、實現原理以及適用場景有所了解。

目前最好的自然語言預訓練方法無疑是BERT。它的工作流程分為兩步:

首先,使用大量未標記的數據,以預訓練、也就是無人監督的方式學習語言表達。

然后,使用少量經過標記的訓練數據對模型進行fine-tune,以監督學習的方式,執行多種監督任務。

預訓練機器學習模型已經在包括視覺、自然語言處理在內的各個領域取得了成功。

詳解BERT及其原理

BERT是Bidirectional Encoder Representations from Transformers的縮寫,是一種新型的語言模型,通過聯合調節所有層中的雙向Transformer來訓練預訓練深度雙向表示。

它基于谷歌2017年發布的Transformer架構,通常的Transformer使用一組編碼器和解碼器網絡,而BERT只需要一個額外的輸出層,對預訓練進行fine-tune,就可以滿足各種任務,根本沒有必要針對特定任務對模型進行修改。

BERT將多個Transformer編碼器堆疊在一起。Transformer基于著名的多頭注意力(Multi-head Attention)模塊,該模塊在視覺和語言任務方面都取得了巨大成功。

BERT的先進性基于兩點:首先,使用Masked Langauge Model(MLM)和Next Sentense Prediction(NSP)的新預訓練任務;其次,大量數據和計算能力滿足BERT的訓練強度。

相比之下,像Word2Vec、ELMO、OpenAI GPT等傳統SOTA生成預訓練方法,使用從左到右的單向訓練,或者淺雙向,均無法做到BERT的雙向性。

MLM

MLM可以從文本執行雙向學習,即允許模型從單詞前后相鄰的單詞,學習每個單詞的上下文,這是傳統方法做不到的。

MLM預訓練任務將文本轉換為符號,并使用符號表示作為訓練的輸入和輸出。15%的符號隨機子集在訓練期間被屏蔽(類似被隱藏起來),目標函數則用來預測符號識別的正確率。

這與使用單向預測作為目標、或使用從左到右和從右到左訓練,來近似雙向性的傳統訓練方法形成了對比。

但是MLM中的BERT屏蔽策略,將模型偏向于實際的單詞,還沒有數據顯示這種偏見對訓練所產生的影響。

NSP

NSP使得BERT可以通過預測上下句之間是否連貫來得出句子之間的關系。

給出50%正確上下句配對,并補充50%的隨機上下句配對,然后對模型進行訓練。

MLM和NSP是同時進行的。

數據和TPU/GPU runtime

BERT的訓練總共使用了33億單詞。其中25億來自維基百科,剩下8億來自BooksCorpus。

訓練使用TPU完成,GPU估算如下所示。

使用2500-392000標記的樣品進行fine-tune。重要的是,100K以上訓練樣本的數據集在各種超參數上表現出強大的性能。

每個fine-tune實驗在單個云TPU上運行1小時,在GPU上需要運行幾個小時不等。

結果顯示,BERT優于11項NLP任務。在SQUAD和SWAG兩個任務中,BERT成為第一個超越人類的NLP模型!

BERT能夠解決的實際任務類型

BERT預訓練了104種語言,已在TensorFlow和Pytorch中實現并開源。Clone地址:

https://github.com/google-research/Bert

BERT可以針對幾種類型的任務進行fine-tune。例如文本分類、文本相似性、問答、文本標簽、如詞性、命名實體識別等。

但是,預訓練BERT是很貴的,除非使用類似于Nvidia V100這樣的TPU或GPU。

BERT人員還發布了一個單獨的多語種模型,該模型使用整個維基百科的100種語言進行訓練,性能比單語種的低幾個百分點。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3655

    瀏覽量

    134883
  • 自然語言
    +關注

    關注

    1

    文章

    288

    瀏覽量

    13369
  • nlp
    nlp
    +關注

    關注

    1

    文章

    489

    瀏覽量

    22064

原文標題:3分鐘看懂史上最強NLP模型BERT

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    OPPO閃充,15分鐘充滿一部手機電量

    在充電5分鐘通話兩小時的基礎上,OPPO又把這項技術提升到了10個小時的高度,2500毫安時電池充電更是只需要15分鐘
    發表于 02-24 08:11 ?3866次閱讀

    3分鐘帶你了解博智慧達激光焊縫跟蹤技術

    3分鐘帶你了解博智慧達激光焊縫跟蹤技術
    發表于 08-30 10:58

    3分鐘到4小時定時器

    3分鐘到4小時定時器:電路原理詳見電路圖。
    發表于 12-13 22:20 ?1881次閱讀
    <b class='flag-5'>3</b><b class='flag-5'>分鐘</b>到4小時定時器

    新型有機電池ORB 充電只需1分鐘

     新型有機電池ORB 充電只需1分鐘 CNET 科技資訊網8月8日國際報道 NEC的研究人員上周四表示,他們已經開發了一種新型的充電電池。這種電池基
    發表于 11-06 10:44 ?729次閱讀

    深圳現身會炒菜機器人:最快只需3分鐘炒好酸辣土豆絲

    炒菜機器人概念并不新,但現在最新產品是它只有迷你冰箱那樣大小,最短3分鐘炒一道酸辣土豆絲,最長15分鐘做一道鯽魚湯。把菜切好了直接放進機器人的容器中,按下確定鍵,就能等著吃菜了。
    發表于 11-22 18:34 ?2179次閱讀

    三星改革智能手機充電技術,充滿只需分鐘

    現在的手機電池續航短的問題一直手機領域研究的重點。近日,三星爆出猛料,宣布已經成功研制出石墨烯電池,以后充電只需要十分鐘
    發表于 12-02 11:24 ?2099次閱讀

    華為推出一款快速充電電池,只需5分鐘就可以充滿50%電量

    關鍵詞:快速充電 , 華為 , 手機充電 快速充電技術正取得重大進展。周五在日本舉行的電池會議上,華為推出了一款快速充電電池,只需5分鐘就可以充滿50%電量。對于容量較低的電池,它只需
    的頭像 發表于 02-18 07:02 ?2339次閱讀

    1024塊TPU在燃燒!將BERT預訓練模型的訓練時長從3天縮減到了76分鐘

    BERT是一種先進的深度學習模型,它建立在語義理解的深度雙向轉換器上。當我們增加batch size的大小(如超過8192)時,此前的模型訓練技巧在BERT上表現得并不好。BERT預訓練也需要很長時間才能完成,如在16個TPUv
    的頭像 發表于 04-04 16:27 ?1.2w次閱讀

    OPPO Reno Ace曝光搭載65W超級閃充只需要30分鐘就能充滿電

    據OPPO介紹,搭載65W閃充的OPPO Reno Ace只需30分鐘就能充滿電,宣傳標語也從以前的“充電5分鐘,通話2小時”改成“充電5分鐘,開黑2小時”。從此前官方的宣傳來看,新機
    發表于 09-25 08:50 ?1319次閱讀

    OPPO Reno 3 Pro將搭載增強版的VOOC 4.0最快56分鐘充滿電

    VOOC 3.0 30分鐘可將手機充滿50%,大概70多分鐘可將手機全部充滿,而VOOC 4.0只需20分鐘即可將手機電量充滿一半,56分鐘
    發表于 12-13 13:55 ?1173次閱讀

    3分鐘了解嵌入式的硬件構架資料下載

    電子發燒友網為你提供3分鐘了解嵌入式的硬件構架資料下載的電子資料下載,更有其他相關的電路圖、源代碼、課件教程、中文資料、英文資料、參考設計、用戶指南、解決方案等資料,希望可以幫助到廣大的電子工程師們。
    發表于 04-04 08:55 ?3次下載
    <b class='flag-5'>3</b><b class='flag-5'>分鐘</b><b class='flag-5'>了解</b>嵌入式的硬件構架資料下載

    3分鐘了解ePort關鍵設計技巧

    ePort-M模塊到手,通信接口不了解?TX線需要串接電阻?信號線不懂處理、走線麻煩?3分鐘帶你了解ePort關鍵設計技巧,輕松上手!
    的頭像 發表于 05-29 12:00 ?935次閱讀
    <b class='flag-5'>3</b><b class='flag-5'>分鐘</b><b class='flag-5'>了解</b>ePort關鍵設計技巧

    3分鐘了解ePort關鍵設計技巧

    ePort-M模塊到手,通信接口不了解?TX線需要串接電阻?信號線不懂處理、走線麻煩?3分鐘帶你了解ePort關鍵設計技巧,輕松上手!通信接口了解
    的頭像 發表于 09-26 11:38 ?1351次閱讀
    <b class='flag-5'>3</b><b class='flag-5'>分鐘</b><b class='flag-5'>了解</b>ePort關鍵設計技巧

    【產品應用】3分鐘了解ePort關鍵設計技巧

    ePort-M模塊到手,通信接口不了解?TX線需要串接電阻?信號線不懂處理、走線麻煩?3分鐘帶你了解ePort關鍵設計技巧,輕松上手!通信接口了解
    的頭像 發表于 06-06 10:17 ?1287次閱讀
    【產品應用】<b class='flag-5'>3</b><b class='flag-5'>分鐘</b><b class='flag-5'>了解</b>ePort關鍵設計技巧

    快樂解說MCU:三分鐘,帶你了解低功耗MCU

    快樂解說MCU:三分鐘,帶你了解低功耗MCU
    的頭像 發表于 09-18 10:56 ?1398次閱讀
    主站蜘蛛池模板: 日本特黄特色大片免费看| 免费艹逼视频| 亚洲大香伊人蕉在人依线| 伊人伊成久久人综合网777| 一级做a爰片久久毛片图片| 亚洲 欧美 另类 综合 日韩| 四虎影视永久地址| 可以免费看黄的网址| 国产亚洲一区二区精品| 热久久这里只有精品| 欧美一级特黄乱妇高清视频| 免费看真人a一级毛片| 国产一级真人毛爱做毛片| 91热成人精品国产免费| 三a大片| 午夜在线观看免费| 人人艹在线| 777影院| 99精品视频在线播放2| 黄色在线观看网站| 国产牛仔裤系列在线观看| 色天天天天| 成人丁香乱小说| 亚洲一区二区高清| 亚洲精品国产美女在线观看| 日韩毛片免费视频一级特黄| 韩国一级网站| 天天摸天天看| 色片视频网站| 在线视频黄色| 4338×亚洲全国最大色成网站| 美女扒开下面让男人捅| 亚洲аv电影天堂网| 欧美性一区二区三区| 丁香六月 久久久| 91大神大战丝袜美女在线观看| 天天挨操| 国产综合精品久久久久成人影| 看片在线观看免费| qvod高清在线成人观看| 水果视频色版|