在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

這篇究極諷刺的文章一出,NLP無了

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 2023-09-25 17:08 ? 次閱讀

在測試集上預訓練?這聽起來似乎有點不合常規,但別急,繼續往下看!

文章以一項大膽的實驗為開端,作者創造了一個高質量的數據集,然而,這個數據集并非來自于人為合成,而是源自huggingface上的眾多評估基準數據。

借助這一數據集完成了一個基于 Transformer 的語言模型的預訓練,這個模型被命名為 phi-CTNL(發音為“fictional”)。

令人驚訝的是,phi-CTNL 在各類學術基準測試中表現得相當完美,勝過了所有已知的模型。

該研究還發現,phi-CTNL 在預訓練計算方面超越了神秘的冪律擴展法則。隨著訓練輪次的增加,它的性能快速趨近于零。

e5acc378-5b81-11ee-939d-92fbcf53809c.png

此外,phi-CTNL 似乎具備某種超自然的理解能力。在學習過程中,它能夠快速而準確地預測下游評估的指標。

e5c67ffc-5b81-11ee-939d-92fbcf53809c.png

是的,這篇文章可不是在搞笑,而是要諷刺那些以前不知道眼前有坑的學術研究。

作者認為,盡管評估和基準測試對于語言模型的發展至關重要,但這個領域經常受到夸夸其談的宣傳,卻忽視了數據污染的潛在風險。

作者甚至含蓄地點名了一些模型,例如 phi-1、TinyStories 和 phi-1.5。告誡我們,不要相信任何一個沒有隔離數據污染的LLM模型。

這些模型做錯了什么呢?

一個在推上測試Phi-1.5的例子引發了眾多討論。例如,如果你截斷下圖這個問題并輸入給Phi-1.5,它會自動完成為計算第三個月的下載數量,并且回答是正確的。

e5d9fffa-5b81-11ee-939d-92fbcf53809c.png

稍微改變一下數字,它也會正確回答。

e5ef3906-5b81-11ee-939d-92fbcf53809c.png

但是一旦你變換格式,它就會完全出錯。(這里的格式變化是保留了提示中的所有 ' '。)

e60936b2-5b81-11ee-939d-92fbcf53809c.jpg

另一個例子是一個關于蘋果的數學計算問題,phi模型最初可以正確回答問題。

e62942fe-5b81-11ee-939d-92fbcf53809c.jpg

然而,一旦我們改變其中的一個數字,例如從8.5改成7.5,模型會開始出現幻覺現象。

e63ba0ac-5b81-11ee-939d-92fbcf53809c.jpg

為了檢查2這個數字有沒有被記憶,我們可以把pizza的價格改成10.5.但是phd依然繼續輸出2(應該為1)。

e65ad116-5b81-11ee-939d-92fbcf53809c.jpg

基于這些發現,研究人員認為Phi-1.5模型的數據污染問題很嚴重。

通過以不合常規的方式預訓練模型,這篇文章提醒我們強調了數據污染的危險性。告誡我們,不要相信任何一個沒有隔離數據污染的LLM模型。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3279

    瀏覽量

    48985
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24759
  • nlp
    nlp
    +關注

    關注

    1

    文章

    489

    瀏覽量

    22065

原文標題:這篇究極諷刺的文章一出,NLP無了

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    “黑科技”一出誰與爭鋒 盤點15個顛覆想象的機器人

    來自RoboBusiness2016展的這15個競賽項目代表機器人產業創新的最新趨勢和想法,對創業公司、對人工智能未來發展方向都極具參考意義。 黑科技一出誰與爭鋒 盤點15個顛覆想象的機器人 RoboBusiness2016展會最近在圣何塞會議中心舉行,在展會上還舉辦了
    發表于 11-09 11:25 ?496次閱讀

    基于卷積神經網絡的組合模型處理NLP任務諷刺檢測

    數據為均衡和失衡的諷刺推文數據集,取自Ptacek等2014年的工作和The Sarcasm Detector。移除了用戶名、URL、#標記,使用了NLTK Twitter Tokenizer。
    的頭像 發表于 07-02 08:37 ?6250次閱讀
    基于卷積神經網絡的組合模型處理<b class='flag-5'>NLP</b>任務<b class='flag-5'>諷刺</b>檢測

    NLP的面試題目

    NLP面試題目6-10
    發表于 05-21 15:02

    NLP的tfidf作詞向量

    NLP之tfidf作詞向量
    發表于 06-01 17:28

    HDMI2.0 二進一出KVM轉換器電路設計資料AG7231參考電路

    `AG7231主要是用在HDMI2.0 二進一出KVM轉換器或者HDMI2.0 二切KVM切換器方案設計當中。AG7231設計結構框圖如下AG7231詳細的參考電路如附件中所示`
    發表于 06-29 17:09

    智能音響的形態:音響行業再添悍將 大屏與安卓系統深度結合

    酷狗智能音響在智能方面做得還是非常到位的。不管是超大的顯示屏,還是深度定制的系統,都完全符合我心中對智能音響的定義。或許,大屏+安卓系統就是智能音響的形態。
    發表于 07-25 16:21 ?1353次閱讀

    NLP的介紹和如何利用機器學習進行NLP以及三種NLP技術的詳細介紹

    本文用簡潔易懂的語言,講述自然語言處理(NLP)的前世今生。從什么是NLP到為什么要學習NLP,再到如何利用機器學習進行NLP,值得
    的頭像 發表于 06-10 10:26 ?7.7w次閱讀
    <b class='flag-5'>NLP</b>的介紹和如何利用機器學習進行<b class='flag-5'>NLP</b>以及三種<b class='flag-5'>NLP</b>技術的詳細介紹

    智能制造是中國制造業的唯一出

    李書福出身制造業,堅守制造業,對制造業充滿感情。 他認為,中國制造已經到了十分重要的關鍵轉型時刻,智能制造是唯一出路和美好未來。 他呼吁,萬眾心,盡快形成中國汽車工業的核心競爭力,推動中國制造從全球價值鏈中低端邁向中高端。
    發表于 10-17 08:35 ?3576次閱讀

    NLP-Progress庫NLP的最新數據集、論文和代碼

    方向是自然語言處理的同學們有福啦,為了跟蹤自然語言處理(NLP)的進展,有大量仁人志士在 Github 上維護個名為 NLP-Progress 的庫。它記錄了幾乎所有
    的頭像 發表于 11-17 09:21 ?2573次閱讀

    NLP 2019 Highlights 給NLP從業者的個參考

    自然語言處理專家elvis在medium博客上發表關于NLP在2019年的亮點總結。對于自然語言處理(NLP)領域而言,2019年是令人印象深刻的年。在這篇博客文章中,我想重點介紹
    的頭像 發表于 09-25 16:56 ?1750次閱讀

    針對社交媒體的評論諷刺檢測模型

    諷刺是日常交際中種常見的語用現象,能夠豐富說話者的觀點并間接地表達說話者的深層含義。諷刺檢測任務的研究目標是挖掘目標語句的諷刺傾向。針對諷刺
    發表于 03-12 11:49 ?5次下載
    針對社交媒體的評論<b class='flag-5'>諷刺</b>檢測模型

    【技術分享】屏閃鬧的是哪一出

    在各種應用場景中屏閃的出現并不稀奇,電子工程師時不時能見到屏閃那幕,那屏閃究竟是鬧的哪一出呢,出現屏閃該如何解決? ?? 案例 客戶在電源模塊應用過程中曾經出現過這樣的應用場景,如下圖1所示
    的頭像 發表于 08-14 11:45 ?564次閱讀
    【技術分享】屏閃鬧的是哪<b class='flag-5'>一出</b>?

    一進一出正負雙向信號隔離變送器

    捷晟達科技的DIN35 1x1 MI一進一出高精度模擬量正負雙向信號隔離變送器,是將輸入與輸出之間電氣絕緣的模擬信號進行變換、放大、隔離的信號調理變換器小型設備,該設備接收現場儀表的各種模擬量信號
    發表于 09-16 01:20 ?0次下載

    一進一出高電壓大電流信號隔離變送器

    捷晟達科技(JSD科技)的JSD TAH-1001系列一進一出高電壓(大電流)信號隔離變送器,該產品最高測量電壓高達3000VDC及30ADC,產品是將輸入與輸出之間電氣絕緣的模擬信號進行變換、放大
    發表于 09-16 02:34 ?0次下載

    BL150A11直流型一出隔離器說明書

    電子發燒友網站提供《BL150A11直流型一出隔離器說明書.pdf》資料免費下載
    發表于 03-08 15:00 ?0次下載
    主站蜘蛛池模板: 欧美aaaaa性bbbbb小妇| 亚洲香蕉影院| 日韩综合色| 在线婷婷| 精品国产理论在线观看不卡| 综合色综合| 黄色一级片视频| 色多多免费视频| 日本国产在线| 婷婷综合久久中文字幕| 久久精品国产亚洲婷婷| 欧美男人天堂网| 精品女同| 欧美涩区| 狠狠色噜噜狠狠狠狠米奇777| 18满xo影院视频免费体验区| www.天天射.com| 久久久久久久国产| 久久久久久久国产免费看| 18性夜影院午夜寂寞影院免费| 黑人黄色大片| 欧美人与zoxxxx另类9| 女人aaaaa片一级一毛片| 中文字幕1区2区| 高h细节肉爽文bl1v1| 欧美视频三区| 性欧美性free| 无遮挡很爽很污很黄在线网站| 三级在线观看网站| 黄色二级视频| 激情6月丁香婷婷色综合| 2022第二三四天堂网| 久久最新精品| 国产亚洲片| 精品亚洲国产国拍| av 狼| 欧美日韩亚洲一区| 婷婷免费高清视频在线观看| 免费在线观看你懂的| 妹子干综合网| 狠狠色丁香婷婷综合久久片|