在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何充分挖掘預訓練視覺-語言基礎大模型的更好零樣本學習能力

jf_pmFSk4VX ? 來源:GiantPandaCV ? 作者:GiantPandaCV ? 2022-10-19 14:39 ? 次閱讀

融入了Prompt的新模式大致可以歸納成”pre-train, prompt, and predict“,在該模式中,下游任務被重新調整成類似預訓練任務的形式。例如,通常的預訓練任務有Masked Language Model, 在文本情感分類任務中,對于 "I love this movie." 這句輸入,可以在后面加上prompt "The movie is ___" 這樣的形式,然后讓PLM用表示情感的答案填空如 "great"、"fantastic" 等等,最后再將該答案轉化成情感分類的標簽,這樣以來,通過選取合適的prompt,我們可以控制模型預測輸出,從而一個完全無監督訓練的PLM可以被用來解決各種各樣的下游任務。

因此,合適的prompt對于模型的效果至關重要。大量研究表明,prompt的微小差別,可能會造成效果的巨大差異。研究者們就如何設計prompt做出了各種各樣的努力——自然語言背景知識的融合、自動生成prompt的搜索、不再拘泥于語言形式的prompt探索等等。

而對于視覺領域的prompt,最近在視覺語言預訓練方面的進展,如CLIP和ALIGN,prompt為開發視覺任務的基礎模型提供了一個有前途的方向。這些基礎模型在數百萬個有噪聲的圖像-文本對上進行訓練后編碼了廣泛的視覺概念,可以在不需要任務特定的訓練數據的情況下以零目標的方式應用于下游任務。這可以通過適當設計的prompt提示實現。

以CLIP為例,如下圖紅色方框強調所示,可以完成對“class label”的拓展,使得模型具有較為豐富的視覺信息。然后,可以使用CLIP對圖像進行分類,以度量它們與各種類描述的對齊程度。因此,設計這樣的提示在以zero-shot方式將基礎模型應用到下游任務中起著至關重要的作用。

3811eb96-4f00-11ed-a3b6-dac502259ad0.png

然而,這種手工制作的prompt需要特定于領域的靈感,因此可能較難設計,所以如何設計一種模式,可以讓讓模型自適應地學習到有關prompt的一些參數和設定是非常有必要的。與手工制作的prompt相比,這種方法可以找到更好的prompt,但學習到的prompt僅限于與訓練數據對應的分布和任務,除此之外的泛化可能有限。

此外,這種方法需要帶注釋的訓練數據,這可能非常昂貴,而且不能很好地應用于zero-shot的相關任務中。為了解決上述的挑戰, 論文提出在測試階段使用test-time prompt tuning(TPT),只使用給定的測試樣本對prompt進行調整。由于避免了使用額外的訓練數據或標注,TPT仍然遵守了zero-shot的設置。

3841c1d6-4f00-11ed-a3b6-dac502259ad0.png

. 方法

論文首先簡單回顧了CLIP和基于CLIP的一些可學習參數的prompts獲取方法。對于為何要優化prompt,論文是這樣描述的:CLIP包含了豐富的知識,從前期的訓練中獲得了海量的知識和不同的數據感知能力。然而,如何更有效地提取這些知識仍然是一個開放的問題。一個簡單的策略是直接對模型進行微調,無論是端到端的還是針對的一個子集層,對一類的輸入。然而,先前的工作表明,這種微調策略導致特定于領域的行為失去了非分布泛化和魯棒性的基礎模型。

因此,這項工作的目標是利用現有的CLIP知識來促進其泛化到zero-shot的廠家中去。因此,調整prompt就是實現這一目標的理想途徑。此外,我們將測試時提示調優視為為模型提供上下文的一種方法為單個測試樣本量身定制,有助于精確檢索CLIP知識。

論文的目的很簡單,就是在測試階段得不到測試樣本ground-truth標注的時候,進行一定的訓練,具體表現為

因為標簽不能用于測試階段的優化,所以我們如果想在測試階段進行優化就必須選擇用于能夠提供一定hint的無監督損失函數來指導優化。因此,論文設計了TPT目標來促進采用不同數據增強下,模型的一致性。通過對給定測試相同圖像的不同增強類型的特征,來依照他們預測的差值來進行訓練。具體來說,我們使用一個隨機增廣cluster生成測試圖像的N個隨機augumention視圖,最小化平均預測概率分布的熵:

這里 是根據物體不同prompt and the -th augmented view of the test image預測出的概率。

值得一提的是,為了減少隨機增強的噪聲(也就是說增強之后模型很難再預測出正確的分類信息,如刪去了圖像非常關鍵的content),本文還引入了一個新的機制:confidence selection,來選擇過濾增強產生的低置信度預測的view。數學表達式體現為:

38736830-4f00-11ed-a3b6-dac502259ad0.png

實驗

388b7efc-4f00-11ed-a3b6-dac502259ad0.png

首先論文根據CoOp 和 CoCoOp的混淆矩陣可視化來判斷這兩種可學習的prompt參數化方式在不同數據集上的遷移性很差,有增加參數量過擬合的嫌疑。所以其實在訓練階段,增加參數量來做相應的操作不見得合理。因此才更能體現本文這種基于測試階段方法提出方法的優越性。

38b42046-4f00-11ed-a3b6-dac502259ad0.png

可以發現,本文提出的這種方法在不同數據集之間的遷移性非常之好。

結論

本文研究了如何充分挖掘預訓練視覺-語言基礎大模型的更好零樣本學習能力。論文提出了Test-time Prompt Tuning, TPT),這種新的prompt調整方法,可以使用單個測試樣本動態學習自適應提示。我們證明了該方法對自然分布變化的魯棒性跨數據集泛化,使用CLIP作為基礎模型。不需要任何訓練數據或標注,TPT提高了CLIP的zero-shot的泛化能力。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3244

    瀏覽量

    48844
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24703
  • Clip
    +關注

    關注

    0

    文章

    31

    瀏覽量

    6667
  • 自然語言
    +關注

    關注

    1

    文章

    288

    瀏覽量

    13350
  • 大模型
    +關注

    關注

    2

    文章

    2451

    瀏覽量

    2714

原文標題:面向測試階段的prompt搜索方式

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【大語言模型:原理與工程實踐】大語言模型訓練

    語言模型的核心特點在于其龐大的參數量,這賦予了模型強大的學習容量,使其無需依賴微調即可適應各種下游任務,而更傾向于培養通用的處理能力。然而
    發表于 05-07 17:10

    【大語言模型:原理與工程實踐】大語言模型的應用

    設計提示詞時,需要明確輸出需求,以便得到滿意的結果。 推理引導如前文所述,提示工程對于訓練語言模型的逐步推理能力至關重要。
    發表于 05-07 17:21

    基于深度學習的自然語言處理對抗樣本模型

    深度學習模型被證明存在脆弱性并容易遭到對抗樣本的攻擊,但目前對于對抗樣本的研究主要集中在計算機視覺領域而忽略了自然
    發表于 04-20 14:36 ?39次下載
    基于深度<b class='flag-5'>學習</b>的自然<b class='flag-5'>語言</b>處理對抗<b class='flag-5'>樣本</b><b class='flag-5'>模型</b>

    基于訓練視覺-語言模型的跨模態Prompt-Tuning

    、新加坡國立大學 鏈接:https://arxiv.org/pdf/2109.11797.pdf 提取摘要 訓練視覺語言模型 (VL-P
    的頭像 發表于 10-09 15:10 ?3240次閱讀
    基于<b class='flag-5'>預</b><b class='flag-5'>訓練</b><b class='flag-5'>視覺</b>-<b class='flag-5'>語言</b><b class='flag-5'>模型</b>的跨模態Prompt-Tuning

    融合樣本學習和小樣本學習的弱監督學習方法綜述

    融合樣本學習和小樣本學習的弱監督學習方法綜述 來源:《系統工程與電子技術》,作者潘崇煜等 摘
    發表于 02-09 11:22 ?2315次閱讀
    融合<b class='flag-5'>零</b><b class='flag-5'>樣本</b><b class='flag-5'>學習</b>和小<b class='flag-5'>樣本</b><b class='flag-5'>學習</b>的弱監督<b class='flag-5'>學習</b>方法綜述

    如何更高效地使用訓練語言模型

    基本的假設:訓練模型在不同下游任務上學習的過程,可以被重新參數化(reparameterized)為在同一個低維征子空間上的優化過程。
    的頭像 發表于 07-08 11:28 ?1280次閱讀

    利用視覺語言模型對檢測器進行訓練

    訓練通常被用于自然語言處理以及計算機視覺領域,以增強主干網絡的特征提取能力,達到加速訓練和提高
    的頭像 發表于 08-08 15:33 ?1409次閱讀

    使用BLIP-2 樣本“圖生文”

    現代計算機視覺和自然語言模型能力越來越強大的同時,模型尺寸也隨之顯著增大。由于當前進行一次單模態模型
    的頭像 發表于 03-03 11:06 ?1818次閱讀

    訓練數據大小對于訓練模型的影響

    BERT類模型的工作模式簡單,但取得的效果也是極佳的,其在各項任務上的良好表現主要得益于其在大量無監督文本上學習到的文本表征能力。那么如何從語言學的特征角度來衡量一個
    的頭像 發表于 03-03 11:20 ?1438次閱讀

    形狀感知樣本語義分割

    由于大規模視覺語言訓練取得了令人矚目的進展,最近的識別模型可以以驚人的高準確度對任意對象進行
    的頭像 發表于 04-28 11:26 ?822次閱讀
    形狀感知<b class='flag-5'>零</b><b class='flag-5'>樣本</b>語義分割

    一個通用的自適應prompt方法,突破了樣本學習的瓶頸

    為了解決這個問題,這篇研究提出了一種Universal Self-adaptive Prompting (USP)方法,對LLMs的樣本學習進行了優化,同時也適用于少樣本
    的頭像 發表于 06-01 14:48 ?781次閱讀
    一個通用的自適應prompt方法,突破了<b class='flag-5'>零</b><b class='flag-5'>樣本</b><b class='flag-5'>學習</b>的瓶頸

    基于訓練模型語言增強的樣本視覺學習

    在一些非自然圖像中要比傳統模型表現更好 CoOp 增加一些 prompt 會讓模型能力進一步提升 怎么讓能力
    的頭像 發表于 06-15 16:36 ?570次閱讀
    基于<b class='flag-5'>預</b><b class='flag-5'>訓練</b><b class='flag-5'>模型</b>和<b class='flag-5'>語言</b>增強的<b class='flag-5'>零</b><b class='flag-5'>樣本</b><b class='flag-5'>視覺</b><b class='flag-5'>學習</b>

    什么是樣本學習?為什么要搞樣本學習

    樣本分類的技術目前正處于高速發展時期, 所涉及的具體應用已經從最初的圖像分類任務擴展到了其他計算機視覺任務乃至自然語言處理等多個相關領域。 對此, 本文將其稱為廣義
    發表于 09-22 11:10 ?2199次閱讀
    什么是<b class='flag-5'>零</b><b class='flag-5'>樣本</b><b class='flag-5'>學習</b>?為什么要搞<b class='flag-5'>零</b><b class='flag-5'>樣本</b><b class='flag-5'>學習</b>?

    訓練模型的基本原理和應用

    訓練模型(Pre-trained Model)是深度學習和機器學習領域中的一個重要概念,尤其是在自然
    的頭像 發表于 07-03 18:20 ?2837次閱讀

    語言模型訓練

    能力,逐漸成為NLP領域的研究熱點。大語言模型訓練是這一技術發展的關鍵步驟,它通過在海量無標簽數據上進行
    的頭像 發表于 07-11 10:11 ?435次閱讀
    主站蜘蛛池模板: 视频福利网| 欧美一区二区三区视频| 男人透女人超爽视频免费| 欧美一级在线观看| 51成人网| 好大好硬好深好爽的视频| 亚洲国产成人久久77| 巨乳色在线观看| 日日干夜夜操视频| 在线观看免费午夜大片| 亚洲三级在线| 国产aaa级一级毛片| 天天上天天操| 5060精品国产福利午夜| 亚州1区2区3区4区产品乱码2021| 韩国三级床戏合集| 国产成人精品一区二区三区| 亚洲欧洲第一页| 一及黄色| 二级黄色大片| 国产真实乱xxxav| 欧美在线伊人| 免费aa| 在线免费观看一区二区三区| 亚洲精品久久久久影| 岛国毛片一级一级特级毛片| 欧美三级网站| 性欧美久久| 在线永久免费播放视频| 97射射| 日韩免费精品视频| 成年人网站免费观看| h网站国产| 四虎在线播放免费永久视频| 免费人成年短视频在线观看免费网站| 成人av.com| 一区二区三区四区在线观看视频 | 亚洲色图.com| 91极品视频在线观看| 免费伦费一区二区三区四区| 色多多视频在线观看免费大全|