《完美世界》txt全集,欢乐颂小说在线阅读,遮天辰东小说

在prompt learning中一個核心問題是模型存在死記硬背現象。Prompt learnin主要應用在few-shot learning場景，先將訓練數據轉換成prompt的形式，在訓練過程模型側重于記憶訓練數據，然后使用記憶的信息做預測。這個過程會導致模型缺乏泛化能力，一些長尾的case預測效果不好。

NIPS 2022中浙大和阿里提出使用檢索方法增強prompt learning，利用訓練數據構造知識庫，在訓練階段使用知識庫+KNN檢索相關信息輔助學習，通過這種方式將需要記憶的信息從模型中拆分出來，直接輸入到模型中。通過這種方式，可以讓模型參數更側重泛化信息的學習，而不是過擬合訓練數據。下面為大家詳細介紹一下這篇工作。

NLP Prompt系列——Prompt Engineering方法詳細梳理

1 Prompt Learning回顧

Prompt learning主要面向的是訓練數據較少的場景。首先需要一個預訓練模型，然后將下游任務轉換成完形填空的形式。對于分類問題，判斷某個text屬于哪個label，轉換成如下的文本輸入到預訓練語言模型中：

利用預訓練語言模型，預測出[MASK]對應的文本，后面接一個文本到label的映射函數，即可實現文本分類任務。Prompt learning的好處是可以充分利用預訓練語言模型的知識，讓下游任務和預訓練任務更加適配，以提升樣本量不足情況下的效果。我在之前的文章NLP Prompt系列——Prompt Engineering方法詳細梳理詳細介紹過prompt相關工作，感興趣的同學可以進一步閱讀。

雖然這種方法充分運用了預訓練語言模型的知識，但畢竟finetune的數據少，模型更像在死記硬背訓練prompt數據中的信息。這對于長尾樣本或非典型的句子的預測效果不友好。為了解決上述問題，本文的核心思路是，如果我們把這些需要記憶的信息單獨拿出來存儲到一個知識庫中，在需要的時候檢索它們并作為模型額外輸入，就能讓模型參數沒必要再死記硬背這些信息了，從而實現記憶和泛化更好的平衡，有點【好記性不如爛筆頭】的感覺。下圖是本文提出的基本框架示意圖。

2 從知識庫中檢索信息

實現上面的框架核心是從知識庫中檢索信息，這也就涉及到兩個問題，一個是如何構造知識庫，另一個是如何進行信息檢索和利用。

在知識庫的構造上，文中構造的是一個{K, V}格式的數據，訓練集中的每條樣本對應一個{K, V}。K代表這個樣本的prompt輸入模型后[MASK]位置的隱向量，V代表這個樣本的label對應的單詞。由于K是模型輸出的向量，因此每訓練幾輪，就會動態更新知識庫中的Key，避免Key和模型最新參數隔代太多不匹配。

在信息檢索和利用上，對于當前樣本模型先得到其[MASK]位置的向量，然后用這個向量在知識庫中進行KNN檢索，每個類別的樣本都取出topK個，檢索的距離度量是向量內積。對于每個類別檢索出的向量，使用內積做softmax后進行加權融合，得到這個類別最終向量，拼接到當前樣本embedding后面輸入到模型中：

這部分檢索出來的樣本就是將需要記憶的知識直接引入到了當前樣本中，不再需要模型參數去記憶了。此外，這種將向量引入而不是引入對應的token，可以讓信息的擴展更方便，直接引入樣本的token會拉長輸入樣本長度，導致模型性能下降，且長度也有上限。

3 使用KNN指導模型訓練和預測

上面收的引入知識庫+KNN的方法，緩解了模型參數需要強記憶訓練樣本的問題。此外，文中還通過KNN檢索結果來指導模型的學習過程。KNN檢索的好處是不需要模型訓練，直接根據預訓練的表示計算距離，利用鄰居樣本的label，就能預測當前樣本的label。這對于模型來說是另一個維度的信息補充，文中通過區分難樣本指導訓練和在inference階段指導預測兩個方面進一步指導模型的訓練和預測。

KNN的檢索結果可以用來區分難樣本和簡單樣本。通過KNN檢索以及檢索鄰居的label，可以得到當前樣本各個類別的預測概率。這個KNN的預測結果可以作為是否是難樣本的參考，如果模型預測預測結果和KNN結果不一致，就是難樣本。對于難樣本，加大其學習權重，通過將KNN預測概率引入到交叉熵損失中實現：

另一方面，在預測階段，也直接將KNN的預測結果拿出來和模型對于[MASK]的預測結果做插值，得到最終的預測結果：

4 實驗結果

文中在9個NLU數據集的few-shot和zero-shot learning上對比了效果，可以看到本文提出的方法對于效果的提升還是非常明顯的。

此外，文中也對比了跨領域的效果，在source domain進行prompt learning，對比在target domain上的效果：

5 總結

檢索在NLP各類任務中的應用越來越多，本文也將檢索用于分離可記憶的信息來提升模型的泛化能力，并取得了顯著效果。檢索通過信息記憶+查詢的方式，引入了豐富的外部信息，能夠讓模型更多的容量服務于學習泛化性，而非簡單的記住訓練數據。

審核編輯：彭靜

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

數據

數據

+關注

關注
8

文章
7030

瀏覽量
89038
KNN

KNN

+關注

關注
0

文章
22

瀏覽量
10806
語言模型

語言模型

+關注

關注
0

文章
524

瀏覽量
10277

原文標題：不要讓模型死記硬背—用檢索增強Prompt Learning

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

學習STM32必備的知識庫

學習STM32必備的知識庫包括STM32F103C8T6寄存器手冊、STM32F103ZET6各IO口功能、STM32固件庫使用手冊(中文版)、stm32學習方法，參考手冊還有樣品申請

發表于 04-01 14:16

使用KNN進行分類和回歸

，這種學習器很少或根本不處理訓練數據。與線性回歸等積極學習的算法不同，KNN 不會估計在訓練階段

發表于 10-28 14:44

基于知識庫的智能策略翻譯技術

提出基于知識庫的策略翻譯方法，設計策略翻譯組成結構，分析策略知識及其表示形式，建立動態可擴展的策略知識庫，開發可擴展的策略編譯器和策略組裝器。實例測試表明，該

發表于 04-22 09:42 ?11次下載

一種基于解釋的知識庫綜合

從知識庫的解釋出發，對概念和概念間關系的解釋進行了分析，定義了知識庫系統的最小概念集合，設計了生成最小概念集合的方法，提出了基于解釋的知識庫綜合算法，討論了該

發表于 05-07 20:44 ?16次下載

領域知識庫的研究與設計

領域知識庫的構建有利于知識的檢索和共享。分析了領域知識庫應具備的條件，指出構建領域知識庫的有效方法

發表于 08-29 14:39 ?0次下載

NXP NFC知識庫

NXP NFC知識庫

發表于 12-30 17:32 ?49次下載

一種面向微生物領域的知識庫構建方法

一種面向微生物領域的知識庫構建方法_陳航

發表于 01-07 20:49 ?0次下載

本體知識庫的模塊與保守擴充

模塊化是軟件工程的一種方法，近年來被引入到本體領域，用以支持本體的重用和本體的整合。已有的工作沒有討論同時含有TBox和ABox的本體知識庫的模塊化的相關問題。在定義本體知識庫的模塊和

發表于 11-24 09:58 ?0次下載

虛擬儀器知識庫文件的結構組成和知識庫文件自動生成器的設計與應用

在前幾章中，重點介紹了VISA規范、儀器驅動程序規范及軟面板規范，這些構成了虛擬儀器及系統設計的關鍵部分。為了將VXI產品更有效地集成到虛擬儀器系統中去，VXI總線即插即用系統聯盟還定義了虛擬儀器知識庫文件的結構。本章介紹了虛擬儀器知識庫文件的結構組成，并重點介紹了

發表于 12-05 14:21 ?2次下載

如何使用Arduino KNN庫進行簡單的機器學習？

除了像TensorFlow for Arduino這樣強大的深度學習架構外，還有一些經典的ML方法適用于嵌入式設備上的較小數據集，這些方法有用且易于理解-最簡單的方法之一就是

發表于 04-01 10:07 ?3573次閱讀

復雜知識庫問答任務的典型挑戰和解決方案

基于語義解析（基于SP）的方法和基于信息檢索（基于IR）的方法。首先，我們形式化地定義了知識庫問答任務并介紹了該任務下

發表于 06-13 09:49 ?2424次閱讀

面向異質信息的網絡表示學習方法綜述

面向異質信息的網絡表示學習方法綜述

發表于 06-09 14:12 ?13次下載

如何基于亞馬遜云科技LLM相關工具打造知識庫

了解其核心組件、快速部署指南以及LangChain集成及其在電商的應用場景。通用場景：基于企業內部知識庫例如IT/HR信息的問答制造行業：裝備維保知識庫問答和售后客服金融行業：智能客服和智能報告生成教育行業：面向學生和面

發表于 11-23 17:53 ?1026次閱讀

無監督域自適應場景：基于檢索增強的情境學習實現知識遷移

本文對比了多種基線方法，包括無監督域自適應的傳統方法（如Pseudo-labeling和對抗訓練）、基于檢索的LM方法（如REALM和RAG

發表于 12-05 14:14 ?626次閱讀

如何手擼一個自有知識庫的RAG系統

用于自然語言處理任務，如文本生成、問答系統等。我們通過一下幾個步驟來完成一個基于京東云官網文檔的RAG系統數據收集建立知識庫 向量檢索提示詞與模型數據收集數據的收集再整個RAG實施過程中無疑是最耗人工的，涉及到收集、清洗、格式化、切分等過程。這里我們使用京東云

發表于 06-17 14:59 ?586次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

基于訓練階段使用知識庫+KNN檢索相關信息輔助學習方法

評論

學習STM32必備的知識庫

使用KNN進行分類和回歸

基于知識庫的智能策略翻譯技術

一種基于解釋的知識庫綜合

領域知識庫的研究與設計

NXP NFC知識庫

一種面向微生物領域的知識庫構建方法

本體知識庫的模塊與保守擴充

虛擬儀器知識庫文件的結構組成和知識庫文件自動生成器的設計與應用

如何使用Arduino KNN庫進行簡單的機器學習？

復雜知識庫問答任務的典型挑戰和解決方案

面向異質信息的網絡表示學習方法綜述

如何基于亞馬遜云科技LLM相關工具打造知識庫

無監督域自適應場景：基于檢索增強的情境學習實現知識遷移

如何手擼一個自有知識庫的RAG系統