在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

解決長尾和冷啟動問題的基本方法

深度學習自然語言處理 ? 來源:圓圓的算法筆記 ? 作者:圓圓的算法筆記 ? 2022-09-05 14:25 ? 次閱讀

1什么是長尾問題

長尾問題一直是很多場景中最難優化的問題,特別是在推薦系統領域,長尾問題十分常見,卻很難優化。在推薦系統中,長尾問題指的是,某些實體在訓練數據中出現次數非常少,導致模型對這部分樣本打分效果很差。典型的場景包括,新用戶沒有幾條瀏覽行為,如何準確推薦用戶感興趣的內容;一些商品非常小眾,用戶反饋很少,如何對這些商品進行推薦等等。長尾在一個成熟的系統中往往服從二八定律,即20%的頭部實體貢獻了80%的數據,而剩余80%的實體只有20%的數據,實際場景中甚至比二八還要長尾。

長尾問題的難點主要體現在以下2點。首先,長尾實體的樣本量太少,模型很難學習這部分樣本的規律,例如用戶的embedding、商品的embedding等,都是需要大量數據學習的。其次,頭部樣本在數量上占絕對優勢,導致模型偏向擬合頭部樣本的規律,而尾部樣本的規律和頭部樣本可能有較大差異,導致模型在尾部樣本效果不好。

2如何解決長尾問題

那么,如何解決長尾問題呢?業內工作主要包括兩種核心優化方法。第一種方法是基于meta-learning解決長尾問題。剛才我們說到,長尾用戶或商品的數據量少,模型難學習,那么我們就讓模型具備在少量樣本上能學的比較好的能力就可以了。而meta-learning正是讓模型實現上述能力的方法。我在之前的文章Meta-learning核心思想及近年頂會3個優化方向中對meta-learning的核心思路進行了詳細介紹,感興趣的同學可以進一步深入閱讀。第二種方法是基于圖學習解決長尾問題。長尾部分的由于數據少無法學到良好的embedding,在圖學習中,可以利用豐富的鄰居節點信息對長尾實體的信息進行補充,進而學到更好的embedding。

下面,我們分別來看看基于meta-learning的方法和基于圖學習的方法解決長尾問題的典型工作。

3基于meta-learning的方法

基于meta-learning的長尾問題解決方法又可以分為兩種思路,一種是利用meta-learning生成長尾用戶或商品的良好embedding,另一種是利用meta-learning讓模型獲得在小樣本上的快速學習能力。這里分別介紹兩個思路的兩篇經典文章。

第一篇文章是Improving ctr predictions via learning to learn id embeddings(SIGIR 2019)。這篇文章主要場景是廣告的ctr預估,解決的問題是如何提升冷啟動廣告的預測效果。本文提出了基于meta-learning的冷啟動廣告embedding學習方法。首先將每個ad的ctr預測看成是meta-learning中一個獨立的任務。然后學習一個embedding生成器,生成器的輸入是廣告的特征,輸出embedding。整個過程利用meta-learning的思路進行學習,利用meta-learning中的support set和query set模擬一個冷啟動廣告生成embedding和使用embedding預測,進而優化embedding生成器。

b9d71712-2cd9-11ed-ba43-dac502259ad0.png

整個meta-learning的過程如下所示,在一個預訓練好的模型基礎上進行。隨機選擇一些廣告,生成兩個batch的數據。使用embedding生成器生成embedding后使用第一個batch計算loss,再利用這個loss更新一步生成器(內循環);然后使用更新后的生成器計算另一個batch上的loss(外循環),并更新最終參數

b9ee5b16-2cd9-11ed-ba43-dac502259ad0.png

第二篇文章是MeLU: meta-learned user preference estimator for cold-start recommendation(KDD 2019)。這篇文章主要也是借助了meta-learning讓模型具有快速學習能力,讓模型能夠在冷啟動樣本上,只看到少數幾個item就能進行快速的更新參數。

ba01e0aa-2cd9-11ed-ba43-dac502259ad0.png

這篇文章重點解決的是user側的冷啟動問題,對于一個user的數據分成support set和query set,在support set內循環后在queryset評估效果并進行全局更新。embedding層不使用meta-learning,只在全連接層進行meta-learning。

ba18ba14-2cd9-11ed-ba43-dac502259ad0.png

4基于圖學習的方法

基于圖的學習方法通過圖建立不同實體之間的關系,進而可以用其他實體的信息豐富長尾實體的信息,緩解由于長尾導致的樣本不充分無法學習良好表示的問題。

Learning Graph Meta Embeddings for Cold-Start Ads in Click-Through Rate Prediction(SIGIR 2021)利用圖學習解決新ad的embedding生成問題。對于新ad,使用屬性特征和圖學習生成一個合理的embedding。根據屬性重合度構造新ad的相似鄰居,并按照屬性的重合度排序,得到最相似的幾個ad。然后利用GAT進行new ad和其鄰居的信息融合,再用全連接生成新ad的向量表示,作為id embedding。這個過程相當于根據屬性找到與新ad最相似的舊ad,用舊ad的信息豐富新ad的embedding。在訓練方法上,先用舊ad訓練一個正常的ctr預估模型,然后固定ctr模型的參數,單獨訓練新ad表示生成部分的參數,利用meta-learning的方法更新模型參數。

ba3e8a78-2cd9-11ed-ba43-dac502259ad0.png

Graph Intention Network for Click-through Rate Prediction in Sponsored Search(SIGIR 2019)也是一篇比較有代表性的工作。CTR預估中經常需要對歷史行為建模提升效果(比如用戶歷史點擊過的商品),但是長尾用戶的歷史行為比較稀疏。因此這篇文章提出,利用點擊行為構造商品和商品之間的圖,利用這個圖補充歷史行為信息。通過商品-商品圖,可以挖掘出和當前商品高度相關的其他商品,這些商品雖然沒有直接的點擊行為,但由于和點擊過的商品高度相關,因此用戶點擊這些商品的概率可能也很高。通過這種基于圖擴展信息的方法,解決長尾用戶歷史行為稀疏的問題。

ba529e64-2cd9-11ed-ba43-dac502259ad0.png

5總結

本文為大家介紹了解決長尾和冷啟動問題的基本方法,主要包括meta-learning和圖學習兩個路線。Meta-learning更側重于讓模型具有在小樣本上快速學習的能力;而圖學習更側重于挖掘和長尾實體相關的鄰居,用鄰居信息補充長尾實體的信息。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7085

    瀏覽量

    89204
  • 模型
    +關注

    關注

    1

    文章

    3268

    瀏覽量

    48926
  • 生成器
    +關注

    關注

    7

    文章

    317

    瀏覽量

    21053

原文標題:長尾預測效果不好怎么辦?試試這兩種思路

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何降低半導體制造無塵車間設備振動問題的影響?

    要降低無塵車間設備振動問題的影響,需要從設備選型與安裝、振動監測與控制、車間環境管理等方面綜合采取措施,以下是具體方法
    的頭像 發表于 01-02 15:23 ?206次閱讀
    如何降低半導體制造無塵車間設備振<b class='flag-5'>動問</b>題的影響?

    USB驅動問題:設備無法識別的全面指南!

    今天我把USB驅動問題,關于設備無法識別方面做一個全面指南供大家參考。連接USB無法識別模組設備,是不是驅動問題?今天就一起來聊聊如何排查解決。
    的頭像 發表于 11-26 12:35 ?412次閱讀
    USB驅<b class='flag-5'>動問</b>題:設備無法識別的全面指南!

    增加電容器設備是否可以解決電壓波動問

    增加電容器設備通常 不能直接解決電壓波動問題 ,但它在特定情況下可能對改善電壓質量和穩定性產生間接影響。電壓波動一般與以下幾個因素有關: 一、電壓波動的常見原因: 1、負載波動 : 當負載變化較大
    的頭像 發表于 11-07 14:30 ?483次閱讀
    增加電容器設備是否可以解決電壓波<b class='flag-5'>動問</b>題

    AIC3254啟動過程是怎樣的?需要功能調節延時,請問怎么實現?

    AIC3254 啟動問題 :沒有IIS,時鐘是用MSP430產生的8M給AIC3254工作時鐘的,但是每次啟動要用手摸一下MCLK才能啟動,什么原因呢!大俠們能否說明一下AIC3254啟動
    發表于 11-07 07:28

    基于DPU的容器冷啟動加速解決方案

    (Serverless)計算方式,極大地簡化了開發人員的工作,使他們能夠專注于應用的構建與運行,而不再需要承擔服務器管理的負擔。 然而,FaaS模式也并非沒有缺陷,其中最為人詬病的便是“冷啟動”問題。所謂冷啟動,是指當請求被調度到某個函數實例時,如果該實例在上次執行完代碼
    的頭像 發表于 09-13 11:50 ?442次閱讀
    基于DPU的容器<b class='flag-5'>冷啟動</b>加速解決方案

    鼠籠式三相異步電動機啟動方法有什么啟動

    鼠籠式三相異步電動機是一種常見的電動機類型,廣泛應用于工業和民用領域。其啟動方法主要有以下幾種: 直接啟動:直接啟動是最簡單的啟動方式,將電
    的頭像 發表于 08-23 15:18 ?1085次閱讀

    如何選擇合適的電動機降壓啟動方法

    在選擇合適的電動機降壓啟動方法時,細致的考慮和分析至關重要。不同的啟動方法對電動機的性能、成本及系統的穩定性都有直接的影響。以下是如何根據特定的應用需求和條件,合理選擇降壓
    的頭像 發表于 08-19 11:32 ?527次閱讀

    bq05504冷啟動電壓600mV,在微弱光線下小型太陽能板達不到這么大怎么辦?

    bq05504管理芯片數據手冊顯示冷啟動電壓600mV,在微弱光線下小型太陽能板達不到這么大怎么辦,那就是啟動不了,那還怎么收集uW級~mW的電能?
    發表于 08-13 07:28

    大功率電機啟動方法

    在工業自動化和電力系統中,大功率電機作為核心驅動設備,其啟動方法的選擇對設備的運行穩定性、電網的安全性和經濟效益具有重要影響。本文旨在深入探討大功率電機的啟動方法,分析各種
    的頭像 發表于 06-28 18:08 ?2034次閱讀

    TC3x CAN20在冷啟動復位時出現MTU故障怎么解決?

    我們觀察到,由于 CAN20 在冷啟動復位時出現無法糾正的錯誤,MTU 出現故障。 出現此問題的原因是冷開機復位后 RAM 初始化不正常。 有什么具體方法可以初始化 RAM 嗎?
    發表于 05-29 08:30

    PMP31114.1-適合 3V 冷啟動的同步 SEPIC PCB layout 設計

    電子發燒友網站提供《PMP31114.1-適合 3V 冷啟動的同步 SEPIC PCB layout 設計.pdf》資料免費下載
    發表于 05-22 11:28 ?0次下載
    PMP31114.1-適合 3V <b class='flag-5'>冷啟動</b>的同步 SEPIC  PCB layout 設計

    PMP22063.1-具有熱/冷啟動功能的汽車儀表組和顯示電源 PCB layout 設計

    電子發燒友網站提供《PMP22063.1-具有熱/冷啟動功能的汽車儀表組和顯示電源 PCB layout 設計.pdf》資料免費下載
    發表于 05-14 14:53 ?0次下載
    PMP22063.1-具有熱/<b class='flag-5'>冷啟動</b>功能的汽車儀表組和顯示電源 PCB layout 設計

    設置應用冷啟動優化案例

    整個轉場過程不突兀。 應用啟動概念 對于應用啟動,首先,引入應用啟動概念: 冷啟動:首次打開app或者app徹底銷毀后再次打開app。 熱啟動
    發表于 04-22 16:31

    STM32Cubeide的啟動報錯是哪里的問題?

    STMCubeide的啟動問題,java環境32位64位都測試過,還是這個問題
    發表于 04-03 06:00

    在MCAL中禁用了ALM8 [10] 和 ALM8 [17],為什么SMU AG8在冷啟動時仍會報告錯誤?

    如圖所示,我在 MCAL 中禁用了 ALM8 [10] 和 ALM8 [17],但是 SMU AG8 在冷啟動時仍會報告這兩個錯誤,而 WDG 工作正常。 但是,如果我使用調試器重置程序,則不會報告這些警報。 我能有一些建議嗎? 謝謝。
    發表于 01-18 10:32
    主站蜘蛛池模板: 夜夜狠操| 四虎一区二区三区精品| 午夜日韩精品| 丁香婷婷激情五月| 欧美午夜网站| 综合色综合| 国内a级毛片免费···| 四虎永久在线视频| 国内一区二区| ccav在线永久免费看| 国产乱子伦| 天天玩夜夜操| 99国产国人青青视频在线观看| 黄色a毛片| 男人的天堂免费视频| 日韩一级高清| 四虎国产精品高清在线观看| 色视频在线观看免费| 五月婷婷中文字幕| 日韩三级久久| 国产三级a三级三级天天| 免费视频久久看| 女人双腿搬开让男人桶| 国产乱理论片在线观看理论| 天天爽夜夜爽精品视频一| 狠狠干福利视频| 国产午夜精品理论片免费观看| 全部免费特黄特色大片视频| 天天骑夜夜操| 天天se天天cao综合网蜜芽| 天天射干| 欧美性三级| 一区二区三区网站在线免费线观看| 男人性天堂| 性夜影院爽黄a爽在线看香蕉| 久久狠狠躁免费观看| 久插视频| 亚洲视频四区| 9久久99久久久精品齐齐综合色圆| 色吧在线视频在线观看| 久久精品人人爽人人爽快|