在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

兩篇大廠CTR預估最新工作

深度學習自然語言處理 ? 來源:圓圓的算法筆記 ? 2023-03-03 11:17 ? 次閱讀

今天帶大家讀兩篇AAAI 2023關于CTR預估的兩篇工作。一篇是華為發表的Adaptive Low-Precision Training for Embeddings in Click-Through Rate Prediction,提出了一種CTR預估中embedding量化壓縮的方法;另一篇是美團發表的Decision-Making Context Interaction Network for Click-Through Rate Prediction,通過在CTR預估模型中引入顯示和隱式的上下文信息提升預估效果。

1華為:Embedding量化

4f76d3b8-b91e-11ed-bfe3-dac502259ad0.png

CTR預估中占用參數量最大的就是embedding table,尤其user、item等特征的embedding表,由于實體數量很大,導致這些特征的embedding表非常大,占用了非常巨大的存儲開銷。因此,對embedding table進行壓縮是一個值得研究的領域。

目前業內關于embedding table的壓縮主要有NAS-based embedding dimension search、Embedding pruning、Hashing三種方法。前兩者都需要額外的存儲和訓練步驟來確定最優的embedding維度和剪枝方法,而hashing方法由于沖突問題會嚴重影響壓縮后的模型效果。

針對前面方法的不足,華為提出了一種基于量化的端到端CTR模型訓練方法。量化方法是將模型高精度float參數映射到離散化的值上,模型結構保持不變,極大節省了存儲空間。之前的文章中介紹過量化相關的工作。

本文提出的量化基本的訓練框架如下圖中的b所示。以往的量化壓縮方法為圖a,需要保存全精度的參數,在前向傳播過程中對全精度參數量化,基于量化后的參數計算梯度,再更新到全精度參數上,節省了計算資源。而本文提出的b方法,直接在量化后的參數上進行更新,而不用保存全精度的參數,適合本文提出的embedding存儲壓縮的場景。先把量化參數還原成全精度參數,再在全精度參數行梯度反傳更新,最后將更新后的參數還原回量化參數,完成一輪訓練。

4f91eb26-b91e-11ed-bfe3-dac502259ad0.png

量化中存在兩個核心問題,一個是如何確定離散化兩個值之間的step size,另一個是使用什么方法把float映射到離散化值。

針對第一個問題,文中提出了一種Adaptive low-precision training的方法,自動學習step size。具體的算法邏輯如下表,核心是在訓練過程中有兩階段的優化,第一階段更新模型的參數,第二階段優化step size。

4fb76ff4-b91e-11ed-bfe3-dac502259ad0.png

針對第二個問題,業內主要有DR和SR兩種方式。DR直接根據四舍五入,確定性的將float離散化,而SR則是以一定概率隨機的將float離散化到距離最近的兩個整數之間。雖然之前的一些工作在實驗角度驗證了SR效果更好,但是沒有給出具體的理論證明。本文作者填補了這部分的空白,從理論上證明了SR的離散化方法具有更快的收斂性和更好的準確率,因此本文采用了SR的離散化方法。

在實驗階段,文中對比了不同壓縮方法的運行效率和效果,驗證了本文提出的方法的優越性:

4fd8d91e-b91e-11ed-bfe3-dac502259ad0.png

2美團:上下文建模

4ff48fc4-b91e-11ed-bfe3-dac502259ad0.png

這篇文章提出在CTR中引入顯示和隱式的上下文信息來提升CTR預估模型效果。

先說說顯示上下文信息。以往的CTR預估模型重點在于用戶歷史行為序列建模,而忽略了用戶歷史行為中的上下文信息。比如下圖左側的例子,是某個用戶某次歷史搜索的行為,點擊了藍色框中的漢堡。以往的行為建模模型中,直接將這個漢堡加入到歷史行為中,判斷和當前商品的匹配情況。而上下文指的是用戶歷史搜索中,除了藍色框以外紅色框的部分。這部分信息引入的好處是,能夠確定用戶歷史行為產生的原因。例如點擊紅色框的漢堡,是和藍色框其他漢堡在價格、款式等維度上進行對比后,用戶做出的決策。

再說隱式上下文信息,指的是上游的匹配、打分鏈路中,根據用戶個性化信息建模流入下游的候選商品。如果流入下游的候選商品漢堡較多,那么表明用戶可能更喜歡吃漢堡。將這部分信息引入進來,有利于提升用戶喜好的建模。

50164dda-b91e-11ed-bfe3-dac502259ad0.png

基于以上出發點,本文提出了考慮用戶顯示隱式上下文信息的ctr預估模型。對于顯示上下文,使用CIU模塊進行編碼,主要包括對上下文中不相關商品的過濾,以及利用上下文中相關商品信息增強用戶的興趣建模。對于隱式上下文信息,即前面模型送到ctr預估模型打分的候選item,也使用CIU模塊進行有效信息的提取。最后,顯示信息和隱式信息經過CIU的結果會經過一層AIAU進行融合,AIAU主要和MLP+self-attention的結構,用于融合經過顯示、隱式增強后的用戶興趣信息。

50494c6c-b91e-11ed-bfe3-dac502259ad0.png

本文提出的模型上線后,經過A/B test實驗,取得了CTR+2.9%/CPM+2.1%/GMV+1.5%的比較明顯的效果收益。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 高精度
    +關注

    關注

    1

    文章

    527

    瀏覽量

    25486
  • 模型
    +關注

    關注

    1

    文章

    3279

    瀏覽量

    48976
  • CTR
    CTR
    +關注

    關注

    0

    文章

    37

    瀏覽量

    14136

原文標題:AAAI'23 | 兩篇大廠CTR預估最新工作

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    CTR熱敏電阻

    CTR熱敏電阻   臨界溫度熱敏電阻CTR(CritiCal Temperature Resistor)具有負電阻突變特性,在某一溫度下,電阻值隨溫度的增加激劇減小,具有很大的負溫度系數.構成
    發表于 11-12 10:02 ?7221次閱讀

    光耦隔離電路的CTR參數設計

    光耦隔離電路的CTR參數設計
    的頭像 發表于 04-30 11:16 ?2.6w次閱讀
    光耦隔離電路的<b class='flag-5'>CTR</b>參數設計

    二極管(PN結)的工作原理

    前面已經寫了兩篇介紹放大器應用和MOSFET作驅動的文章。但是對它們的工作原理并沒有進一步研究一下,今天寫下這篇文章,主要是介紹二極管的工作原理,為后面的三極管和MOSFET工作原理的
    發表于 02-07 16:43 ?6927次閱讀
    二極管(PN結)的<b class='flag-5'>工作</b>原理

    光電耦合器的轉換效率即(CTR)

    輸入到LED的電流(IF)受室溫的影響。它隨工作時間(年齡)而改變因而,有交流電流輸入能力的光耦合器在輸入端有個LED(光發射二極管),所以每個LED都存在CTR值。如果具有相同正負電流值IF輸入
    發表于 07-02 15:05

    日本東京大學的兩篇關于無線充電的文章,需要的拿去,...

    日本東京大學的兩篇關于無線充電的文章
    發表于 03-08 15:08

    電子創新工作室招募活動

    物理與電子工程系舉辦電子創新工作室招募活動 為積極響應第三節大學生科技文化藝術節號召,努力提高我校大學生科技創新意識和能力,物理與電子工程系電子創新工作室于3月29、30日在東、西區餐廳門口舉辦招募
    發表于 05-12 14:09

    紅外遙控設計的兩篇文檔

    路紅外遙控器的,也想請大家關注一下。這兩篇文檔是我設計前期先閱讀的文檔,一仔細看了,一備用的,分享給大家。
    發表于 01-10 15:07

    盤點:日本被動元件大廠投資設廠的最新進展

    美元提升2成產能同年9月25日,全球MLCC龍頭廠村田制作所在官網發布公告,計劃在日本島根縣興建MLCC新工廠,預估投資額約400億日元,該座新廠將在2018年10月動工,預估2019年內完工,目標在
    發表于 10-10 16:13

    【技術雜談】備戰秋招:國內大廠技術面試指南,GitHub六千星

    最近,GitHub 上有一個項目很火,這個項目主要介紹了阿里、騰訊、百度、美團、今日頭條等國內互聯網大廠的面試題,還配備有答案和出題人分析等信息。這個項目或許對大家找工作面試有所幫助。項目
    發表于 07-23 09:52

    PCB設計資料大全,49干貨共1476頁,含各硬件大廠工程師使用資料

    `49PCB設計教程及規范文檔,共1476頁,有實操經驗、有知識點、有規范;資料完整、文檔豐富,攬括各大廠一線工程師們的設計心得、技巧,值得用心收藏學習。資料涵蓋知識面廣,內容詳實,有圖有文有案例。<span]需要的可自行下載。`
    發表于 04-26 10:24

    什么是轉換效率CTR

    什么是轉換效率CTR
    發表于 05-31 11:13 ?2976次閱讀
    什么是轉換效率<b class='flag-5'>CTR</b>?

    Python自然語言處理實戰:兩篇文章相似度清晰透明

    用訓練好的詞向量和段落向量對兩篇關于天津全運會的新聞進行向量化,并計算兩篇新聞的相似度~~
    的頭像 發表于 07-09 09:22 ?6060次閱讀

    深度強化學習給推薦系統以及CTR預估工業界帶來的最新進展

    所以,Google這兩篇強化學習應用于YouTube推薦論文的出現給大家帶來了比較振奮人心的希望。首先,論文中宣稱效果對比使用的Baseline就是YouTube推薦線上最新的深度學習模型;
    的頭像 發表于 07-18 11:11 ?8738次閱讀
    深度強化學習給推薦系統以及<b class='flag-5'>CTR</b><b class='flag-5'>預估</b>工業界帶來的最新進展

    什么是光耦的CTRCTR受那些因素影響?

    CTR表示電流傳輸比,當輸出電壓保持恒定時,它等于直流輸出電流IC與直流輸入電流IF的百分比。光耦的CTR的范圍大多為20%~300%甚至有的可達600%。
    發表于 09-20 09:39 ?2.2w次閱讀
    什么是光耦的<b class='flag-5'>CTR</b>?<b class='flag-5'>CTR</b>受那些因素影響?

    光耦合器的CTR是什么

    ,而If則是流向光耦合器二極管側的電流。通過這一公式,我們可以直觀地了解到光耦合器在不同工作狀態下的電流傳輸能力。 從物理層面來看,光耦合器的CTR反映了二極管側與晶體管側之間的電流傳輸關系。二極管側通過器件電流傳輸比鏈接到晶體管側,實現了電信號的隔離
    的頭像 發表于 09-19 10:58 ?1771次閱讀
    光耦合器的<b class='flag-5'>CTR</b>是什么
    主站蜘蛛池模板: 色涩在线观看| 夜夜嘿视频免费看| 天堂最新版中文网| 五月天欧美| 人人艹人人插| 国产精品夜夜春夜夜爽久久| a一级黄| 黄色网址在线播放| 热re99久久国产精品| 91福利视频免费| 天堂网址| 日本.www| 国产香港三级理论在线| 99国产精品农村一级毛片| 午夜免费啪在线观看视频网站| 特黄级| 欧美极品| 综合伊人| 日本天堂网在线观看| 久精品视频村上里沙| 99成人在线| 海外毛片| 日本aaaaa级片| 无遮挡高清一级毛片免费| 欧洲人体超大胆露私视频| 国产精品视频网站你懂得| 天天干夜夜噜| 1024你懂的日韩| 狠狠色噜噜狠狠狠狠98| 思思久久96热在精品不卡| 久久久免费精品视频| 在线色片| haodiaose在线精品免费观看| 色噜噜亚洲男人的天堂| 亚洲 欧美 另类 吹潮| 免费一级大毛片a一观看不卡| a网在线| 99干99| 亚洲欧美视频在线| 麻豆美女大尺度啪啪| 天天做天天爱天天一爽一毛片|