詳解深度學(xué)習(xí)在廣告推薦領(lǐng)域的作用
當(dāng)2012年Facebook在廣告領(lǐng)域開始應(yīng)用定制化受眾(Facebook Custom Audiences)功能后,“受眾發(fā)現(xiàn)”這個概念真正得到大規(guī)模應(yīng)用,什么叫“受眾發(fā)現(xiàn)”?如果你的企業(yè)已經(jīng)積累了一定的客戶,無論這些客戶是否關(guān)注你或者是否跟你在Facebook上有互動,都能通過Facebook的廣告系統(tǒng)觸達(dá)到。“受眾發(fā)現(xiàn)”實現(xiàn)了什么功能?在沒有這個系統(tǒng)之前,廣告投放一般情況都是用標(biāo)簽去區(qū)分用戶,再去給這部分用戶發(fā)送廣告,“受眾發(fā)現(xiàn)”讓你不用選擇這些標(biāo)簽,包括用戶基本信息、興趣等。你需要做的只是上傳一批你目前已有的用戶或者你感興趣的一批用戶,剩下的工作就等著Custom Audiences幫你完成了。
Facebook這種通過一群已有的用戶發(fā)現(xiàn)并擴展出其他用戶的推薦算法就叫Lookalike,當(dāng)然Facebook的算法細(xì)節(jié)筆者并不清楚,各個公司實現(xiàn)Lookalike也各有不同。這里也包括騰訊在微信端的廣告推薦上的應(yīng)用、Google在YouTube上推薦感興趣視頻等。下面讓我們結(jié)合前人的工作,實現(xiàn)自己的Lookalike算法,并嘗試著在新浪微博上應(yīng)用這一算法。
調(diào)研
首先要確定微博領(lǐng)域的數(shù)據(jù),關(guān)于微博的數(shù)據(jù)可以這樣分類:
用戶基礎(chǔ)數(shù)據(jù):年齡、性別、公司、郵箱、地點、公司等。
關(guān)系圖:根據(jù)人?人,人?微博的關(guān)注、評論、轉(zhuǎn)發(fā)信息建立關(guān)系圖。
內(nèi)容數(shù)據(jù):用戶的微博內(nèi)容,包含文字、圖片、視頻。
有了這些數(shù)據(jù)后,怎么做數(shù)據(jù)的整合分析?來看看現(xiàn)在應(yīng)用最廣的方式——協(xié)同過濾、或者叫關(guān)聯(lián)推薦。協(xié)同過濾主要是利用某興趣相投、擁有共同經(jīng)驗群體的喜好來推薦用戶可能感興趣的信息,協(xié)同過濾的發(fā)展有以下三個階段:
第一階段,基于用戶喜好做推薦,用戶A和用戶B相似,用戶B購買了物品a、b、c,用戶A只購買了物品a,那就將物品b、c推薦給用戶A。這就是基于用戶的協(xié)同過濾,其重點是如何找到相似的用戶。因為只有準(zhǔn)確的找到相似的用戶才能給出正確的推薦。而找到相似用戶的方法,一般是根據(jù)用戶的基本屬性貼標(biāo)簽分類,再高級點可以用上用戶的行為數(shù)據(jù)。
第二階段,某些商品光從用戶的屬性標(biāo)簽找不到聯(lián)系,而根據(jù)商品本身的內(nèi)容聯(lián)系倒是能發(fā)現(xiàn)很多有趣的推薦目標(biāo),它在某些場景中比基于相似用戶的推薦原則更加有效。比如在購書或者電影類網(wǎng)站上,當(dāng)你看一本書或電影時,推薦引擎會根據(jù)內(nèi)容給你推薦相關(guān)的書籍或電影。
第三階段,如果只把內(nèi)容推薦單獨應(yīng)用在社交網(wǎng)絡(luò)上,準(zhǔn)確率會比較低,因為社交網(wǎng)絡(luò)的關(guān)鍵特性還是社交關(guān)系。如何將社交關(guān)系與用戶屬性一起融入整個推薦系統(tǒng)就是關(guān)鍵。在神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)算法出現(xiàn)后,提取特征任務(wù)就變得可以依靠機器完成,人們只要把相應(yīng)的數(shù)據(jù)準(zhǔn)備好就可以了,其他數(shù)據(jù)都可以提取成向量形式,而社交關(guān)系作為一種圖結(jié)構(gòu),如何表示為深度學(xué)習(xí)可以接受的向量形式,而且這種結(jié)構(gòu)還需要有效還原原結(jié)構(gòu)中位置信息?這就需要一種可靠的向量化社交關(guān)系的表示方法。基于這一思路,在2016年的論文中出現(xiàn)了一個算法node2vec,使社交關(guān)系也可以很好地適應(yīng)神經(jīng)網(wǎng)絡(luò)。這意味著深度學(xué)習(xí)在推薦領(lǐng)域應(yīng)用的關(guān)鍵技術(shù)點已被解決。
在實現(xiàn)算法前我們主要參考了如下三篇論文:
Audience Expansion for Online Social Network Advertising 2016
node2vec: Scalable Feature Learning for Networks Aditya Grover 2016
Deep Neural Networks for YouTube Recommendations 2016
第一篇論文是LinkedIn給出的,主要談了針對在線社交網(wǎng)絡(luò)廣告平臺,如何根據(jù)已有的受眾特征做受眾群擴展。這涉及到如何定位目標(biāo)受眾和原始受眾的相似屬性。論文給出了兩種方法來擴展受眾:
1. 與營銷活動無關(guān)的受眾擴展;
2. 與營銷活動有關(guān)的受眾擴展。
圖1 LinkedIn的Lookalike算法流程圖
在圖1中,LinkedIn給出了如何利用營銷活動數(shù)據(jù)、目標(biāo)受眾基礎(chǔ)數(shù)據(jù)去預(yù)測目標(biāo)用戶行為進而發(fā)現(xiàn)新的用戶。今天的推薦系統(tǒng)或廣告系統(tǒng)越來越多地利用了多維度信息。如何將這些信息有效加以利用,這篇論文給出了一條路徑,而且在工程上這篇論文也論證得比較扎實,值得參考。
第二篇論文,主要講的是node2vec,這也是本文用到的主要算法之一。node2vec主要用于處理網(wǎng)絡(luò)結(jié)構(gòu)中的多分類和鏈路預(yù)測任務(wù),具體來說是對網(wǎng)絡(luò)中的節(jié)點和邊的特征向量表示方法。
簡單來說就是將原有社交網(wǎng)絡(luò)中的圖結(jié)構(gòu),表達(dá)成特征向量矩陣,每一個node(可以是人、物品、內(nèi)容等)表示成一個特征向量,用向量與向量之間的矩陣運算來得到相互的關(guān)系。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
詳解深度學(xué)習(xí)在廣告推薦領(lǐng)域的作用下載
相關(guān)電子資料下載
- 深度學(xué)習(xí)在工業(yè)缺陷檢測中的應(yīng)用 63
- 探討目前主流3D激光SLAM算法方案 94
- 華為成為中國首個PyTorch基金會Premier會員 453
- 《人工智能在指揮和控制系統(tǒng)中的決策支持》 133
- 中國手機廠商發(fā)力這一領(lǐng)域 外媒:大戲剛剛開始 262
- 百度智能云推出國內(nèi)首個大模型全鏈路生態(tài)支持體系 251
- 人工智能領(lǐng)域存在第一性原理嗎? 53
- 基于機器視覺檢測技術(shù)現(xiàn)狀 41
- 自動駕駛規(guī)控決策方面的建議與解決方案 40
- 里程碑 主線科技無人集卡在舟山港開啟全天候真無人常態(tài)化運營 166