基于用戶畫像,根據(jù)每個(gè)用戶使用路徑與個(gè)人偏好推薦內(nèi)容已經(jīng)成為內(nèi)容類產(chǎn)品常見的功能模式,也是提升活躍度與轉(zhuǎn)化率最有效的方式之一。
在之前的課程中,我們介紹了用戶畫像的定義、標(biāo)簽體系與創(chuàng)建過程,本期課程則重點(diǎn)介紹幾種不同的推薦模式與優(yōu)缺點(diǎn)。
常見的推薦邏輯
根據(jù)用戶信息進(jìn)行推薦,用戶進(jìn)入產(chǎn)品后需要完善個(gè)人信息及選擇興趣標(biāo)簽,系統(tǒng)根據(jù)用戶的個(gè)人信息(年齡、性別、地域)及所選興趣標(biāo)簽與內(nèi)容匹配,推薦內(nèi)容標(biāo)簽匹配度高的內(nèi)容。
這種推薦模式的優(yōu)點(diǎn)在于技術(shù)門檻低,由產(chǎn)品經(jīng)理自己設(shè)計(jì)一套推薦規(guī)則就可以實(shí)現(xiàn)。但缺點(diǎn)也很明顯,一方面用戶會(huì)不停收到相似的內(nèi)容,很難拓展新的關(guān)注點(diǎn),另一方面,內(nèi)容生產(chǎn)商會(huì)根據(jù)推薦機(jī)制針對(duì)性設(shè)置內(nèi)容的標(biāo)簽、關(guān)鍵字等信息,將低質(zhì)量的內(nèi)容推薦給用戶,造成用戶流失。
基于大數(shù)據(jù)的推薦模式
該模式的核心在于,通過建立較復(fù)雜用戶畫像模型,收集各種途徑收集用戶行為數(shù)據(jù)。根據(jù)用戶業(yè)務(wù)數(shù)據(jù)生成用戶畫像,計(jì)算用戶畫像相似度,對(duì)用戶畫像進(jìn)行分組。通過內(nèi)容標(biāo)簽與用戶畫像標(biāo)簽離線計(jì)算推薦內(nèi)容。
該推薦模式主要包含用戶畫像建模、用戶畫像聚類、內(nèi)容標(biāo)簽、內(nèi)容推薦四個(gè)階段。
用戶畫像建模
1、分析業(yè)務(wù)模型, 建立標(biāo)簽體系, 確定標(biāo)簽取值范圍
2、分析標(biāo)簽值的數(shù)據(jù)來(lái)源, 按需收集數(shù)據(jù), 計(jì)算標(biāo)簽值
3、存儲(chǔ)用戶畫像數(shù)據(jù), 并及時(shí)更更新
用戶畫像最終的結(jié)果是往往是?張表,每行為一個(gè)用戶的用戶畫像,存儲(chǔ)了用戶對(duì)應(yīng)的每個(gè)標(biāo)簽值。
例子:
用戶畫像聚類
選擇合適的聚類算法, 計(jì)算每個(gè)用戶畫像的相似度, 為用戶分組
常見的聚類算法:
層次化: 最近鄰方法, 最遠(yuǎn)鄰方法, 組內(nèi)聚類法, 組間聚類法, Ward聚類法, 正?進(jìn)制法, 粗聚類算法
劃分式: 圖論算法, K均值算法, 模糊C均值
基于密度和網(wǎng)格: GDILC 算法, SGC算法, GCHL算法, TFCTMO算法, ST-DBSCAN
其它: ACODF
該部分內(nèi)容由算法經(jīng)理主導(dǎo),作為產(chǎn)品經(jīng)理不用參與。
內(nèi)容標(biāo)簽
為了能把內(nèi)容推薦給用戶, 需要為每個(gè)內(nèi)容打上相應(yīng)的標(biāo)簽, 把內(nèi)容標(biāo)簽化。
與用戶畫像類似, 需要根據(jù)業(yè)務(wù)目標(biāo)來(lái)給內(nèi)容打標(biāo)簽。
內(nèi)容推薦
主要有三種推薦方法。
1、協(xié)同過濾推薦方法
基于用戶的協(xié)同過濾: 用戶A喜歡A內(nèi)容, 那么跟用戶A類似的用戶B也喜歡A內(nèi)容
基于內(nèi)容的協(xié)同過濾: 用戶A喜歡A內(nèi)容, 那么同樣喜歡A內(nèi)容的用戶B喜歡的內(nèi)容B?用戶A也喜歡。
優(yōu)勢(shì):
有效的使?用其它用戶的反饋信息, 提高準(zhǔn)確度
基于用戶相似推薦可以發(fā)現(xiàn)?用戶的潛在興趣, 增加推薦的多樣性
劣勢(shì):
用戶和物品存在冷啟動(dòng)問題, 新?用戶新內(nèi)容沒有行為數(shù)據(jù), 所以無(wú)法做出推薦,可解釋性不穩(wěn)定, 因?yàn)椴粚?duì)內(nèi)容做分析, 所以無(wú)法根據(jù)深層特征和修改來(lái)推薦。
相關(guān)算法:
關(guān)系矩陣及矩陣計(jì)算:用戶關(guān)系 U-U 矩陣、內(nèi)容關(guān)系 V-V 矩陣、用戶-內(nèi)容 U-V 矩陣
基于記憶的協(xié)同過濾算法
基于模型的協(xié)同過濾算法:基于隱因子模型的推薦算法、基于樸素貝葉斯分類的推薦算法。
2、基于內(nèi)容的推薦方法:
用戶喜歡內(nèi)容A , 那么跟內(nèi)容A 類似的內(nèi)容B 用戶也喜歡
優(yōu)勢(shì):
用戶間相互獨(dú)立獨(dú)立, 只依賴單人偏好
因?yàn)閮?nèi)容類似, 所以推薦的內(nèi)容直觀上很容易解釋
新內(nèi)容不存在冷啟動(dòng)問題, 因?yàn)橹灰獌?nèi)容相似就能被推薦
劣勢(shì):
對(duì)內(nèi)容標(biāo)簽要求高
不利于挖掘用戶的潛在興趣
存在新用戶冷啟動(dòng)問題
3、基于知識(shí)的推薦方法:
用大量的數(shù)據(jù), 訓(xùn)練專家模型, 用專家來(lái)對(duì)用戶偏好推薦
混合推薦方法: 根據(jù)業(yè)務(wù)場(chǎng)景, 將以上方法進(jìn)行混合, 優(yōu)化推薦結(jié)果。
并行:
加權(quán)式——對(duì)多個(gè)結(jié)果加權(quán)計(jì)算獲得最終結(jié)果
切換式——根據(jù)場(chǎng)景使用不同的方法
混雜——同時(shí)用以上兩種
串行:
層疊式——基于?個(gè)推薦結(jié)果再做?次推薦
級(jí)聯(lián)式——將?種推薦學(xué)習(xí)到的模型作為另?推薦的輸入
小結(jié)
基于大數(shù)據(jù)的推薦模式,可以有效實(shí)現(xiàn)"千人千面"的推薦模式,為用戶不斷輸送感興趣的內(nèi)容,并挖掘用戶潛在興趣點(diǎn)。
對(duì)于沒有使用的記錄的新用戶,則采用常規(guī)推薦模式,當(dāng)有了記錄后根據(jù)用戶行為進(jìn)行大數(shù)據(jù)推薦。
具體采用怎樣的推薦模式,則需要產(chǎn)品經(jīng)理根據(jù)產(chǎn)品特性結(jié)合企業(yè)的實(shí)際技術(shù)能力進(jìn)行選擇。
-
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8897瀏覽量
137530
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論