00
引言
前段時(shí)間上了一個(gè)用戶畫像的課程,授課老師是《用戶畫像:方法論與工程化解決方案》的作者趙宏田老師;另外也研讀了一些講述用戶畫像的文章。
基于對上述學(xué)習(xí)內(nèi)容的理解,同時(shí)結(jié)合工作實(shí)踐,通過本文和大家分享下有關(guān)用戶畫像的認(rèn)知、建設(shè)方法、產(chǎn)品化和應(yīng)用。
01
初識(shí)用戶畫像
1.1 用戶畫像
隨著用戶的一切行為數(shù)據(jù)可以被企業(yè)追蹤到,企業(yè)的關(guān)注點(diǎn)日益聚焦在如何利用大數(shù)據(jù)為經(jīng)營分析和精準(zhǔn)營銷服務(wù),而要做精細(xì)化運(yùn)營,首先要建立本企業(yè)的用戶畫像。
提到用戶畫像的概念,我們區(qū)分下用戶角色(Persona)和用戶畫像(Profile):
1.1.1 用戶角色(Persona)
用戶角色本質(zhì)是一個(gè)用以溝通的工具,當(dāng)我們討論產(chǎn)品、需求、場景、用戶體驗(yàn)的時(shí)候,為了避免在目標(biāo)用戶理解上的分歧,用戶角色應(yīng)運(yùn)而生。用戶角色建立在對真實(shí)用戶深刻理解,及高精準(zhǔn)相關(guān)數(shù)據(jù)的概括之上,虛構(gòu)的包含典型用戶特征的人物形象。如下是一個(gè)典型的用戶角色:
1.1.2 用戶畫像(Profile)
用戶畫像更多被運(yùn)營和數(shù)據(jù)分析師使用,精準(zhǔn)營銷、經(jīng)營分析、個(gè)性化推薦都是基于用戶畫像的應(yīng)用。用戶畫像是各類描述用戶數(shù)據(jù)的變量集合,能夠準(zhǔn)確描述任何一個(gè)真實(shí)用戶。如下是一個(gè)簡化的用戶畫像:
{ "ID": 123456,
"姓名": "張建國",
"性別": "男",
"出生年月": 631123200,
"籍貫": "北京",
"居住地": "北京",
"教育背景":
{ "學(xué)校":"北京大學(xué)",
"專業(yè)": "CS",
"入學(xué)年月":1220198400
}
}
1.2 用戶標(biāo)簽和用戶畫像
1.2.1 用戶標(biāo)簽
用戶標(biāo)簽,即對用戶某個(gè)維度屬性的描述,具有相互獨(dú)立、可枚舉窮盡的特點(diǎn)。采集業(yè)務(wù)、日志、埋點(diǎn)等數(shù)據(jù)后,經(jīng)過不同統(tǒng)計(jì)方式計(jì)算出用戶屬性、用戶行為、用戶消費(fèi)、風(fēng)險(xiǎn)控制、社交等維度標(biāo)簽。例如:性別、年齡、近30日訪問次數(shù)、購買水平、經(jīng)常活躍時(shí)間段等。有關(guān)用戶標(biāo)簽體系建設(shè)的詳細(xì)描述,見「2 建設(shè)標(biāo)簽和標(biāo)簽體系」章節(jié)。
1.2.2 用戶畫像
構(gòu)建用戶畫像,就是給用戶打上各種維度的標(biāo)簽。從業(yè)務(wù)價(jià)值來說,標(biāo)簽和畫像是類似中間層的系統(tǒng)模塊,為數(shù)據(jù)驅(qū)動(dòng)運(yùn)營奠定了基礎(chǔ),可以幫助大數(shù)據(jù)“走出”數(shù)據(jù)倉庫,針對用戶進(jìn)行個(gè)性化推薦、精準(zhǔn)營銷等多樣化服務(wù)。有關(guān)用戶畫像系統(tǒng)、落地應(yīng)用的詳細(xì)描述,見「3 用戶畫像產(chǎn)品化」「4 用戶畫像應(yīng)用」「5 用戶畫像實(shí)踐案例」章節(jié)。
1.3 用戶群組和用戶標(biāo)簽
用戶標(biāo)簽和用戶群組是兩個(gè)容易混淆、具有迷惑的概念,下面嘗試區(qū)分:
1.3.1 用戶群組
需要用戶屬性和行為組合,才能圈選出全面的目標(biāo)群體。只有行為數(shù)據(jù),只能看到這個(gè)人做過什么事,但這個(gè)人是男是女、年齡多大、注冊多久 、購買能力如何等信息都不知道,這樣圈選出的用戶群是有缺陷的,一般不會(huì)直接應(yīng)用于精準(zhǔn)營銷場景。
1.3.2 用戶標(biāo)簽
建立用戶標(biāo)簽,不用非要組合用戶屬性和行為事件,單用用戶屬性可以,單用行為事件也可以。基于用戶屬性、行為事件計(jì)算出的用戶標(biāo)簽,本質(zhì)也是用戶屬性,或者說用戶屬性本身就是標(biāo)簽。
1.3.3 群組是標(biāo)簽的一種應(yīng)用方式
標(biāo)簽作為一個(gè)中間層系統(tǒng)模塊,在精準(zhǔn)營銷場景,往往不會(huì)只使用一個(gè)標(biāo)簽進(jìn)行推送,更多情況下需要組合多個(gè)標(biāo)簽來滿足業(yè)務(wù)上對人群的定義,見下圖:
這里通過一個(gè)場景來介紹基于用戶標(biāo)簽圈選用戶群組的應(yīng)用。某女裝大促活動(dòng)期間,渠道運(yùn)營人員需要篩選出平臺(tái)上的優(yōu)質(zhì)用戶,并通過短信、郵件、Push等渠道進(jìn)行營銷。
第1步:通過圈選“瀏覽”“收藏”“加購”“購買”“搜索”與該女裝相關(guān)品類的標(biāo)簽來篩選出可能對該女裝感興趣的潛在用戶
第2步:組合其他標(biāo)簽(如“性別”“消費(fèi)金額”“活躍度”等)篩選出對應(yīng)的高質(zhì)量用戶群,推送到對應(yīng)渠道。
因此,將用戶屬性、行為事件數(shù)據(jù)抽象成標(biāo)簽后,可通過組合標(biāo)簽方式找到目標(biāo)潛在用戶人群。從這個(gè)角度理解,用戶群組是用戶標(biāo)簽應(yīng)用的一種方式。
02
建設(shè)標(biāo)簽和標(biāo)簽體系
2.1 標(biāo)簽的分類
標(biāo)簽本身會(huì)有很多分類方式,但從標(biāo)簽的實(shí)現(xiàn)規(guī)則來看,大致可以分為以下3種類型:① 統(tǒng)計(jì)類標(biāo)簽、② 規(guī)則類標(biāo)簽、③ 機(jī)器學(xué)習(xí)挖掘類標(biāo)簽。
2.1.1 統(tǒng)計(jì)類標(biāo)簽
這類標(biāo)簽是最為基礎(chǔ)也最為常見的標(biāo)簽類型,例如,對于某個(gè)用戶來說,其性別、年齡、城市、星座、近7日活躍時(shí)長、近7日活躍天數(shù)、近7日活躍次數(shù)等字段可以從用戶注冊數(shù)據(jù)、用戶訪問、消費(fèi)數(shù)據(jù)中統(tǒng)計(jì)得出。該類標(biāo)簽構(gòu)成了用戶畫像的基礎(chǔ)。
2.1.2 規(guī)則類標(biāo)簽
該類標(biāo)簽基于用戶行為、用戶屬性和確定的規(guī)則產(chǎn)生。例如,對平臺(tái)上“消費(fèi)活躍”用戶這一口徑的定義為“近30天交易次數(shù)≥2”。在實(shí)際開發(fā)畫像的過程中,由于運(yùn)營人員對業(yè)務(wù)更為熟悉,而數(shù)據(jù)人員對數(shù)據(jù)的結(jié)構(gòu)、分布、特征更為熟悉,因此規(guī)則類標(biāo)簽的規(guī)則由運(yùn)營人員和數(shù)據(jù)人員共同協(xié)商確定。
2.1.3 機(jī)器學(xué)習(xí)挖掘類標(biāo)簽
該類標(biāo)簽通過機(jī)器學(xué)習(xí)挖掘產(chǎn)生,用于對用戶的某些屬性或某些行為進(jìn)行預(yù)測判斷。例如,根據(jù)一個(gè)用戶的行為習(xí)慣判斷該用戶是男性還是女性、根據(jù)一個(gè)用戶的消費(fèi)習(xí)慣判斷其對某商品的偏好程度。該類標(biāo)簽需要通過算法挖掘產(chǎn)生。
在項(xiàng)目工程實(shí)踐中,一般統(tǒng)計(jì)類和規(guī)則類的標(biāo)簽即可以滿足應(yīng)用需求,在開發(fā)中占有較大比例。機(jī)器學(xué)習(xí)挖掘類標(biāo)簽多用于預(yù)測場景,如判斷用戶性別、用戶購買商品偏好、用戶流失意向等。一般地,機(jī)器學(xué)習(xí)標(biāo)簽開發(fā)周期較長,開發(fā)成本較高,因此其開發(fā)所占比例較小。
事實(shí)上,最終標(biāo)簽體系中是以用戶視角定義的,需要結(jié)合具體的業(yè)務(wù)。比如某電商業(yè)務(wù)標(biāo)簽分類,用戶屬性維度標(biāo)簽、用戶行為維度標(biāo)簽、用戶消費(fèi)維度標(biāo)簽、風(fēng)險(xiǎn)控制維度標(biāo)簽、社交屬性維度標(biāo)簽。
2.2 標(biāo)簽建設(shè)流程
下圖是一個(gè)標(biāo)簽建設(shè)流程,會(huì)側(cè)重產(chǎn)品經(jīng)理視角,主要描述需求的分析過程和產(chǎn)出文檔,同時(shí)對標(biāo)簽的開發(fā)原理進(jìn)行簡單總結(jié)。
2.2.1 需求收集與分析
在需求收集與分析環(huán)節(jié),可以按還原業(yè)務(wù)流程——明確商業(yè)目的——從策略推標(biāo)簽——匯聚標(biāo)簽的步驟開展。
某服裝零售商,通過布局線上商城和線下實(shí)體店來擴(kuò)大經(jīng)營。線上的話,主要是通過微信公眾號(hào)引流到小程序,然后在小程序完成交易。下面通過該服裝零售案例,具體描述下,如何進(jìn)行標(biāo)簽需求的收集與分析:
1、識(shí)別分析業(yè)務(wù)流程和業(yè)務(wù)場景觸點(diǎn)
用戶畫像是基于業(yè)務(wù)的,因此,構(gòu)建標(biāo)簽的第一個(gè)步驟就是識(shí)別與分析用戶的決策流程和業(yè)務(wù)場景,以便快速熟悉業(yè)務(wù)。參考下方案例業(yè)務(wù)流程的還原:
首先是通過各種場景被吸引來的微信用戶關(guān)注公眾號(hào)成為了粉絲,然后公眾號(hào)運(yùn)營人員會(huì)給微信粉絲推送圖文消息進(jìn)行粉絲運(yùn)營,同時(shí)把粉絲引流到小程序商城,公眾號(hào)粉絲最終會(huì)在小程序商城成交轉(zhuǎn)化。在整個(gè)過程中,公眾號(hào)運(yùn)營人員會(huì)持續(xù)進(jìn)行微信粉絲的維護(hù)和流失粉絲的挽回等運(yùn)營工作。
此處推薦:
《有效需求分析》中詳細(xì)需求篇業(yè)務(wù)功能支持主線需求分析方法
2、明確每個(gè)業(yè)務(wù)場景觸點(diǎn)的商業(yè)目的
這一步基于之前對業(yè)務(wù)流程的梳理,洞察業(yè)務(wù)問題,明確想要達(dá)到什么商業(yè)目的,并對商業(yè)目的進(jìn)行拆分。參考下方案例從明確整體商業(yè)目標(biāo),到商業(yè)目標(biāo)拆解和量化的過程:
O:假設(shè)該服裝零售商線上的布局已經(jīng)比較完善,現(xiàn)階段的首要商業(yè)目的就是提升銷售金額,因此“提升銷售金額”就是該零售電商的北極星指標(biāo),那么提升流量、提升轉(zhuǎn)化率、提升客單價(jià)、提升復(fù)購率就是拆解后的核心指標(biāo)。
S:此處假設(shè)想要提升進(jìn)入小程序商城的流量,可以采取的策略也很多。比如,通過掃碼關(guān)注后推送優(yōu)惠券方式吸引更多的微信用戶關(guān)注成為粉絲;再比如,產(chǎn)出更高質(zhì)量微信圖文,更好的運(yùn)營微信私域流量。
M:緊接上一步,針對推送優(yōu)惠券吸引用戶關(guān)注公眾號(hào)這個(gè)策略,我們可以重點(diǎn)關(guān)注通過掃碼方式關(guān)注公眾號(hào)比率、取關(guān)的比率,新舊粉絲的比率。
此處推薦:
OSM模型(Objective、Strategy、Measurement)
銷售公式=流量*轉(zhuǎn)化率*客單價(jià)*復(fù)購率
3、從商業(yè)目的導(dǎo)向運(yùn)營策略設(shè)計(jì)及用戶標(biāo)簽需求
針對不同商業(yè)目的,對標(biāo)簽體系的建設(shè)也是不一樣的,因此要從運(yùn)營策略推導(dǎo)出標(biāo)簽。比如業(yè)務(wù)部門要做個(gè)性化推薦,做關(guān)于物或者人的興趣、偏好的標(biāo)簽會(huì)比較有價(jià)值;但是如果要做精細(xì)化運(yùn)營,關(guān)于用戶的留存、活躍標(biāo)簽會(huì)更有價(jià)值。參考下方用戶標(biāo)簽選用的案例:
把提升掃碼方式關(guān)注率作為量化的目標(biāo),選用的運(yùn)營策略是通過推送優(yōu)惠券方式吸引微信用戶掃碼,新粉絲掃碼關(guān)注后推送100元優(yōu)惠券,老粉絲掃碼后推送50元優(yōu)惠券,那么執(zhí)行運(yùn)營策略過程中需要用到“是否新粉絲”這個(gè)標(biāo)簽。
在此階段,可以準(zhǔn)備一個(gè)簡單的記錄溝通內(nèi)容的Excel模板,列表頭包括標(biāo)簽名、標(biāo)簽規(guī)則、使用場景等,和業(yè)務(wù)方一起把溝通內(nèi)容記錄下來。
4、組織標(biāo)簽
關(guān)于組織標(biāo)簽,需要基于對業(yè)務(wù)和策略的理解,以用戶視角進(jìn)行分類管理。下面是一個(gè)參考框架:
(1)用戶屬性類標(biāo)簽:性別、年齡、省份、城市、注冊日期、手機(jī)號(hào)碼等
(2)用戶行為類標(biāo)簽:近30日訪問次數(shù)、近30日客單價(jià)、近30日活躍天數(shù)、近30日訪問時(shí)長、平均訪問深度等
(3)用戶消費(fèi)類標(biāo)簽:收入狀況、購買力水平、已購商品、購買渠道偏好、最后購買時(shí)間、購買頻次等
(4)商品品類類標(biāo)簽:高跟鞋、靴子、襯衫、法式連衣裙、牛仔褲等
(5)社交屬性類標(biāo)簽:經(jīng)常活躍的時(shí)間段、活躍地點(diǎn)、單身、評價(jià)次數(shù)、好評度等
2.2.2 產(chǎn)出標(biāo)簽需求文檔
經(jīng)過前面的需求收集與分析,已明確了業(yè)務(wù)方的標(biāo)簽需求。為了順利交付研發(fā),接下來還需要:撰寫標(biāo)簽體系文檔——根據(jù)標(biāo)簽規(guī)則確定埋點(diǎn)——撰寫數(shù)據(jù)需求文檔。
1、撰寫標(biāo)簽體系文檔
在此環(huán)節(jié),數(shù)據(jù)產(chǎn)品經(jīng)理需要根據(jù)前期和業(yè)務(wù)方的溝通內(nèi)容,產(chǎn)出具體的標(biāo)簽體系文檔:
(1)標(biāo)簽ID:例如, ATTRITUBE_U_01_001, 其中“ATTRITUBE”為人口屬性主題,“_”后面的”U”為userid維度,“_”后面“01”為一級歸類,最后面的“001”為該一級標(biāo)簽下的標(biāo)簽明細(xì)
(2)標(biāo)簽名稱:英文格式名稱,例如,famale
(3)標(biāo)簽漢語:女
(4)標(biāo)簽主題:描述標(biāo)簽所屬的主題,例如,用戶屬性維度標(biāo)簽、用戶行為維度標(biāo)簽、用戶消費(fèi)維度標(biāo)簽
(5)標(biāo)簽層級ID:標(biāo)簽所屬的層級,一般會(huì)分為2級
(6)名稱:與ID對應(yīng)的名稱
(7)標(biāo)簽類型:統(tǒng)計(jì)類標(biāo)簽、規(guī)則類標(biāo)簽、機(jī)器學(xué)習(xí)算法類標(biāo)簽
(8)更新頻率:實(shí)時(shí)更新、離線T+1更新、單次計(jì)算
(9)標(biāo)簽算法規(guī)則:
需要描述選擇哪張數(shù)據(jù)表中的具體哪個(gè)字段,若需要多張表做關(guān)聯(lián),還需要說明通過什么字段進(jìn)行join
具體的算法邏輯和統(tǒng)計(jì)周期,比如“近7天支付次數(shù)”,就是需要統(tǒng)計(jì)近7天支付的總次數(shù)。
(10)使用場景描述
(11)排期
(12)開發(fā)人
(13)需求方
(14)優(yōu)先級
2、根據(jù)標(biāo)簽規(guī)則確定埋點(diǎn)
前面已經(jīng)明確了標(biāo)簽的算法規(guī)則,接下來要進(jìn)一步確定應(yīng)該埋哪些點(diǎn)來采集所需的數(shù)據(jù),下面是一個(gè)具體案例:
針對“購買商品品類偏好”這個(gè)標(biāo)簽,會(huì)用到點(diǎn)擊下單按鈕事件數(shù)據(jù),以及商品名稱、商品分類等事件屬性數(shù)據(jù),那么就需要對點(diǎn)擊下單按鈕事件進(jìn)行埋點(diǎn)。
3、撰寫數(shù)據(jù)需求文檔
埋點(diǎn)取哪些數(shù)據(jù)已經(jīng)確定了,就需要產(chǎn)出具體的數(shù)據(jù)需求文檔,交付負(fù)責(zé)埋點(diǎn)的開發(fā)同事進(jìn)行埋點(diǎn)取數(shù)了。在數(shù)據(jù)需求文檔,應(yīng)該明確以下內(nèi)容:
(1)埋點(diǎn)名:click_order
(2)埋點(diǎn)顯示名:點(diǎn)擊下單按鈕
(3)上報(bào)時(shí)機(jī):根據(jù)實(shí)際情況,選擇是何時(shí)進(jìn)行上報(bào)。比如對于點(diǎn)擊下單事件,可以選擇點(diǎn)擊了下單按鈕時(shí)就進(jìn)行上報(bào)
(4)埋點(diǎn)形式:根據(jù)實(shí)際情況,選擇是客戶端埋點(diǎn),還是服務(wù)端埋點(diǎn)。比如“購買商品品類偏好”標(biāo)簽的下單按鈕點(diǎn)擊事件,因?yàn)橹皇窍肱袛嘤脩魧徺I商品的偏好,用戶點(diǎn)擊按鈕后已經(jīng)能說明是否有偏好了,不需要等服務(wù)端返回是否成功的提醒,因此適合采用客戶端埋點(diǎn)形式
(5)屬性名:事件屬性的名稱,比如點(diǎn)擊下單按鈕事件的商品名稱屬性
(6)屬性值:比如襯衫
(7)備注
實(shí)際工作中,撰寫標(biāo)簽體系文檔、根據(jù)標(biāo)簽規(guī)則確定埋點(diǎn)、撰寫數(shù)據(jù)需求文檔,會(huì)是一個(gè)互相完善補(bǔ)充的過程。
2.2.3 標(biāo)簽的開發(fā)
在整個(gè)工程化方案中,系統(tǒng)依賴的基礎(chǔ)設(shè)施包括Spark、Hive、HBase、Airflow、MySQL、Redis、Elasticsearch。除去基礎(chǔ)設(shè)施外,系統(tǒng)主體還包括ETL作業(yè)、用戶畫像主題建模、標(biāo)簽結(jié)果數(shù)據(jù)在應(yīng)用端的存儲(chǔ)3個(gè)重要組成部分。如圖所示是用戶畫像數(shù)倉架構(gòu)圖,下面對其進(jìn)行簡單介紹。
1、Hive數(shù)據(jù)倉庫ETL作業(yè)
下方虛線框中為常見的數(shù)據(jù)倉庫ETL加工流程,也就是將每日的業(yè)務(wù)數(shù)據(jù)、日志數(shù)據(jù)、埋點(diǎn)數(shù)據(jù)等經(jīng)過ETL過程,加工到數(shù)據(jù)倉庫對應(yīng)的ODS層、DW層、DM層中。
2、Hive數(shù)據(jù)倉庫用戶畫像主題建模
中間的虛線框即為用戶畫像建模的主要環(huán)節(jié),會(huì)對基于數(shù)據(jù)倉庫ODS層、DW層、DM層中與用戶相關(guān)數(shù)據(jù)進(jìn)行二次建模加工。
3、標(biāo)簽結(jié)果數(shù)據(jù)在應(yīng)用端的存儲(chǔ)
在用戶畫像主題建模過程中,會(huì)將用戶標(biāo)簽計(jì)算結(jié)果寫入Hive,由于不同數(shù)據(jù)庫有不同的應(yīng)用場景,下面分別進(jìn)行描述:
(1)MySQL
作為關(guān)系型數(shù)據(jù)庫,在用戶畫像中可用于元數(shù)據(jù)管理、監(jiān)控預(yù)警數(shù)據(jù)、結(jié)果集存儲(chǔ)等應(yīng)用中。下面詳細(xì)介紹這3個(gè)應(yīng)用場景:
元數(shù)據(jù)管理:
MySQL具有更快的讀寫速度,平臺(tái)標(biāo)簽視圖中(Web端產(chǎn)品)的標(biāo)簽元數(shù)據(jù)可以維護(hù)在MySQL關(guān)系數(shù)據(jù)庫中,便于標(biāo)簽的編輯、查詢和管理。
監(jiān)控預(yù)警數(shù)據(jù):
在對畫像的數(shù)據(jù)監(jiān)控中,調(diào)度流每跑完相應(yīng)的模塊,就將該模塊的監(jiān)控?cái)?shù)據(jù)插入MySQL中,當(dāng)校驗(yàn)任務(wù)判斷達(dá)到觸發(fā)告警閾值時(shí),就觸發(fā)告警。
結(jié)果集存儲(chǔ):
存儲(chǔ)多維透視分析用的標(biāo)簽、圈人服務(wù)用的用戶標(biāo)簽、當(dāng)日記錄各標(biāo)簽數(shù)量等。
(2)HBase
與Hive不同的是,HBase能夠在數(shù)據(jù)庫上實(shí)時(shí)運(yùn)行,而不是跑MapReduce任務(wù),適合進(jìn)行大數(shù)據(jù)的實(shí)時(shí)查詢。下面通過一個(gè)案例來介紹HBase在畫像系統(tǒng)中的應(yīng)用場景和工程化實(shí)現(xiàn)方式:
某渠道運(yùn)營人員為促進(jìn)未注冊的新安裝用戶注冊、下單,計(jì)劃通過App首頁彈窗發(fā)放紅包或優(yōu)惠券的方式進(jìn)行引導(dǎo)。每天畫像系統(tǒng)的ETL調(diào)度完成后對應(yīng)人群數(shù)據(jù)就被推送到廣告系統(tǒng)(HBase數(shù)據(jù)庫進(jìn)行存儲(chǔ))。滿足條件的新用戶來訪App時(shí),由在線接口讀取HBase數(shù)據(jù)庫,在查詢到該用戶時(shí)為其推送該彈窗。
(3)Elasticsearch
是一個(gè)開源的分布式全文檢索引擎,可以近乎實(shí)時(shí)地存儲(chǔ)、檢索數(shù)據(jù)。對于用戶標(biāo)簽查詢、用戶人群計(jì)算、用戶群多維透視分析這類對響應(yīng)時(shí)間要求較高的場景,也可以考慮選用Elasticsearch進(jìn)行存儲(chǔ)。
2.2.4 標(biāo)簽發(fā)布與效果追蹤
通過開發(fā)測試,上線后需要持續(xù)追蹤標(biāo)簽應(yīng)用效果及業(yè)務(wù)方反饋,調(diào)整優(yōu)化模型及相關(guān)權(quán)重配置。
03
用戶畫像產(chǎn)品化
從業(yè)務(wù)價(jià)值來說,標(biāo)簽和畫像類似一個(gè)為前臺(tái)服務(wù)提供數(shù)據(jù)支持的中間層系統(tǒng)模塊。開發(fā)完畫像標(biāo)簽數(shù)據(jù),如果只是“躺在”數(shù)據(jù)倉庫中,并不能發(fā)揮更大的業(yè)務(wù)價(jià)值。只有將畫像數(shù)據(jù)產(chǎn)品化后才能以標(biāo)準(zhǔn)方式提升數(shù)據(jù)處理鏈路上各個(gè)環(huán)節(jié)的效率,同時(shí)也更便于業(yè)務(wù)方使用。下面分別從產(chǎn)品化后涵蓋的標(biāo)簽生產(chǎn)架構(gòu)和功能模塊兩個(gè)角度進(jìn)行總結(jié):
3.1 用戶畫像產(chǎn)品系統(tǒng)架構(gòu)
下圖是一個(gè)用戶畫像產(chǎn)品系統(tǒng)的結(jié)構(gòu)圖,數(shù)據(jù)是從左到右的,主要包括數(shù)據(jù)采集、數(shù)據(jù)接入、數(shù)據(jù)整合/標(biāo)簽計(jì)算、標(biāo)簽應(yīng)用4個(gè)層級。下面嘗試對其進(jìn)行簡單描述:
3.1.1 數(shù)據(jù)采集
在數(shù)據(jù)采集模塊,主要通過客戶端/服務(wù)端SDK、導(dǎo)入、對接第三方應(yīng)用3種埋點(diǎn)方式進(jìn)行日志數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、第三方數(shù)據(jù)的采集。
1、SDK
(1)客戶端SDK:通過客戶端SDK埋點(diǎn),可以采集iOS、Android、小程序、網(wǎng)站等各種客戶端的用戶行為數(shù)據(jù)和用戶屬性信息。
(2)服務(wù)端SDK:若數(shù)據(jù)已經(jīng)存在數(shù)據(jù)庫、數(shù)據(jù)倉庫,比如訂單信息,可以使用對應(yīng)開發(fā)語言的服務(wù)端SDK進(jìn)行數(shù)據(jù)的采集。
2、Importer
可以根據(jù)運(yùn)行環(huán)境、源數(shù)據(jù)格式、導(dǎo)入數(shù)據(jù)量的大小等影響因素,選擇不同大導(dǎo)入方式,把歷史文件數(shù)據(jù)導(dǎo)進(jìn)用戶畫像產(chǎn)品系統(tǒng)。
3、Link
針對不同第三方產(chǎn)品OpenAPI的特點(diǎn),采用接收事件消息推送、或主動(dòng)輪詢方式采集用戶在不同第三方應(yīng)用系統(tǒng)的個(gè)人屬性和行為事件數(shù)據(jù)。
3.1.2 數(shù)據(jù)接入
埋點(diǎn)數(shù)據(jù)先大量進(jìn)入Kafka,然后慢慢消費(fèi)接入后續(xù)的數(shù)據(jù)整合存儲(chǔ)系統(tǒng)。
3.1.3 數(shù)據(jù)整合/標(biāo)簽計(jì)算
在用戶畫像系統(tǒng)中,主要使用Hive作為數(shù)據(jù)倉庫,進(jìn)行ETL處理,開發(fā)相應(yīng)的用戶屬性表和用戶行為表,以及標(biāo)簽的計(jì)算。
1、數(shù)據(jù)整合
各種渠道接進(jìn)來的數(shù)據(jù),存在孤立、空值、格式不對應(yīng)、超過極限范圍等數(shù)據(jù)質(zhì)量問題,因此需要進(jìn)行臟數(shù)據(jù)清洗、格式轉(zhuǎn)換、用戶識(shí)別與合并等整合工作:
(1)Clean/Transform
Clean:
比如,某個(gè)用戶的出生年月時(shí)間是未來的某個(gè)日期時(shí)刻,因此就需要把這類臟數(shù)據(jù)給過濾掉
Transform:
比如,通過某個(gè)第三方應(yīng)用API獲取到的所有用戶的地區(qū)信息是IPB標(biāo)準(zhǔn)編碼形式,為了能和其他渠道的信息一起進(jìn)行分析,就需要根據(jù)IPB標(biāo)準(zhǔn)編碼轉(zhuǎn)換成標(biāo)準(zhǔn)的省、市格式
(2)Id Mapping
各個(gè)渠道接進(jìn)來的用戶屬性數(shù)據(jù)、行為事件數(shù)據(jù)等都是孤立的,為了能計(jì)算用戶的全方位的綜合標(biāo)簽,就需要做用戶的識(shí)別合并,比如通過unionID,識(shí)別合并綁定在同一微信開放平臺(tái)的公眾號(hào)、小程序、網(wǎng)站的同一個(gè)用戶的信息。
經(jīng)過數(shù)據(jù)整合處理,數(shù)據(jù)會(huì)進(jìn)入下面的數(shù)據(jù)模型中:
2、標(biāo)簽計(jì)算
在用戶畫像系統(tǒng),會(huì)做一套批量離線的標(biāo)簽處理引擎,依賴的是底層比較穩(wěn)定的數(shù)據(jù)結(jié)構(gòu)。這個(gè)標(biāo)簽引擎一邊讀事件數(shù)據(jù),一邊讀用戶的屬性數(shù)據(jù),再配合上特定的標(biāo)簽規(guī)則,做一個(gè)批量計(jì)算,最后生成用戶標(biāo)簽。
3.1.4 標(biāo)簽應(yīng)用
標(biāo)簽的應(yīng)用主要分為前端畫像展示、通過API接入其他系統(tǒng)兩大類應(yīng)用方式,通過下面的「3.2 用戶畫像產(chǎn)品化功能模塊」章節(jié)具體描述。
3.2 用戶畫像產(chǎn)品功能模塊
3.2.1 系統(tǒng)看板
通常用戶畫像系統(tǒng)的數(shù)據(jù)看板,以可視化形式展示企業(yè)的核心用戶數(shù)據(jù)資產(chǎn)情況或者重點(diǎn)關(guān)注的人群數(shù)據(jù)。旨在建立和統(tǒng)一使用者對企業(yè)數(shù)據(jù)資產(chǎn)或者核心人群數(shù)據(jù)的基礎(chǔ)認(rèn)知,主要分成以下幾類:
1、用戶量級及變化趨勢:不同設(shè)備類型ID量級、不同類型用戶量級(如注冊與非注冊用戶、付費(fèi)與非付費(fèi)用戶等);
2、標(biāo)簽資產(chǎn):按主要類目統(tǒng)計(jì)標(biāo)簽個(gè)數(shù)等;
3、核心用戶標(biāo)簽:展示固有或自定義人群的關(guān)鍵標(biāo)簽畫像數(shù)據(jù)等;
3.2.2 標(biāo)簽管理
供業(yè)務(wù)人員進(jìn)行標(biāo)簽的增、刪、改、查等操作,包含:標(biāo)簽分類、新建標(biāo)簽、標(biāo)簽審核、標(biāo)簽上下架、標(biāo)簽覆蓋人數(shù)監(jiān)控等。
基于用戶行為數(shù)據(jù)、用戶屬性數(shù)據(jù),通過設(shè)置標(biāo)簽規(guī)則創(chuàng)建標(biāo)簽:
3.2.3 單用戶畫像
主要能力包含通過輸入用戶ID,來查看單用戶畫像的詳情數(shù)據(jù),如用戶的屬性信息、用戶行為等數(shù)據(jù)。
3.2.4 用戶分群和用戶群畫像
1、用戶分群
用戶分群功能主要是面向業(yè)務(wù)人員使用。產(chǎn)品經(jīng)理、運(yùn)營、客服等業(yè)務(wù)人員在應(yīng)用標(biāo)簽時(shí),可能不僅僅只查看某一個(gè)標(biāo)簽對應(yīng)的人群情況,更多地可能需要組合多個(gè)標(biāo)簽來滿足其在業(yè)務(wù)上對人群的定義。例如:組合“過去7天領(lǐng)取優(yōu)惠券次數(shù)大于1次”、“活動(dòng)活躍度等于高和極高”、“女性”用戶這3個(gè)標(biāo)簽定義目標(biāo)人群,查看該類人群覆蓋的用戶量。
2、用戶群畫像
和用戶分群功能相似,用戶群畫像功能首先也需要組合標(biāo)簽圈定用戶群體,不同之處在于用戶群畫像功能支持從多個(gè)維度去分析圈定用戶群體的特征,而用戶分群功能側(cè)重的是將篩選出來的用戶群推送到各業(yè)務(wù)系統(tǒng)中,提供服務(wù)支持。
3.2.5 BI分析
BI平臺(tái)和這些數(shù)據(jù)打通后,可以豐富數(shù)據(jù)的維度,支持通過多種分析模型進(jìn)行更加豐富和深層的分析及對比。
3.2.6 OpenAPI
OpenAPI能夠保障畫像系統(tǒng)數(shù)據(jù)與各系統(tǒng)之間打通,如push推送系統(tǒng)、營銷系統(tǒng)、廣告系統(tǒng)、推薦系統(tǒng)、BI等平臺(tái),并且保證各系統(tǒng)數(shù)據(jù)的實(shí)時(shí)更新,避免同源不同數(shù)的問題。
04
用戶畫像應(yīng)用
前面提到過用戶畫像主要有:經(jīng)營分析、精準(zhǔn)營銷、個(gè)性化推薦與服務(wù)3個(gè)方面的應(yīng)用。具體又可以分為:
4.1 經(jīng)營分析
用戶畫像系統(tǒng)的標(biāo)簽數(shù)據(jù)通過API進(jìn)入分析系統(tǒng)后,可以豐富分析數(shù)據(jù)的維度,支持進(jìn)行多種業(yè)務(wù)對象的經(jīng)營分析。下面總結(jié)的是一些市場、運(yùn)營、產(chǎn)品人員分析時(shí)會(huì)關(guān)注的指標(biāo):
4.1.1 流量分析
1、流量來源
2、流量數(shù)量:UV、PV
3、流量質(zhì)量:瀏覽深度(UV、PV)、停留時(shí)長、來源轉(zhuǎn)化、ROI(投資回報(bào)率,return on investment)
4.1.2 用戶分析
1、用戶數(shù)量:新用戶數(shù)、老用戶數(shù)、新/老用戶數(shù)量比
2、用戶質(zhì)量:新增用戶數(shù)(App啟動(dòng))、活躍用戶數(shù)(App啟動(dòng))、用戶留存(App啟動(dòng)-App啟動(dòng))、用戶參與度、沉睡、客單價(jià)
4.1.3 商品分析
1、商品動(dòng)銷:GMV、客單價(jià)、下單人數(shù)、取消購買人數(shù)、退貨人數(shù)、各端復(fù)購率、購買頻次分布、運(yùn)營位購買轉(zhuǎn)化
2、商品品類:支付訂單情況(次數(shù)、人數(shù)、趨勢、復(fù)購)、訪購情況、申請退貨情況、取消訂單情況、關(guān)注情況
4.1.4 訂單分析
1、訂單指標(biāo):總訂單量、退款訂單量、訂單應(yīng)付金額、訂單實(shí)付金額、下單人數(shù)
2、轉(zhuǎn)化率指標(biāo):新增訂單/訪問UV、有效訂單/訪問UV
4.1.5 渠道分析
1、用戶活躍
(1)活躍用戶:UV、PV
(2)新增用戶:注冊量、注冊同環(huán)比
2、用戶質(zhì)量
(1)留存:次日/7日/30日留存率
3、渠道收入
(1)訂單:訂單量、日均訂單量、訂單同環(huán)比
(2)營收:付費(fèi)金額、日均付費(fèi)金額、金額同環(huán)比
(3)用戶:人均訂單量、人均訂單金額
4.1.6 產(chǎn)品分析
1、搜索功能:搜索人數(shù)/次數(shù)、搜索功能滲透率、搜索關(guān)鍵詞
2、關(guān)鍵路徑漏斗等產(chǎn)品功能設(shè)計(jì)分析
4.2 精準(zhǔn)營銷
4.2.1 短信/郵件/push營銷
日常生活中我們經(jīng)常會(huì)從許多渠道接收到營銷來的信息。一條關(guān)于紅包到賬的短信消息推送可能會(huì)促使用戶打開已經(jīng)很久沒訪問的App,一條關(guān)于心愿單里面圖書降價(jià)的郵件消息推送可能會(huì)刺激用戶打開推送鏈接直接下單購買。具體有哪些類型的營銷方式呢?大致可以分為以下4類:
1、基于行為營銷:產(chǎn)品瀏覽、加入購物車、門店掃碼、訂單取消、訂單退貨等
2、基于位置營銷:周邊門店、周邊活動(dòng)、常去區(qū)域等
3、基于節(jié)日營銷:生日、春節(jié)、雙十一、雙十二、圣誕等
4、基于會(huì)員營銷:歡迎入會(huì)、卡券提醒、積分變更、等級變化、會(huì)員禮遇等
4.2.2 客服話術(shù)
當(dāng)我們在向某平臺(tái)的客服部門投訴、咨詢或反饋意見時(shí),客服人員可以準(zhǔn)確的說出我們在平臺(tái)的購買情況,上一次咨詢問題的處理結(jié)果等信息,針對性的提出解決方法,對于高價(jià)值用戶提供VIP客服通道等專項(xiàng)服務(wù)。
4.3 個(gè)性化推薦與服務(wù)
應(yīng)用的運(yùn)營者,可以通過個(gè)推用戶畫像中的性別、年齡段、興趣愛好、瀏覽購買行為等標(biāo)簽,給用戶推薦不同的內(nèi)容。如今日頭條上的個(gè)性化文章內(nèi)容推薦、抖音上基于用戶畫像做的個(gè)性化視頻內(nèi)容推薦、淘寶上基于用戶瀏覽行為等畫像數(shù)據(jù)做的個(gè)性化商品推薦等。
05
用戶畫像實(shí)踐案例
基于畫像系統(tǒng)去做多方面的數(shù)據(jù)分析、觸達(dá)用戶的運(yùn)營方案,可以快速地將標(biāo)簽數(shù)據(jù)應(yīng)用到服務(wù)層(T+1、實(shí)時(shí)應(yīng)用),通過效果分析得到用戶反饋后,幫助迭代營銷策略或產(chǎn)品設(shè)計(jì)。下面通過一些實(shí)踐案例來場景化復(fù)現(xiàn)用戶畫像的應(yīng)用點(diǎn)和應(yīng)用方式。
5.1 A/B人群效果測試
5.1.1 案例背景
某零食類快消商品為在大促活動(dòng)期間獲得較好的銷量,計(jì)劃通過消息推送的方式種草新上市產(chǎn)品、產(chǎn)品的保健功能等系列文章,為大促活動(dòng)造勢,激發(fā)銷量轉(zhuǎn)化。為了精準(zhǔn)定位目標(biāo)人群流量,渠道運(yùn)營人員現(xiàn)在計(jì)劃做兩個(gè)A/B人群效果測試:
1、不同內(nèi)容標(biāo)題對流量的影響;
2、精準(zhǔn)推送相比普通推送帶來的流量提升。
5.1.2 用戶畫像切入點(diǎn)
整個(gè)項(xiàng)目中需要梳理清楚如何切分AB組流量,如何設(shè)計(jì)好AB組人群規(guī)則和效果監(jiān)測。下面分步驟介紹畫像系統(tǒng)如何切入AB人群測試中。
1、對AB組用戶做切分
為了做A/B組測試,首先需要做好流量的切分,可以使用A/B分配隨機(jī)分流的形式,將用戶劃分為A/B人群。
2、測試文案標(biāo)題對流量影響的方案
某平臺(tái)渠道運(yùn)營人員為在大促活動(dòng)期間召回更多用戶來訪App,計(jì)劃在活動(dòng)預(yù)熱期選取少量用戶做一版文案標(biāo)題的AB效果測試。
在該測試方案中,控制組A選取了A路徑、近x天來訪過,且近x天內(nèi)瀏覽/收藏/加購過該零食的用戶群,給該批用戶推送零售文案A;對照組B選取了B路徑、近x天來訪過,且近x天內(nèi)瀏覽/收藏/加購過該零食的用戶群,給該批用戶推送零食文案B。控制組和對照組的用戶量相同,但文案不同,后續(xù)監(jiān)控兩組人群的點(diǎn)擊率大小,進(jìn)而分析不同文案對用戶點(diǎn)擊的影響。
例如,通過用戶群組功能圈選出A組的用戶,見下圖:
3、精準(zhǔn)推送相比普通推送帶來的流量提升的測試方案
在使用畫像系統(tǒng)精細(xì)化推送人群前,某平臺(tái)對用戶采用無差別推送消息的形式進(jìn)行推送。為了測試精細(xì)化運(yùn)營人群相比無差別運(yùn)營帶來的流量提升,渠道運(yùn)營人員決定在近期重點(diǎn)運(yùn)營的零食營銷會(huì)場做一個(gè)AB效果測試。
該測試方案中,控制組A選取了A路徑、近x天來訪過,近x天內(nèi)瀏覽/收藏/加購過該零食的用戶群;對照組B選取了B路徑、近x天來訪過,且沒有類目偏好的用戶群。對AB組用戶群都消息推送相同的文案,后續(xù)監(jiān)控兩組人群的點(diǎn)擊率大小,進(jìn)而分析精準(zhǔn)營銷推送帶來的增長點(diǎn)大小。
5.1.3 效果分析
在AB組人群消息推送上線后,后續(xù)需要搭建監(jiān)控報(bào)表來監(jiān)測控制組和測試組的流量和轉(zhuǎn)化情況,主要關(guān)注下方列表中的指標(biāo):
例如,使用事件分析模型搭建的AB人群的GMV對比報(bào)表,見下圖:
5.2 女神節(jié)定向營銷
5.2.1 案例背景
某主打女士商品的品牌商,計(jì)劃在女神節(jié)對不同品類偏好的女神進(jìn)行定向營銷。營銷信息會(huì)分兩次推送,首次是在當(dāng)天的10:00推送促銷信息,第二次是在當(dāng)天晚上的10:00再統(tǒng)一來一波促銷提醒。最后通過追蹤目標(biāo)受眾的當(dāng)日支付訂單完成率來評估營銷效果。
5.2.2 實(shí)現(xiàn)邏輯
首先基于用戶性別標(biāo)簽、年齡標(biāo)簽圈選出18~40歲,女性的用戶。然后統(tǒng)一延時(shí)至2020-03-08 上午 10:00,根據(jù)用戶品類偏好標(biāo)簽定向推送不同的營銷內(nèi)容,比如給品類偏好=彩妝護(hù)膚的人群推送春日美妝節(jié)類的營銷信息。第二波推送會(huì)延時(shí)至2020-03-08 下午 10:00 進(jìn)行推送,推送信息為統(tǒng)一的促銷提醒。
5.3 新安裝未注冊用戶實(shí)時(shí)營銷
5.3.1 案例背景
某零食商城App運(yùn)營人員為促進(jìn)未注冊的新安裝用戶注冊、下單,制定了運(yùn)營規(guī)則:新安裝未注冊用戶打開App時(shí),通過App彈窗方式為其推送優(yōu)惠券進(jìn)行營銷。比如,用戶安裝App后未進(jìn)行注冊,用戶改天打開后立馬對其推送App彈窗優(yōu)惠券,以更好地引導(dǎo)用戶完成注冊、下單。
5.3.2 用戶畫像切入點(diǎn)
渠道運(yùn)營人員通過組合用戶標(biāo)簽(如“未注冊用戶”和“安裝距今天數(shù)”小于××天)篩選出對應(yīng)的用戶群,然后選擇將對應(yīng)人群推送到“廣告系統(tǒng)”。這樣每天畫像系統(tǒng)的ETL調(diào)度完成后對應(yīng)人群數(shù)據(jù)就被推送到HBase數(shù)據(jù)庫進(jìn)行存儲(chǔ)。滿足條件的新用戶來訪App時(shí),由在線接口讀取HBase數(shù)據(jù)庫,在查詢到該用戶時(shí)為其推送該彈窗。
5.4 某電商再營銷廣告
5.4.1 案例背景
某電商App的商品運(yùn)營團(tuán)隊(duì)欲提升電子產(chǎn)品的老客復(fù)購率、新客下單率,于是選擇了和頭條合作投放再營銷廣告。比如,某用戶在該電商App看了vivo手機(jī),第二天刷今日頭條的時(shí)候,就看到了對應(yīng)手機(jī)的廣告信息。
5.4.2 實(shí)現(xiàn)邏輯
首先需要保證該電商App和今日頭條的API已經(jīng)打通,然后基于用戶在App內(nèi)行為(瀏覽、收藏、加購、搜索等)進(jìn)行算法挖掘產(chǎn)生用戶商品偏好的標(biāo)簽。當(dāng)今日頭條捕獲用戶設(shè)備信息后,就會(huì)向該電商發(fā)送一個(gè)請求,詢問是否需要對這個(gè)用戶展示廣告。這個(gè)時(shí)候電商平臺(tái)會(huì)判斷該用戶是否是自己的用戶,如果是自己用戶,就會(huì)對今日頭條返回一個(gè)推薦結(jié)果,那么用戶就會(huì)在今日頭條看到之前瀏覽過的商品信息了,點(diǎn)擊后就可以跳轉(zhuǎn)到電商App內(nèi)的商品詳情頁了。
06
總結(jié)
1、首先,描述了有關(guān)用戶畫像、用戶標(biāo)簽、用戶群組的認(rèn)知性概念;
2、然后,闡述了標(biāo)簽體系的分類、標(biāo)簽建設(shè)的流程和方法;
3、為了說明如何讓“躺在”數(shù)據(jù)倉庫中的畫像標(biāo)簽數(shù)據(jù)發(fā)揮更大的業(yè)務(wù)價(jià)值,接下來從系統(tǒng)架構(gòu)、應(yīng)用層功能兩個(gè)角度簡單總結(jié)了用戶畫像系統(tǒng)的建設(shè);
4、最后,從經(jīng)營分析、精準(zhǔn)營銷、個(gè)性化推薦3個(gè)角度總結(jié)了用戶畫像的應(yīng)用,并在實(shí)踐案例部分列舉幾個(gè)用戶畫像實(shí)際應(yīng)用的案例。
責(zé)任編輯:lq
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8428瀏覽量
132839 -
標(biāo)簽
+關(guān)注
關(guān)注
0文章
137瀏覽量
17896 -
用戶畫像
+關(guān)注
關(guān)注
0文章
7瀏覽量
2424
原文標(biāo)題:一文從0到1掌握用戶畫像知識(shí)體系
文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論