搜索與推薦的區(qū)別
1. 場(chǎng)景需求不同
搜索的場(chǎng)景故名思義,就是用戶提供想要尋找的內(nèi)容的描述,系統(tǒng)返回給用戶匹配到的結(jié)果,常見(jiàn)的場(chǎng)景如文字輸入框的搜索,圖片搜索,聽(tīng)音識(shí)曲,標(biāo)簽篩選等,看似很多場(chǎng)景,其實(shí)只是用戶輸入內(nèi)容的形式不同。
推薦的場(chǎng)景我們常見(jiàn)的有各大App首頁(yè)的個(gè)性化推薦(如猜你喜歡/每日歌曲推薦),選擇頁(yè)面的關(guān)聯(lián)推薦(買(mǎi)了還買(mǎi),看了還看,買(mǎi)了它的用戶還買(mǎi)等等)等,推薦的場(chǎng)景更加的豐富,因?yàn)闆](méi)有用戶提供的內(nèi)容的限制,場(chǎng)景更具多樣性,推薦方法也多種多樣,例如基于內(nèi)容的推薦,基于用戶行為的推薦,協(xié)同過(guò)濾等等。
各大互聯(lián)網(wǎng)平臺(tái)由于服務(wù)內(nèi)容不同,平臺(tái)成熟度的不同,對(duì)搜索和推薦的偏重程度也就不盡相同,但都是缺一不可。
例如對(duì)于房地產(chǎn)應(yīng)用來(lái)說(shuō),用戶目標(biāo)明確,搜索服務(wù)會(huì)帶來(lái)更大的購(gòu)買(mǎi)力,但關(guān)聯(lián)推薦會(huì)給用戶帶來(lái)更多的選擇,同樣也是不可缺少的。
對(duì)于短視頻平臺(tái)而言,由于用戶較難通過(guò)文字或圖片提供內(nèi)容的描述,那么自然會(huì)偏重推薦服務(wù)。
對(duì)于電商在初期肯定是搜索服務(wù)帶來(lái)了更多的購(gòu)買(mǎi)率,當(dāng)購(gòu)買(mǎi)率到達(dá)瓶頸時(shí),推薦帶來(lái)的購(gòu)買(mǎi)率就是突破瓶頸和繼續(xù)發(fā)展的必要手段。
2. 輸入輸出不同
不論搜索還是推薦,實(shí)際上對(duì)于用戶來(lái)說(shuō),都是一個(gè)提供服務(wù)的黑盒,它能夠根據(jù)用戶/物品/場(chǎng)景等信息,從候選物品的池子中選出與用戶匹配的的物品列表。
不同的是對(duì)于搜索服務(wù),還額外提供了用戶對(duì)于自己訴求的描述信息(當(dāng)然可能描述的并不準(zhǔn)確)。
輸入的區(qū)別天然的導(dǎo)致了用戶對(duì)于結(jié)果的不同期待:
-
個(gè)性化程度不同
推薦系統(tǒng)更強(qiáng)調(diào)個(gè)性化,甚至更注重驚喜感。往往要在準(zhǔn)確性和多樣性之間作出權(quán)衡;搜索系統(tǒng)更強(qiáng)調(diào)相關(guān)性,如果搜索結(jié)果與用戶的目標(biāo)不符,用戶的接受程度會(huì)很差,個(gè)性化對(duì)于搜索系統(tǒng)來(lái)說(shuō)既沒(méi)意義又有風(fēng)險(xiǎn)。
-
排的更好與搜的更全
對(duì)于推薦系統(tǒng)來(lái)說(shuō),排序更加重要,因?yàn)橹挥凶铋_(kāi)始的推薦結(jié)果吸引了用戶,用戶才可能向后瀏覽。
對(duì)于搜索系統(tǒng)來(lái)說(shuō),召回更加重要,因?yàn)橛脩魰?huì)主動(dòng)向后瀏覽,以期望找到自己的目標(biāo),但如果最終沒(méi)有找到,也就是搜的不全,就會(huì)有很差的用戶體驗(yàn)。
-
快速滿足還是持續(xù)服務(wù)
提到搜索系統(tǒng),往往會(huì)提到馬太效應(yīng),只有與用戶搜索的結(jié)果更為匹配的物品才會(huì)被呈現(xiàn)給用戶,讓用戶得到快速滿足,那么滿足需求的物品那么多,搜索的越準(zhǔn)確,用戶就越不會(huì)向后瀏覽,最終點(diǎn)擊的熱度就只會(huì)集中在少量的物品上。這也就是為什么廣告最初誕生在搜索系統(tǒng)中的原因。
提到推薦系統(tǒng),往往會(huì)提到長(zhǎng)尾效應(yīng),也就是讓用戶時(shí)刻保持新鮮感和驚喜感,考慮用戶的長(zhǎng)期興趣,提高用戶粘性,期望留住用戶,并提供持續(xù)的服務(wù),這也就是為什么刷短視頻停不下來(lái)的原因。
-
實(shí)時(shí)性與滯后性
搜索的數(shù)據(jù)實(shí)時(shí)性要求是特別高的,數(shù)據(jù)常常要求秒級(jí)更新,例如一個(gè)商品已經(jīng)沒(méi)有貨了就不應(yīng)該被搜出來(lái)了。而推薦的數(shù)據(jù)很多是可以容忍天級(jí)更新的,由于推薦要考慮大量的用戶行為信息,一定是具有一定滯后性的。
搜索與推薦的聯(lián)系
1. 相同的本質(zhì)
搜索與推薦本質(zhì)上都是當(dāng)前時(shí)代信息過(guò)載的產(chǎn)物,解決的根本思路都是通過(guò)匹配(召回)、排序?yàn)橛脩粼谶^(guò)載的信息中挑選出用戶想要的信息。只是根據(jù)業(yè)務(wù)場(chǎng)景的不同,在召回,排序階段考慮的側(cè)重點(diǎn)不同。
2. 搜索與推薦的協(xié)同作用
-
推薦中的搜索
推薦服務(wù)中基于內(nèi)容的推薦實(shí)際上相當(dāng)于一種無(wú)聲的搜索,常常在實(shí)現(xiàn)時(shí)會(huì)采用搜索服務(wù)的中的倒排索引等技術(shù),例如基于內(nèi)容的推薦,常常是通過(guò)規(guī)則或推薦模型得到用戶感興趣的內(nèi)容的標(biāo)簽,然后利用搜索服務(wù)的方法進(jìn)行標(biāo)簽搜索和匹配即可得到最終的推薦列表。
-
搜索中的推薦
當(dāng)搜索出來(lái)符合用戶的數(shù)據(jù)量很多時(shí),需要根據(jù)推薦服務(wù)中用戶畫(huà)像等結(jié)果幫助搜索服務(wù)匹配用戶的需求。例如周一的晚上進(jìn)行搜索得到的結(jié)果列表和周五的晚上進(jìn)行搜索得到結(jié)果列表就會(huì)有所差異。
推薦與搜索常常在一個(gè)頁(yè)面中協(xié)同為用戶提供服務(wù),例如搜索引擎搜索結(jié)果頁(yè)面的關(guān)聯(lián)推薦,電商軟件搜索瀏覽頁(yè)面的相關(guān)推薦等。
架構(gòu)演進(jìn)與架構(gòu)統(tǒng)一
搜索架構(gòu)的演進(jìn)
一般而言,一個(gè)企業(yè)的搜索引擎,由于在初始階段業(yè)務(wù)線不多,提供簡(jiǎn)單的搜索服務(wù)即可。隨著業(yè)務(wù)的不斷增多,對(duì)搜索需求的不斷抽象和統(tǒng)一,逐漸可以發(fā)展為平臺(tái)階段,提供多數(shù)據(jù)源的寫(xiě)入與多業(yè)務(wù)的統(tǒng)一搜索能力,不同業(yè)務(wù)的不同需求可以靈活配置。
等到業(yè)務(wù)線不斷增多,對(duì)接業(yè)務(wù)的工作占據(jù)了大部分的開(kāi)發(fā)時(shí)間時(shí),開(kāi)發(fā)更加方便的運(yùn)維與管理能力,幫入業(yè)務(wù)自助接入平臺(tái)就能夠進(jìn)一步提高搜索功能開(kāi)發(fā)的效率,此時(shí)搜索架構(gòu)就進(jìn)入到了運(yùn)維更為便捷的云平臺(tái)的階段。
推薦架構(gòu)的演進(jìn)
對(duì)于推薦引擎,起步階段一般會(huì)采用基于內(nèi)容的推薦方法,由于數(shù)據(jù)不足,企業(yè)初期會(huì)基于業(yè)務(wù)側(cè)提供的經(jīng)驗(yàn)規(guī)則對(duì)物品和用戶進(jìn)行標(biāo)注,然后通過(guò)在線匹配標(biāo)簽的方式進(jìn)行推薦。繼續(xù)發(fā)展,隨著業(yè)務(wù)的不斷豐富和迭代,會(huì)對(duì)推薦系統(tǒng)有更多的期望,當(dāng)不斷修改或增加經(jīng)驗(yàn)規(guī)則卻滿足不了業(yè)務(wù)需求時(shí),就需要一些基于模型的推薦方法以及個(gè)性化的推薦的服務(wù)了。再進(jìn)一步,與搜索引擎一樣,推薦引擎也需要對(duì)接多個(gè)業(yè)務(wù)線,向平臺(tái)階段發(fā)展,提供統(tǒng)一的公共服務(wù),通過(guò)配置滿足不同的業(yè)務(wù)線的需求。
架構(gòu)統(tǒng)一
從上面的介紹和架構(gòu)演進(jìn)我們可以發(fā)現(xiàn),推薦和搜索的架構(gòu)有很多可以復(fù)用的地方,因而可以進(jìn)行架構(gòu)的統(tǒng)一。
-
流程上的統(tǒng)一:
不論是搜索還是推薦,都會(huì)經(jīng)歷召回-排序-重排等流程,最終得到呈現(xiàn)給用戶的物品列表,只不過(guò)流程中各個(gè)階段的目標(biāo)會(huì)不太相同。
-
數(shù)據(jù)與數(shù)據(jù)平臺(tái)的復(fù)用:
被搜索的物品和被推薦的物品是統(tǒng)一的,召回排序訓(xùn)練模型時(shí)所需要的埋點(diǎn)數(shù)據(jù)/用戶行為數(shù)據(jù)等也是統(tǒng)一的,那么自然獲取數(shù)據(jù)/處理數(shù)據(jù)的平臺(tái)自然就是可以復(fù)用的。
-
算法與算法平臺(tái)的復(fù)用:
搜索和推薦發(fā)展到一定階段,當(dāng)簡(jiǎn)單的專(zhuān)家規(guī)則不再能夠支撐復(fù)雜的搜索和推薦需求時(shí),都會(huì)發(fā)展到基于模型進(jìn)行召回排序的階段,此時(shí)都需要根據(jù)用戶數(shù)據(jù)/物品數(shù)據(jù)/埋點(diǎn)數(shù)據(jù)進(jìn)行模型訓(xùn)練,只不過(guò)由于二者的訓(xùn)練目標(biāo)不同,訓(xùn)練的模型的參數(shù)可能會(huì)不相同,但算法平臺(tái)或者大家常說(shuō)的機(jī)器學(xué)習(xí)/AI平臺(tái)是可以復(fù)用的。
-
A/B Test實(shí)驗(yàn)平臺(tái)的復(fù)用:
由于業(yè)務(wù)需求的不斷變化,模型的不斷更替,通過(guò)A/B Test平臺(tái)能夠通過(guò)分流的方式拿到真實(shí)的生產(chǎn)環(huán)境中的用戶反饋,以幫助企業(yè)不斷驗(yàn)證和優(yōu)化搜索和推薦策略。
-
配置中心的復(fù)用:
可以通過(guò)配置中心針對(duì)不同業(yè)務(wù)和服務(wù)配置不同的搜索和推薦策略,并且提供便捷的一鍵部署能力。
所以很多公司,在業(yè)務(wù)領(lǐng)域上搜索和推薦分屬于不同的部門(mén),但很多的公共的部分都有成熟的內(nèi)部平臺(tái)可以快速?gòu)?fù)用。
總結(jié)
本篇文章介紹了搜索和推薦的區(qū)別與聯(lián)系,架構(gòu)演進(jìn)以及架構(gòu)統(tǒng)一。我們都知道架構(gòu)是因?yàn)樾枨蟮臄U(kuò)增而不斷演進(jìn)來(lái)的,例如從服務(wù)階段發(fā)展到平臺(tái)階段,是因?yàn)橐岣叨鄻I(yè)務(wù)的對(duì)接效率;從基于內(nèi)容的推薦到復(fù)雜的融合在線用戶畫(huà)像和離線用戶畫(huà)像的個(gè)性化推薦,是因?yàn)楹?jiǎn)單基于規(guī)則或標(biāo)簽的推薦無(wú)法滿足用戶和業(yè)務(wù)側(cè)的需求。
所以不要在一開(kāi)始被過(guò)于復(fù)雜的架構(gòu)綁住手腳,可以針對(duì)自身業(yè)務(wù)的需求進(jìn)行搜索/推薦的簡(jiǎn)單架構(gòu)設(shè)計(jì),然后逐步演進(jìn)和優(yōu)化架構(gòu)。
來(lái)源:thoughtworks
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論