在過(guò)去的十年中,互聯(lián)網(wǎng)已經(jīng)發(fā)展成為一個(gè)提供大規(guī)模在線服務(wù)的平臺(tái),它深刻地改變了我們交流、閱讀新聞、購(gòu)買(mǎi)產(chǎn)品和觀看電影的方式。與此同時(shí),前所未有的物品數(shù)量(我們使用術(shù)語(yǔ)物品指電影、新聞、書(shū)籍和產(chǎn)品。)在線提供需要一個(gè)可以幫助我們發(fā)現(xiàn)我們喜歡的項(xiàng)目的系統(tǒng)。因此,推薦系統(tǒng)是強(qiáng)大的信息過(guò)濾工具,可以促進(jìn)個(gè)性化服務(wù)并為個(gè)人用戶提供量身定制的體驗(yàn)。簡(jiǎn)而言之,推薦系統(tǒng)在利用大量可用數(shù)據(jù)做出可管理的選擇方面發(fā)揮著關(guān)鍵作用。如今,推薦系統(tǒng)是亞馬遜、Netflix 和 YouTube 等許多在線服務(wù)提供商的核心。回憶一下圖1.3.3中亞馬遜推薦的深度學(xué)習(xí)書(shū)籍的例子 . 使用推薦系統(tǒng)的好處有兩方面:一方面,它可以大大減少用戶尋找物品的努力,緩解信息過(guò)載的問(wèn)題。另一方面,它可以為在線服務(wù)提供商增加商業(yè)價(jià)值,是重要的收入來(lái)源。本章將介紹推薦系統(tǒng)領(lǐng)域深度學(xué)習(xí)的基本概念、經(jīng)典模型和最新進(jìn)展,以及實(shí)現(xiàn)示例。
21.1.1. 協(xié)同過(guò)濾
我們從推薦系統(tǒng)中的重要概念——協(xié)同過(guò)濾 (CF) 開(kāi)始旅程,它最初是由 Tapestry 系統(tǒng)創(chuàng)造的( Goldberg et al. , 1992 ),指的是“人們相互協(xié)作以幫助彼此執(zhí)行過(guò)濾過(guò)程處理發(fā)布到新聞組的大量電子郵件和消息”。這個(gè)詞已經(jīng)豐富了更多的意義。從廣義上講,它是使用涉及多個(gè)用戶、代理和數(shù)據(jù)源之間協(xié)作的技術(shù)來(lái)過(guò)濾信息或模式的過(guò)程。CF自問(wèn)世以來(lái)有多種形式和眾多的CF方法被提出。
總體而言,CF 技術(shù)可分為:基于內(nèi)存的 CF、基于模型的 CF 及其混合體(Su 和 Khoshgoftaar,2009 年)。代表性的基于內(nèi)存的 CF 技術(shù)是基于最近鄰的 CF,例如基于用戶的 CF 和基于項(xiàng)目的 CF (Sarwar等人,2001 年). 矩陣分解等潛在因子模型是基于模型的 CF 的示例。Memory-based CF 在處理稀疏和大規(guī)模數(shù)據(jù)方面存在局限性,因?yàn)樗诠餐?xiàng)目計(jì)算相似度值。基于模型的方法因其更好的處理稀疏性和可擴(kuò)展性的能力而變得越來(lái)越流行。許多基于模型的 CF 方法可以使用神經(jīng)網(wǎng)絡(luò)進(jìn)行擴(kuò)展,從而通過(guò)深度學(xué)習(xí)中的計(jì)算加速產(chǎn)生更靈活和可擴(kuò)展的模型 (Zhang等人,2019 年). 一般來(lái)說(shuō),CF 只使用用戶-項(xiàng)目交互數(shù)據(jù)來(lái)進(jìn)行預(yù)測(cè)和推薦。除了 CF 之外,基于內(nèi)容和基于上下文的推薦系統(tǒng)在合并項(xiàng)目/用戶的內(nèi)容描述和上下文信號(hào)(例如時(shí)間戳和位置)時(shí)也很有用。顯然,當(dāng)有不同的輸入數(shù)據(jù)可用時(shí),我們可能需要調(diào)整模型類(lèi)型/結(jié)構(gòu)。
21.1.2。顯式反饋和隱式反饋
為了了解用戶的偏好,系統(tǒng)應(yīng)收集他們的反饋。反饋可以是顯式的也可以是隱式的 (Hu et al. , 2008)。例如, IMDb收集電影的星級(jí)評(píng)分,范圍從 1 星到 10 星。YouTube 為用戶提供了豎起大拇指和不豎起大拇指的按鈕來(lái)顯示他們的偏好。顯然,收集明確的反饋需要用戶主動(dòng)表明他們的興趣。盡管如此,明確的反饋并不總是很容易獲得,因?yàn)樵S多用戶可能不愿意對(duì)產(chǎn)品進(jìn)行評(píng)級(jí)。相對(duì)而言,隱式反饋通常很容易獲得,因?yàn)樗饕P(guān)注對(duì)用戶點(diǎn)擊等隱式行為進(jìn)行建模。因此,許多推薦系統(tǒng)都以隱式反饋為中心,隱式反饋通過(guò)觀察用戶行為間接反映用戶的意見(jiàn)。隱式反饋的形式多種多樣,包括購(gòu)買(mǎi)歷史、瀏覽歷史、手表甚至鼠標(biāo)移動(dòng)。例如,購(gòu)買(mǎi)了同一作者的多本書(shū)的用戶可能會(huì)喜歡該作者。請(qǐng)注意,隱式反饋本質(zhì)上是嘈雜的。我們只能猜測(cè) 他們的喜好和真實(shí)動(dòng)機(jī)。用戶看過(guò)電影并不一定表示對(duì)該電影有正面看法。
21.1.3。推薦任務(wù)
在過(guò)去的幾十年里,已經(jīng)研究了許多推薦任務(wù)。從應(yīng)用領(lǐng)域來(lái)看,有電影推薦、新聞推薦、興趣點(diǎn)推薦 ( Ye et al. , 2011 )等。也可以根據(jù)反饋和輸入數(shù)據(jù)的類(lèi)型來(lái)區(qū)分任務(wù),例如,評(píng)級(jí)預(yù)測(cè)任務(wù)旨在預(yù)測(cè)顯式評(píng)級(jí)。頂部-n推薦(項(xiàng)目排名)根據(jù)隱式反饋為每個(gè)用戶個(gè)人對(duì)所有項(xiàng)目進(jìn)行排名。如果還包括時(shí)間戳信息,我們可以構(gòu)建序列感知推薦 (Quadrana等人,2018 年)。另一個(gè)流行的任務(wù)稱(chēng)為點(diǎn)擊率預(yù)測(cè),它也基于隱式反饋,但可以利用各種分類(lèi)特征。為新用戶推薦和向現(xiàn)有用戶推薦新物品被稱(chēng)為冷啟動(dòng)推薦(Schein et al. , 2002)。
21.1.4。概括
-
推薦系統(tǒng)對(duì)個(gè)人用戶和行業(yè)都很重要。協(xié)同過(guò)濾是推薦中的一個(gè)關(guān)鍵概念。
-
有兩種類(lèi)型的反饋:隱式反饋和顯式反饋。在過(guò)去十年中,已經(jīng)探索了許多推薦任務(wù)。
評(píng)論