基于深度學習的系統(tǒng)可以為數(shù)十億在線消費者提高推薦內(nèi)容的相關(guān)性。
在過去十年中,全球電子商務(wù)的價值已飆升到數(shù)萬億美元,為數(shù)十億消費者提供服務(wù)。促進在線銷售實現(xiàn)這種爆炸式增長的動力,是由推薦系統(tǒng)引擎驅(qū)動的個性化。
推薦系統(tǒng)能夠使購物更加個性化。在電子商務(wù)網(wǎng)站上搜索產(chǎn)品時,他們會捕捉搜索,或者單純顯示建議。互聯(lián)網(wǎng)上之所以能提供這種令人愉悅的體驗,依托的是規(guī)模日益龐大的數(shù)據(jù)集和模型。
NVIDIA Merlin 是推薦系統(tǒng)的助推器。它能夠提高訓練和推理速度,使各種類型的企業(yè)均能夠更好地利用數(shù)據(jù)來構(gòu)建由 NVIDIA GPU 加速的推薦系統(tǒng)。
在線交易的風險比以往更高。根據(jù) eMarketer 發(fā)布的數(shù)據(jù),2021 年全球在線銷售額預計達到近 5 萬億美元,比上一年增加近 17%。
在一些全球大型在線網(wǎng)站上,即使推薦內(nèi)容的相關(guān)性僅提高 1%,其銷量也會增加數(shù)十億。
投資于推薦系統(tǒng)已成為當今互聯(lián)網(wǎng)巨頭的主要競爭優(yōu)勢之一。
根據(jù) Mordor Intelligence 發(fā)布的數(shù)據(jù),在 2026 年,推薦系統(tǒng)整體市場將從2020 年僅為 21.2 億美元提升至 151.3 億美元。而這家研究公司同時也表示,在推薦系統(tǒng)引擎的細分市場中,規(guī)模更龐大、發(fā)展更迅速的市場就在亞太地區(qū)。
但是,本行業(yè)所面臨的挑戰(zhàn)是,提高相關(guān)性需要更多的數(shù)據(jù)和更高的處理能力。這些數(shù)據(jù)包含數(shù)十億產(chǎn)品和消費者檔案上數(shù)以萬億計的用戶及產(chǎn)品交互(點擊、瀏覽)。
這種規(guī)模的數(shù)據(jù)可能需要數(shù)天時間來完成模型訓練。然而,越快推出基于更多數(shù)據(jù)的新模型,其相關(guān)性也就會越高。
Merlin 的模型、方法和庫集合包括用于構(gòu)建基于深度學習的系統(tǒng)的工具,能夠處理 TB 級的數(shù)據(jù),以便提供更精準的預測并增加點擊量。
SNAP 利用 Merlin 和 GPU 提升推理
根據(jù) eMarketer 發(fā)布的數(shù)據(jù),2021 年美國數(shù)字廣告收入預計達到 1911 億美元,比上一年增長 25.5%。
Snap 是社交媒體應(yīng)用 Snapchat 的母公司,位于加利福尼亞州圣塔莫尼卡,日活躍用戶量已超過 3 億。該公司通過社交照片和視頻信息服務(wù)來創(chuàng)造廣告收入。
Snap 首席執(zhí)行官 Evan Spiegel 在其第三季度利潤表中表示:“我們將繼續(xù)專注于為廣告合作伙伴提供強勁的業(yè)績結(jié)果,通過創(chuàng)新來擴展平臺功能并更好地為社區(qū)服務(wù)。”
Snap 的技術(shù)障礙在于,力圖繼續(xù)開發(fā)其工作負載的高成本排名模型,并在降低成本的同時擴展到更復雜的模型。
該公司使用 NVIDIA GPU 和 Merlin 來提升其內(nèi)容排名能力。
Snap 工程副總裁 Nima Khajehnouri 說:“Snap 使用 NVIDIA GPU 和 Merlin 軟件將機器學習推理成本效益提高了 50%,且降低 2 倍的服務(wù)延遲,其能夠為試驗和部署更繁重、更準確的廣告和內(nèi)容排名模型,提供更大的計算空間。”
騰訊借助 Merlin HugeCTR 來推動模型訓練
娛樂行業(yè)巨頭騰訊是中國一家具有高額市值的大型公司,運營著廣受歡迎的信息服務(wù)——微信,以及支付平臺——微信支付。
其工程師需要快速對廣告推薦系統(tǒng)的模型進行快速迭代,這會增加對訓練性能的需求。
騰訊專家工程師孔祥挺說:“廣告業(yè)務(wù)是騰訊內(nèi)部比較重要的業(yè)務(wù)之一,而推薦系統(tǒng)則用來提高整體的廣告收入。”
問題在于,廣告推薦的準確性只有通過訓練更多的樣本數(shù)據(jù)(包括更多的樣本特征)來提高,但這會延長訓練時間,從而影響模型更新頻率。
他還說道:“作為一個推薦系統(tǒng)的訓練框架,HugeCTR 已集成到廣告推薦訓練系統(tǒng)中,使得模型訓練的更新頻率更快,并通過訓練更多的樣本來提升線上廣告效果。”
他補充道,模型的訓練性能得到提升后,我們就可以訓練更多的數(shù)據(jù),提高模型的準確率,從而增加廣告收入。
美團借助 NVIDIA A100 GPU 降低成本
美團的業(yè)務(wù)涵蓋 200 個服務(wù)類別,在食品、娛樂和按需服務(wù)各領(lǐng)域高度交織著。而這家中國互聯(lián)網(wǎng)巨頭擁有超過 6.67 億活躍用戶和 830 萬活躍商家。
美團高級技術(shù)專家黃軍表示,如果他的團隊要大幅提升性能,通常會更傾向于訓練更多的樣本和更復雜的模型。
黃軍也表示,美團的問題在于,隨著模型變得越來越復雜,對訓練框架進行深入優(yōu)化就會變得困難。
他說道:“我們正致力于將 NVIDIA HugeCTR 集成到基于 A100 GPU 的訓練系統(tǒng)中。成本也會大大降低。這還僅僅只是初步的優(yōu)化結(jié)果,未來還有很大的優(yōu)化空間。”
美團最近報告說,在 2021 年第二季度的過去 12 個月中,每位交易用戶的平均交易量增加到 32.8 筆,而在 2020 年第二季度的過去 12 個月中為 25.7 筆。
原文標題:為數(shù)十億消費者提供服務(wù):NVIDIA Merlin 助力網(wǎng)絡(luò)巨頭獲得點擊量
文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5026瀏覽量
103296 -
gpu
+關(guān)注
關(guān)注
28文章
4754瀏覽量
129096 -
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
54文章
11170瀏覽量
103519
原文標題:為數(shù)十億消費者提供服務(wù):NVIDIA Merlin 助力網(wǎng)絡(luò)巨頭獲得點擊量
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論