圖形分析(或圖形算法)是用于確定圖形中對象之間的關(guān)系強(qiáng)度和方向的分析工具。圖形分析的重點(diǎn)在于每次兩個(gè)對象之間的成對關(guān)系和整個(gè)圖形的結(jié)構(gòu)特征。
什么是圖形分析?
圖形分析是一種新興的數(shù)據(jù)分析形式,可幫助企業(yè)理解網(wǎng)絡(luò)或圖形中關(guān)聯(lián)實(shí)體數(shù)據(jù)之間的復(fù)雜關(guān)系。
圖形是一種數(shù)學(xué)結(jié)構(gòu),用于對物理、生物、社會(huì)和信息系統(tǒng)中多種類型的關(guān)系和過程進(jìn)行建模。圖形由通過邊緣連接(表示這些實(shí)體之間的關(guān)系)的節(jié)點(diǎn)或頂點(diǎn)(表示系統(tǒng)實(shí)體)構(gòu)成。圖形處理是一種能夠穿梭各邊緣和節(jié)點(diǎn)的功能,用于發(fā)現(xiàn)和理解網(wǎng)絡(luò)中關(guān)聯(lián)數(shù)據(jù)之間的復(fù)雜關(guān)系和/或優(yōu)化路徑
圖形網(wǎng)絡(luò)分析有許多用途,例如分析社交網(wǎng)絡(luò)中的關(guān)系、網(wǎng)絡(luò)威脅檢測,以及根據(jù)共同偏好識別潛在買家。
在現(xiàn)實(shí)世界中,節(jié)點(diǎn)可以是人員、群組、地點(diǎn)或事物,例如客戶、產(chǎn)品、成員、城市、商店、機(jī)場、端口、銀行帳戶、設(shè)備、手機(jī)、分子或網(wǎng)頁。
節(jié)點(diǎn)之間的邊緣或關(guān)系示例包括友誼、網(wǎng)絡(luò)連接、超鏈接、道路、路線、電線、電話、電子郵件、“點(diǎn)贊”、付款、交易、電話呼叫和社交網(wǎng)絡(luò)消息。邊緣可以有一個(gè)單向箭頭來表示從一個(gè)節(jié)點(diǎn)到另一個(gè)節(jié)點(diǎn)的關(guān)系,比如 Janet“點(diǎn)贊了”Jeanette 的一篇社交媒體文章。不過,它們也可以是非定向的,比如,如果 Bob 是 Alice 的 Facebook 好友,那么 Alice 也是 Bob 的好友。
為何選擇圖形分析?
圖形分析可用于確定圖形中對象之間的關(guān)系強(qiáng)度和方向。重點(diǎn)是一次處理兩個(gè)對象之間的關(guān)系,以及整個(gè)圖形的結(jié)構(gòu)特征。道路網(wǎng)絡(luò)、通信網(wǎng)絡(luò)、社交網(wǎng)絡(luò)、網(wǎng)頁和鏈接以及金融交易數(shù)據(jù)均為非常適合圖形的數(shù)據(jù)示例。圖形分析對于實(shí)現(xiàn)以下目標(biāo)尤為有效:
檢測洗錢等金融犯罪
識別欺詐交易及活動(dòng)
在社交網(wǎng)絡(luò)社區(qū)執(zhí)行網(wǎng)紅分析
根據(jù)客戶評級或購買物來執(zhí)行推薦分析
發(fā)現(xiàn)電網(wǎng)、水網(wǎng)和運(yùn)輸網(wǎng)絡(luò)的缺點(diǎn)
優(yōu)化航空公司、零售和制造業(yè)的路線
圖形分析的工作原理是什么?
圖形分析使用聚類、分區(qū)、廣度優(yōu)先搜索、PageRank、連接組件和最短路徑等特定的圖形算法來分析多個(gè)應(yīng)用程序中實(shí)體之間的關(guān)系:
| 聚類
基于物體的對象進(jìn)行分組,因此集群內(nèi)相似度較高,集群間相似性低。應(yīng)用程序包括機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、統(tǒng)計(jì)學(xué)、圖像處理以及大量物理和社會(huì)科學(xué)應(yīng)用程序。
| 切割或分割
找到交叉邊緣最少的切口。應(yīng)用程序包括發(fā)現(xiàn)數(shù)據(jù)和通信網(wǎng)絡(luò)的薄弱點(diǎn),以及社交網(wǎng)絡(luò)中的社區(qū)檢測。
| 搜索
廣度優(yōu)先搜索和深度優(yōu)先搜索。
| 最短路徑
找到兩個(gè)興趣節(jié)點(diǎn)之間的最短路徑。應(yīng)用程序包括社交網(wǎng)絡(luò)分析、交通運(yùn)輸物流和許多其他優(yōu)化問題。
| 最寬路徑
在加權(quán)圖形中找到兩個(gè)指定頂點(diǎn)之間的路徑,從而將路徑中最小權(quán)重邊緣的權(quán)重更大化。應(yīng)用程序包括 IP 流量路由和流量敏感型路線規(guī)劃。
| 連接組件
強(qiáng)連接圖形就是您從任何起始節(jié)點(diǎn)開始均可到達(dá)圖形中每個(gè)節(jié)點(diǎn)的圖形。強(qiáng)連接組件是各個(gè)子區(qū)域均強(qiáng)連接的圖形的最大子區(qū)域。應(yīng)用程序包括社交網(wǎng)絡(luò)分析。
| 頁面排名
一種由互聯(lián)網(wǎng)搜索用于網(wǎng)頁排名的衡量網(wǎng)頁受歡迎程度的方法。應(yīng)用程序還包括社交網(wǎng)絡(luò)分析、推薦系統(tǒng)以及在自然科學(xué)(研究蛋白質(zhì)之間的關(guān)系時(shí))和生態(tài)網(wǎng)絡(luò)中的新用途。
熱門圖形分析用例
創(chuàng)建推薦系統(tǒng) 通過識別客戶、社交媒體和產(chǎn)品數(shù)據(jù)之間的關(guān)系和頻率,公司可以創(chuàng)建智能推薦引擎,實(shí)時(shí)響應(yīng)客戶的在線活動(dòng)。
檢測欺詐。圖形分析支持您以極大的靈活性大規(guī)模地建模數(shù)據(jù)關(guān)系,快速分析大量交易數(shù)據(jù),實(shí)時(shí)識別欺詐。
遵守監(jiān)管規(guī)定。遵守 HIPAA、PCI/DSS 和 GDPR 等法規(guī)關(guān)系到各行各業(yè)的企業(yè)。在收集客戶個(gè)人信息時(shí),這些法規(guī)要求您在這些數(shù)據(jù)通過各種企業(yè)系統(tǒng)傳輸時(shí)能夠監(jiān)控這些數(shù)據(jù)。圖形分析能夠?yàn)槟峁┝鹘?jīng)不同系統(tǒng)的數(shù)據(jù)的直觀表示,使得在企業(yè)系統(tǒng)中追蹤敏感數(shù)據(jù)更加容易。這就會(huì)為您提供一種實(shí)現(xiàn)合規(guī)性的簡化方法。
身份認(rèn)證與訪問管理 (IAM)。確定哪些人可以進(jìn)入敏感的應(yīng)用程序和數(shù)據(jù)(基于云和內(nèi)部部署)是一個(gè)復(fù)雜的過程。圖形分析能夠?qū)λ斜匾臄?shù)據(jù)進(jìn)行更加穩(wěn)健、實(shí)時(shí)的跨平臺管理,從而確定數(shù)據(jù)之間的關(guān)系并加速安全可靠的身份認(rèn)證與訪問管理。
深入了解供應(yīng)鏈效率。隨著全球化的發(fā)展,企業(yè)供應(yīng)鏈變得更加復(fù)雜。借助圖形分析,您可以為這些復(fù)雜的關(guān)系建模,并深入了解供應(yīng)鏈運(yùn)營中效率低下的問題。
構(gòu)建推薦系統(tǒng)
檢測欺詐
借助 GPU 加速圖形分析
網(wǎng)絡(luò)分析、基因組學(xué)、社交網(wǎng)絡(luò)分析等領(lǐng)域的大規(guī)模圖形處理需要強(qiáng)大且高效的計(jì)算性能。
GPU 具有大規(guī)模并行性,并且顯存訪問帶寬優(yōu)勢顯著,因此十分適用于加速數(shù)據(jù)密集型分析,特別是圖形分析。GPU 采用大規(guī)模并行架構(gòu),包含數(shù)千個(gè)專為同時(shí)處理多個(gè)任務(wù)而設(shè)計(jì)的小核心,非常適合執(zhí)行“為每個(gè) X 執(zhí)行 Y”的計(jì)算任務(wù),可應(yīng)用于大型圖形中的頂點(diǎn)或邊緣集。
NVIDIA RAPIDS cuGraph 能夠提供將 RAPIDS 生態(tài)系統(tǒng)與熱門的 python 圖形庫 NetworkX 相集成的加速圖形分析庫。RAPIDS cuGraph 的愿景是使圖形分析無處不在,以便用戶只需考慮分析而無需考慮技術(shù)或框架。
新款 NVIDIA GPU 的強(qiáng)大計(jì)算能力實(shí)現(xiàn)更快的加快圖形分析速度。此外,GPU 的內(nèi)部顯存速率使 cuGraph 能夠快速切換數(shù)據(jù)結(jié)構(gòu),滿足分析需求,而不限于單一數(shù)據(jù)結(jié)構(gòu)。
通過有效利用 GPU 中的大規(guī)模并行性,RAPIDS 的圖形算法能夠?qū)⒋笮蛨D形的分析速度提高 1000 多倍。在單塊 A100 GPU 上探索多達(dá) 2 億個(gè)邊緣節(jié)點(diǎn),并在 DGX A100 集群上擴(kuò)展至數(shù)十億個(gè)邊緣節(jié)點(diǎn)。
NVIDIA GPU 加速的端到端數(shù)據(jù)科學(xué)
NVIDIA RAPIDS 結(jié)合了執(zhí)行高速 ETL、圖形分析、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的能力。這套完全在 GPU 上執(zhí)行數(shù)據(jù)科學(xué)流程的開源軟件庫和 API,可以將訓(xùn)練時(shí)間從幾天縮短至幾分鐘。它依賴于 NVIDIA CUDA 基元進(jìn)行低級別計(jì)算優(yōu)化,但通過用戶友好型 Python 界面實(shí)現(xiàn) GPU 并行結(jié)構(gòu)和極高的顯存帶寬。
RAPIDS cuGraph 無縫集成到 RAPIDS 數(shù)據(jù)科學(xué)生態(tài)系統(tǒng)中,使數(shù)據(jù)科學(xué)家能夠使用存儲在 GPU DataFrame 中的數(shù)據(jù)輕松調(diào)用圖形算法。借助 RAPIDS GPU DataFrame,數(shù)據(jù)可以通過一個(gè)類似 Pandas 的接口加載到 GPU 上,然后用于各種連接的機(jī)器學(xué)習(xí)和圖形分析算法,而無需離開 GPU。這種級別的互操作性是通過 Apache Arrow 這樣的庫實(shí)現(xiàn)的。從數(shù)據(jù)準(zhǔn)備到機(jī)器學(xué)習(xí),再到深度學(xué)習(xí),它可加速端到端流程。RAPIDS 和 DASK 使 cuGraph 能夠擴(kuò)展為多個(gè) GPU,支持?jǐn)?shù)十億個(gè)邊緣圖形。
原文標(biāo)題:NVIDIA 大講堂 | 什么是圖形分析?
文章出處:【微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5026瀏覽量
103293 -
gpu
+關(guān)注
關(guān)注
28文章
4754瀏覽量
129093 -
圖形分析
+關(guān)注
關(guān)注
0文章
3瀏覽量
887
原文標(biāo)題:NVIDIA 大講堂 | 什么是圖形分析?
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論