NVIDIA 發(fā)布了最新的 NSight 計(jì)算 2021.3,它具有用于測(cè)量和建模占用率、源代碼和匯編代碼相關(guān)性的新功能,以及用于識(shí)別訪問(wèn)緩存造成的瓶頸的分層屋頂線模型。
占用率計(jì)算器
NSight Compute 2021. 3 添加了一個(gè)新的占用率計(jì)算器活動(dòng),幫助您了解內(nèi)核的硬件資源利用率,并建模調(diào)整如何影響占用率。
占用率是每個(gè) SM 的活動(dòng)扭曲與活動(dòng)扭曲理論最大數(shù)量的比率。占用率低可能表示內(nèi)核太小、工作負(fù)載不平衡或資源爭(zhēng)用。所有這些都會(huì)限制 GPU 上具有特定可用資源集的內(nèi)核的性能。
圖 1 NSight 計(jì)算占用計(jì)算器的顯示
命令行源頁(yè)面
此版本添加了一個(gè)高要求的功能,允許直接從命令行從 GUI 中的源頁(yè)面訪問(wèn)信息。通過(guò)使用--page source標(biāo)志,用戶可以在命令行上看到源代碼行、 PTX 行或程序集行以及這些行的收集指標(biāo)。
在分析收集的數(shù)據(jù)以及編寫(xiě)腳本和后期處理結(jié)果以進(jìn)行進(jìn)一步報(bào)告和分析時(shí),此功能提供了額外的靈活性。
圖 2 命令行源輸出功能的示例。
分層屋頂線
屋頂線圖表現(xiàn)在支持分層屋頂線,除了設(shè)備內(nèi)存之外,還為 L1 和 L2 緩存添加屋頂線。您可以查看它們的內(nèi)核與每個(gè)內(nèi)存級(jí)別的帶寬限制有多接近,以確定它們的內(nèi)核是否存在與訪問(wèn)內(nèi)存相關(guān)的瓶頸。
圖 3 NSight 計(jì)算顯示屋頂線層次結(jié)構(gòu)比較。
其他增強(qiáng)功能
進(jìn)一步的功能包括更多可配置的基線比較、從 CLI 直接訪問(wèn)源代碼級(jí)信息以及附加的 SSH 功能。
關(guān)于作者
Jackson Marusarz 是 NVIDIA 計(jì)算開(kāi)發(fā)工具的產(chǎn)品經(jīng)理。他關(guān)注如何使用工具使所有開(kāi)發(fā)人員能夠輕松高效地評(píng)測(cè)、調(diào)試和優(yōu)化 CUDA 代碼。杰克遜擁有 Boulder 科羅拉多大學(xué)計(jì)算機(jī)工程碩士學(xué)位。
Chaitrali Joshi 是 NVIDIA 的產(chǎn)品營(yíng)銷經(jīng)理,專注于電信 5G 系統(tǒng)的設(shè)計(jì)和開(kāi)發(fā)。她對(duì)網(wǎng)絡(luò)空間有著深入的了解,是移動(dòng)通信系統(tǒng)和云棧方面的專家。在英特爾之前,她是一名領(lǐng)導(dǎo),向開(kāi)發(fā)人員宣傳電信技術(shù)和邊緣計(jì)算技術(shù)。她獲得了加利福尼亞大學(xué)計(jì)算機(jī)科學(xué)碩士學(xué)位,戴維斯專注于軟件定義的網(wǎng)絡(luò)和多址邊緣計(jì)算( MEC )。
審核編輯:郭婷
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5026瀏覽量
103294 -
內(nèi)存
+關(guān)注
關(guān)注
8文章
3037瀏覽量
74157 -
計(jì)算器
+關(guān)注
關(guān)注
16文章
437瀏覽量
37398
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論