在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA GPUs上命令緩沖區(qū)的應(yīng)用實踐

星星科技指導員 ? 來源:NVIDIA ? 作者:Wessam Bahnassi ? 2022-04-15 17:05 ? 次閱讀

這篇文章介紹了 NVIDIA GPUs 上命令緩沖區(qū)的最佳實踐。要在應(yīng)用程序中獲得高且一致的幀速率,請參閱所有高級 API 性能提示。

命令緩沖區(qū)是從 CPU 發(fā)送要在 GPU 上執(zhí)行的命令的主要機制。通過遵循本文列出的最佳實踐,您可以通過最大化并行性、避免瓶頸和減少 GPU 上的空閑時間,在 CPU 和 GPU 上實現(xiàn)性能提升。

推薦

接受您負責實現(xiàn)和控制 GPU / CPU 并行性的事實。

向命令列表提交工作不會啟動 GPU 上的任何工作。

對ExecuteCommandList的調(diào)用最終在 GPU 上開始工作。

在多個線程和內(nèi)核上并行并均勻地將工作記錄到多個命令列表中。

錄制命令是一項 CPU 密集型操作,沒有驅(qū)動程序線程來拯救。

命令列表不是自由線程,因此并行工作提交意味著提交多個命令列表。

請注意,設(shè)置和重置命令列表會帶來成本。

為了高效地提交并行工作,您仍然需要合理數(shù)量的命令列表。

圍欄出于各種原因(多個命令隊列、拾取查詢結(jié)果等)強制拆分命令列表。

嘗試將目標設(shè)定為每幀 5-10 次ExecuteCommandList調(diào)用,并進行足夠的 GPU 工作,以隱藏每次ExecuteCommandList調(diào)用的操作系統(tǒng)調(diào)度開銷。

在上一次ExecuteCommandList調(diào)用之后,操作系統(tǒng)需要 50-80 微秒來安排命令列表。如果調(diào)用中的命令列表執(zhí)行速度快于此,則硬件隊列中存在氣泡。

使用GPUView檢查氣泡。

您可以將 3D 隊列上的圖形或計算工作與專用異步計算隊列上的計算工作重疊。

請記住,即使對于理論上可以與其他圖形或計算任務(wù)并行運行的計算任務(wù), GPU 上并行工作的實際調(diào)度細節(jié)也可能不會產(chǎn)生期望的結(jié)果。

注意哪些異步計算和圖形工作負載可以一起調(diào)度。使用圍欄將正確的工作負載配對。

使用ExecuteIndirect靈活性最大限度地將 CPU 工作卸載到 GPU 并減少 CPU – GPU 同步點。

請使用ExecuteIndirect將場景消隱系統(tǒng)移植到 GPU 。

使用ExecuteIndirect計數(shù)緩沖區(qū)來控制命令的數(shù)量,而不是發(fā)出最大數(shù)量的命令并單獨預測未使用的命令。

NVIDIA 在ExecuteIndirect的Vulkan下為ExecuteIndirect提供附加功能

不推薦

幀描述符堆中的 CBV / SRV / UAV 描述符或 2K 采樣器不要超過 100 萬個。

不要阻止ExecuteCommandList呼叫。

ExecuteCommandList打電話可能會很貴。同時,可以在其他線程上記錄新命令。

每個命令隊列都可以使用自己的線程來提交ExecuteCommandList。

不要只在幾個命令列表中記錄所有內(nèi)容或大型場景部分。這限制了您充分使用所有 CPU 內(nèi)核的能力。

此外,構(gòu)建幾個大的命令列表意味著您可能會發(fā)現(xiàn)很難讓 GPU 保持空閑狀態(tài)。

不要只在錄制完所有內(nèi)容后才提交。您可能會浪費使 GPU 與其他命令列表的錄制并行工作的機會。

不要期望大量的列表重用。

在對象可見性等方面,每幀通常有許多更改。

后處理可能是一個例外。

不要經(jīng)常混合使用繪圖、分派和復制命令。

嘗試將所有繪制命令組合在一起,并將命令分派到一起,依此類推。

在同一隊列上頻繁混合不同類型的工作可能會導致管道排水。

不要創(chuàng)建太多線程或太多命令列表。

太多的線程超額訂閱 CPU 資源,而太多的命令列表可能會積累太多的開銷。

關(guān)于作者

Wessam Bahnassi 在 3D 引擎設(shè)計和優(yōu)化方面有 20 年的經(jīng)驗。他最新發(fā)布的游戲包括《蝙蝠俠:阿卡姆騎士》和他自己的 120-FPS PSVR 太空射擊游戲超空。他是 ShaderX / GPU Pro / GPU Zen 系列書籍的撰稿人和章節(jié)編輯。他目前在 NVIDIA 的工作包括進行優(yōu)化,并為該公司的幾個很酷的研究項目做出貢獻。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10883

    瀏覽量

    212305
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5038

    瀏覽量

    103305
收藏 人收藏

    評論

    相關(guān)推薦

    AMD Zen 4處理器悄然禁用循環(huán)緩沖區(qū)

    近日,AMD在更新BIOS后,對Zen 4架構(gòu)的處理器進行了一項未公開說明的更改:禁用了循環(huán)緩沖區(qū)(Loop Buffer)功能。這一變化引發(fā)了業(yè)界和用戶的廣泛關(guān)注。 循環(huán)緩沖區(qū)作為CPU前端的一個
    的頭像 發(fā)表于 12-11 13:46 ?217次閱讀

    分享一個嵌入式通用FIFO環(huán)形緩沖區(qū)實現(xiàn)庫

    開源項目ringbuff ,是一款通用FIFO環(huán)形緩沖區(qū)實現(xiàn)的開源庫,作者MaJerle,遵循 MIT 開源許可協(xié)議。
    的頭像 發(fā)表于 10-23 16:20 ?474次閱讀
    分享一個嵌入式通用FIFO環(huán)形<b class='flag-5'>緩沖區(qū)</b>實現(xiàn)庫

    內(nèi)存緩沖區(qū)和內(nèi)存的關(guān)系

    內(nèi)存緩沖區(qū)和內(nèi)存之間的關(guān)系是計算機體系結(jié)構(gòu)中一個至關(guān)重要的方面,它們共同協(xié)作以提高數(shù)據(jù)處理的效率和系統(tǒng)的整體性能。
    的頭像 發(fā)表于 09-10 14:38 ?651次閱讀

    單片機中的幾種環(huán)形緩沖區(qū)的分析和實現(xiàn)

    單片機中的幾種環(huán)形緩沖區(qū)的分析和實現(xiàn)一、簡介環(huán)形緩沖區(qū)(RingBuffer)是一種高效的使用內(nèi)存的方法,它將一段固定長度的內(nèi)存看成一個環(huán)形結(jié)構(gòu),用于存儲數(shù)據(jù),能夠避免使用動態(tài)申請內(nèi)存導致的內(nèi)存碎片
    的頭像 發(fā)表于 08-14 08:39 ?974次閱讀
    單片機中的幾種環(huán)形<b class='flag-5'>緩沖區(qū)</b>的分析和實現(xiàn)

    ESP8266是否可以添加AT命令并使接收緩沖區(qū)大小可調(diào)?

    是否可以添加 AT 命令并使接收緩沖區(qū)大小可調(diào)? 在Arduino,我總是丟棄數(shù)據(jù)字節(jié),而arduino硬件串行只有64字節(jié)的緩沖區(qū),看起來ESP8266有256個字節(jié)。
    發(fā)表于 07-17 07:36

    ESP8266有雙緩沖區(qū)嗎?

    我想實時傳輸一些信號的測量數(shù)據(jù)。信號的采樣周期為 1 ms。我想每 500 毫秒發(fā)送 2048 字節(jié)(一個數(shù)據(jù)包)。ESP8266有雙緩沖區(qū)(2x 2048字節(jié))嗎?其想法是計數(shù)填充一個緩沖區(qū)(周期
    發(fā)表于 07-16 07:29

    創(chuàng)建DMA通道時,能否將DMA緩沖區(qū)的大小指定為8字節(jié),并將DMA緩沖區(qū)的編號指定為1?

    創(chuàng)建 DMA 通道時,能否將 DMA 緩沖區(qū)的大小指定為 8 字節(jié),并將 DMA 緩沖區(qū)的編號指定為 1?
    發(fā)表于 05-31 07:46

    stm32野火開發(fā)板做USB通信,PC端USB的緩沖區(qū)和串口緩沖區(qū)的大小是多少?

    stm32野火開發(fā)板做USB通信,用的CDC虛擬串口。 stm32端將ADC采集的數(shù)據(jù)通過USB傳給電腦,傳輸速率理論是12Mbps,上位機是從PC端的串口緩沖區(qū)拿數(shù)據(jù),用C#編寫的上位機將
    發(fā)表于 05-17 14:02

    具有八進制反相緩沖區(qū)的掃描測試設(shè)備數(shù)據(jù)表

    電子發(fā)燒友網(wǎng)站提供《具有八進制反相緩沖區(qū)的掃描測試設(shè)備數(shù)據(jù)表.pdf》資料免費下載
    發(fā)表于 05-17 09:58 ?0次下載
    具有八進制反相<b class='flag-5'>緩沖區(qū)</b>的掃描測試設(shè)備數(shù)據(jù)表

    實現(xiàn)穩(wěn)健的微控制器到FPGA SPI接口: 雙緩沖區(qū)

    在介紹雙緩沖器之前,我們將簡要探討Verilog 脈寬調(diào)制器 (PWM) 的工作原理。這一點很重要,因為雙緩沖區(qū)最好被看作是硬件模塊 (如 PWM) 的可尋址接口。
    的頭像 發(fā)表于 05-16 09:36 ?749次閱讀
    實現(xiàn)穩(wěn)健的微控制器到FPGA SPI接口: 雙<b class='flag-5'>緩沖區(qū)</b>!

    Stm32采用環(huán)形緩沖區(qū)接收rk3588的數(shù)據(jù)代碼

    Stm32采用環(huán)形緩沖區(qū)接收rk3588的數(shù)據(jù)代碼
    的頭像 發(fā)表于 05-15 10:10 ?640次閱讀

    交換機與路由器緩沖區(qū):尋找完美大小

    學術(shù)界和工業(yè)界一直備受爭議。本文探討了高端路由器中數(shù)據(jù)包緩沖的歷史和演變,以期概述當前的實踐和未來的趨勢。 網(wǎng)絡(luò)芯片中的緩沖區(qū) 在典型的路由器/交換機 ASIC 中,會發(fā)現(xiàn)三種類型的數(shù)據(jù)包緩沖
    的頭像 發(fā)表于 04-11 16:56 ?1399次閱讀
    交換機與路由器<b class='flag-5'>緩沖區(qū)</b>:尋找完美大小

    交換芯片緩沖區(qū)大小是什么

    交換芯片緩沖區(qū)大小并不一定是固定的。緩沖區(qū)的設(shè)計和實現(xiàn)會根據(jù)芯片的具體型號、規(guī)格以及應(yīng)用場景的不同而有所差異。一些交換芯片可能具有固定大小的緩沖區(qū),以滿足特定的性能需求或成本限制。然而,隨著技術(shù)
    的頭像 發(fā)表于 03-18 14:42 ?659次閱讀

    使用UART FIFO緩沖區(qū)時,緩沖區(qū)中的數(shù)據(jù)有時會損壞的原因?

    我在使用 UART FIFO 緩沖區(qū)時遇到了以下問題。 問題描述: 當通過兩個 UART 通道使用完整的 UART FIFO 緩沖區(qū)并通過兩個通道進行通信時,緩沖區(qū)中的數(shù)據(jù)有時會損壞,例如,UART
    發(fā)表于 03-06 06:59

    沒有辦法通過FX3固件檢查緩沖區(qū)是卡住了還是已滿?

    我正在嘗試通過多通道 DMA 緩沖區(qū)直播 1080p60 視頻,但是我們遇到了一個問題,即在向 FX3 寫入一定數(shù)量的緩沖區(qū)之后,我們看到當前線程 WATERMARK 和 READY 標志保持不變
    發(fā)表于 02-23 08:01
    主站蜘蛛池模板: 国产高清在线观看| 亚洲天堂.com| 免费在线看视频| 日本精品一卡二卡≡卡四卡| 天堂资源| 日韩亚洲人成网站在线播放| 双性强迫开宫灌满h| 久草资源网| 久操视频免费观看| 91精品久久久久含羞草| xxxx69日本| 免费视频观看| 男人j桶进女人j的视频| 欧美三级黄色| 波多野结衣的毛片| 免费又黄又爽的禁片视频| 在线播放国产不卡免费视频| 久久51| 成人免费视频一区| 天天综合五月天| 亚洲免费一级片| 91p0rn永久备用地址二| 岛国片欧美一级毛片| 天天做夜夜爱| 久热精品在线视频| 黄色录像大全| 欧美精品区| 2021天天躁狠狠燥| 伊人久久大香线蕉综合影| 五月四房婷婷| 天堂bt资源在线官网| 日本经典在线三级视频| 国产农村女人一级毛片了| 黄色免费在线网站| 美女拍拍拍黄色| 美日韩一级| 91网视频在线观看| 小屁孩cao大人免费网站| 久久国产乱子伦精品免费看| 69日本xxxxxxxxx98| 天堂伊人|