神墓辰东小说,有声小说,殿上欢

NVIDIA 推出的CUDA（計(jì)算統(tǒng)一設(shè)備架構(gòu)）是基于GPU 進(jìn)行通用計(jì)算的開發(fā)平臺(tái)，非常適合大規(guī)模的并行數(shù)據(jù)計(jì)算。在GPU 流處理器架構(gòu)下用CUDA 技術(shù)實(shí)現(xiàn)編碼并行化，并針對(duì)流處理器架構(gòu)特點(diǎn)進(jìn)行內(nèi)存讀寫等方面的優(yōu)化。

本文在此采用CUDA技術(shù)，實(shí)現(xiàn)了計(jì)算機(jī)桌面環(huán)境的多屏幕融合顯示的純軟件拼接系統(tǒng)。該系統(tǒng)不但較以往單一的視頻拼接系統(tǒng)功能更加強(qiáng)大，也較采用分屏器等硬件輔助的融合系統(tǒng)成本更低，適應(yīng)性更強(qiáng)。目前實(shí)驗(yàn)表明，CUDA 技術(shù)在并行處理方面的優(yōu)越性使得該系統(tǒng)畫面實(shí)時(shí)處理快，互動(dòng)展示性好，具有很大的商業(yè)使用前景。

0 引言

近年來隨著大屏幕顯示技術(shù)在各領(lǐng)域應(yīng)用的逐步深入，市場(chǎng)已經(jīng)不滿足單一的影片展示，更多的轉(zhuǎn)向了對(duì)互動(dòng)性更強(qiáng)的計(jì)算機(jī)桌面環(huán)境的融合顯示上來。而目前市場(chǎng)上主流的桌面融合系統(tǒng)，多采用分屏器等硬件輔助設(shè)備，成本高，性能差。

統(tǒng)一計(jì)算架構(gòu)（Compute Unified Device Architect-ure,CUDA）是英偉達(dá)（NVIDIA）公司近年來推出的通用并行計(jì)算架構(gòu)，它以高性能顯卡GPU為硬件依托，采用CPU+GPU的混合計(jì)算極大的提高了大規(guī)模的圖形數(shù)據(jù)實(shí)時(shí)處理效率。本文設(shè)計(jì)的視頻顯示系統(tǒng)，采用CUDA開發(fā)方式實(shí)現(xiàn)了計(jì)算機(jī)桌面圖片的分割計(jì)算、貝塞爾曲線擬合、以及融合圖像計(jì)算等三方面處理。實(shí)時(shí)性高，畫面數(shù)據(jù)計(jì)算理論上精確值1 4 像素，精度好。

1 系統(tǒng)框架設(shè)計(jì)

圖像處理的本質(zhì)是大規(guī)模矩陣運(yùn)算，特別適合并行處理。但CPU 通用計(jì)算很難利用該特性。與此相反，GPU 在并行數(shù)據(jù)運(yùn)算上具有強(qiáng)大的計(jì)算能力，特別適合作運(yùn)算符相同而運(yùn)算數(shù)據(jù)不同的運(yùn)算，當(dāng)執(zhí)行具有高運(yùn)算密度的多數(shù)據(jù)元素時(shí)，內(nèi)存訪問的延遲可以被忽略。CUDA 編程模型將CPU 作為主機(jī)（Host ），GPU作為協(xié)處理器（Coprocessor）或設(shè)備（Device），一個(gè)系統(tǒng)中可以存在多個(gè)設(shè)備。在這個(gè)模型中，CPU 與GPU共同工作，CPU 負(fù)責(zé)邏輯性強(qiáng)的事務(wù)處理和串行計(jì)算，GPU 則專注于執(zhí)行高度線程化的并行處理任務(wù)。

本系統(tǒng)以NVIDIA GeForce GTX470 搭建的計(jì)算平臺(tái)為運(yùn)行環(huán)境，利用顯卡的多頭輸出特性，連接多臺(tái)投影儀組成拼接屏幕陣列，不需要額外增加其他硬件設(shè)備。由于桌面融合顯示系統(tǒng)要處理的圖像數(shù)據(jù)大、實(shí)時(shí)性高的特點(diǎn)，所以本系統(tǒng)的軟件設(shè)計(jì)上則廣泛使用了多CPU并行編程技術(shù)和CUDA并行計(jì)算技術(shù)，針對(duì)每一個(gè)投影設(shè)備的圖像處理和顯示，系統(tǒng)會(huì)分配一個(gè)專門的線程來處理。該線程會(huì)對(duì)應(yīng)固定的CPU和固定的GPU計(jì)算核心，保證多投影設(shè)備完全并行處理，從而避免了其他系統(tǒng)由于顯示設(shè)備增多，處理數(shù)據(jù)變大而造成的性能下降。CUDA架構(gòu)如圖1所示。

本系統(tǒng)在設(shè)計(jì)中，首先設(shè)置定時(shí)器。定期采集控制屏幕圖像信息保存到公共存儲(chǔ)空間，然后針對(duì)外設(shè)顯示設(shè)備個(gè)數(shù)動(dòng)態(tài)的開啟數(shù)個(gè)線程完成圖像的數(shù)據(jù)分割、圖像的數(shù)據(jù)融合以及圖像的顯示等工作。其中在線程開啟初始就與固定的GPU 計(jì)算核心相關(guān)聯(lián)，并把數(shù)據(jù)圖形分割和融合部分采用CUDA技術(shù)進(jìn)行實(shí)現(xiàn)，最后同樣采用定時(shí)器技術(shù)同步各個(gè)線程中圖像數(shù)據(jù)顯示工作。

通常采用貝塞爾曲線擬合方法來完成圖像數(shù)據(jù)的融合。該方法的一般做法是先由控制點(diǎn)得出目標(biāo)圖像每行的貝塞爾曲線，組成二維貝塞爾曲面，再將目標(biāo)圖像數(shù)據(jù)采用貼紋理的方法擬合到貝塞爾曲線上從而實(shí)現(xiàn)圖像變形。Bezier 曲線是法國雷諾汽車公司Bezier 提出的一種用控制多邊形定義曲線和曲面的方法。它的擬合插值公式為：

式中：Pi 為構(gòu)成該曲線的特征多邊形；Bi,n （t）是Bezier基函數(shù)，是曲線上各點(diǎn)位置矢量的調(diào)和函數(shù)。Bezier曲線的始點(diǎn)、末點(diǎn)與其特征多邊形端點(diǎn)重合，且始點(diǎn)、末點(diǎn)的切線方向與特征多邊形的第一和最后一條邊一致。

該曲線具有凸包性、對(duì)稱性等特性。貝塞爾曲線的優(yōu)點(diǎn)是給定足夠的控制點(diǎn)后，它能夠擬合任意形狀的曲線。

Bezier曲線的擬合插值公式中，函數(shù)的次數(shù)是與特征多邊形的頂點(diǎn)數(shù)相應(yīng)的，當(dāng)特征多邊形頂點(diǎn)數(shù)為4時(shí)，就構(gòu)成三次Bezier 曲線。三次Bezier曲線的擬合插值公式為：

OPenGL技術(shù)提供了易于操作的貝塞爾曲線生成函數(shù)和貼圖函數(shù)，但卻無法控制硬件運(yùn)算，效率不高。本系統(tǒng)出于對(duì)時(shí)效性的考慮在實(shí)現(xiàn)過程中并未采用該方法，而是采用CUDA技術(shù)并行矩陣運(yùn)算的方式來進(jìn)行紋理貼圖。根據(jù)CUDA 程序的結(jié)構(gòu)特點(diǎn)，本系統(tǒng)處理時(shí)，首先根據(jù)人機(jī)交互部分得到的控制點(diǎn)信息采用通常方法生成目標(biāo)圖像每行的貝塞爾曲線。開辟顯存存入GPU,然后對(duì)應(yīng)CUDA 程序結(jié)構(gòu)，針對(duì)目標(biāo)圖像上的每一個(gè)像素點(diǎn)，為其分配一個(gè)GPU thread 來進(jìn)行處理。

觀察上面的計(jì)算公式發(fā)現(xiàn)，當(dāng)獲得了初始控制點(diǎn)坐標(biāo)后，在得出每一條貝賽爾曲線上的點(diǎn)的過程中，彼此并不影響，具有多線程的粗粒度的特性，所以CUDA 并行計(jì)算的時(shí)效性有很大的提高。

2 性能評(píng)估

在多媒體拼接系統(tǒng)中實(shí)時(shí)性是最基本、也是最重要的指標(biāo)。我們觀看到的大屏幕拼接動(dòng)態(tài)效果是由一幀一幀圖片快速顯示而產(chǎn)生的。根據(jù)正常的人眼視覺殘留水平系統(tǒng)要達(dá)到顯示流暢的畫面，1 s 要處理至少25 張圖片，也就是說整個(gè)程序一次圖像處理流程不會(huì)超過40 ms.下面本文將分析一下該系統(tǒng)的時(shí)效性。

由于圖像采集部分和處理部分采用的是異步方式，時(shí)間復(fù)用，而顯然處理部分的耗時(shí)又遠(yuǎn)遠(yuǎn)超過采集部分，所以只列出處理部分的時(shí)間消耗，又因?yàn)樵摬糠中手饕茱@卡GPU 性能影響，所以之對(duì)比不同型號(hào)GPU 的時(shí)間消耗情況。具體如表1所示。

由此我們看出采用GeForce8800GT 顯卡可以基本上完成顯示功能，而采用GeForceGTX470則可以每秒鐘顯示35~40張圖片，是用戶完全感覺流暢的視頻體驗(yàn)。

3 結(jié)語

今年來大屏幕對(duì)計(jì)算機(jī)操作演示的需求越來越多，而高性能顯卡的發(fā)展又促使GPU計(jì)算逐漸成為大規(guī)模并行計(jì)算重要的解決途徑。本系統(tǒng)采用了CUDA技術(shù)實(shí)現(xiàn)了視頻拼接系統(tǒng)，目前本系統(tǒng)采用兩個(gè)雙頭顯卡組成顯示功能模塊最多實(shí)現(xiàn)四屏拼接，如果需要更多屏幕拼接顯示時(shí)可以考慮使用網(wǎng)絡(luò)C-S 結(jié)構(gòu)進(jìn)行擴(kuò)展。由于耗時(shí)的圖像處理部分完全有GPU 進(jìn)行計(jì)算，屏幕越多需要計(jì)算的內(nèi)容也隨之增多，而同時(shí)系統(tǒng)顯卡數(shù)量也會(huì)增多，所以該系統(tǒng)不會(huì)隨著拼接屏幕增多而性能下降。由于系統(tǒng)總體采用并行技術(shù)，所以將來可以方便地為系統(tǒng)加入時(shí)下流行的人機(jī)互動(dòng)模塊、真實(shí)感渲染模塊等部分，使之真正成為一款高性能多媒體展示系統(tǒng)，給用戶一個(gè)全方位真實(shí)的體驗(yàn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4989

瀏覽量
103093
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4741

瀏覽量
128963
CUDA

CUDA

+關(guān)注

關(guān)注
0

文章
121

瀏覽量
13631
分屏器

分屏器

+關(guān)注

關(guān)注
0

文章
4

瀏覽量
10753

評(píng)論

相關(guān)推薦

別墅能源管理系統(tǒng)通信設(shè)計(jì)方案

水貨應(yīng)屆畢業(yè)生剛?cè)肼殞?shí)習(xí)，領(lǐng)導(dǎo)要求提出一個(gè)別墅能源管理系統(tǒng)具體的通信方案。系統(tǒng)應(yīng)該包括以下幾個(gè)部分的通信： 1光伏PV 2.逆變器pcs 3.儲(chǔ)能電池，電池能源管理系統(tǒng)BMS 4.電表

發(fā)表于 10-25 14:44

智能家居系統(tǒng)設(shè)計(jì)方案

、安全的生活體驗(yàn)。本案例將詳細(xì)介紹一套智能家居系統(tǒng)的設(shè)計(jì)方案，包括系統(tǒng)架構(gòu)、功能模塊、設(shè)備選型、應(yīng)用場(chǎng)景以及實(shí)施步驟等方面。

發(fā)表于 07-23 15:28 ?1852次閱讀

打破英偉達(dá)CUDA壁壘？AMD顯卡現(xiàn)在也能無縫適配CUDA了

、英特爾等廠商雖然在努力追趕，但目前還未能看到有威脅英偉達(dá)地位的可能。 ? 最近一家英國公司Spectral Compute推出了一款方案，可以為AMD的GPU原生編譯CUDA源代碼，目前正在RNDA2、RDNA3上進(jìn)行規(guī)模測(cè)試。這或許可以打破

發(fā)表于 07-19 00:16 ?4723次閱讀

復(fù)雜電磁環(huán)境模擬系統(tǒng)設(shè)計(jì)方案

智慧華盛恒輝復(fù)雜電磁環(huán)境模擬系統(tǒng)的設(shè)計(jì)方案是一個(gè)綜合性的工程任務(wù)，涉及多個(gè)方面的考慮和技術(shù)實(shí)現(xiàn)。以下是一個(gè)基于現(xiàn)有技術(shù)和應(yīng)用需求的設(shè)計(jì)方案概

發(fā)表于 07-17 17:06 ?436次閱讀

電磁頻譜數(shù)據(jù)綜合管理系統(tǒng)設(shè)計(jì)方案

智慧華盛恒輝電磁頻譜數(shù)據(jù)綜合管理系統(tǒng)的設(shè)計(jì)方案是一個(gè)復(fù)雜且精細(xì)的過程，旨在實(shí)現(xiàn)對(duì)無線電頻譜資源的全面監(jiān)控、分析和管理。以下是一個(gè)基于當(dāng)前技術(shù)和應(yīng)用需求的設(shè)計(jì)方案概述：智慧華盛恒輝

發(fā)表于 07-15 17:19 ?511次閱讀

電磁頻譜管理系統(tǒng)設(shè)計(jì)方案

智慧華盛恒輝電磁頻譜管理系統(tǒng)設(shè)計(jì)方案是一個(gè)綜合性的項(xiàng)目，旨在有效地管理和利用電磁頻譜資源，確保各種無線通信服務(wù)的順暢進(jìn)行，并避免頻譜資源的沖突和浪費(fèi)。以下是一個(gè)基于當(dāng)前技術(shù)和應(yīng)用需求的電磁頻譜管理

發(fā)表于 07-15 16:40 ?483次閱讀

電磁軌跡預(yù)測(cè)分析系統(tǒng)設(shè)計(jì)方案

智慧華盛恒輝電磁軌跡預(yù)測(cè)分析系統(tǒng)的設(shè)計(jì)方案是一個(gè)綜合性的項(xiàng)目，它結(jié)合了電磁學(xué)、運(yùn)動(dòng)學(xué)、數(shù)據(jù)分析以及可能的人工智能或機(jī)器學(xué)習(xí)技術(shù)，以實(shí)現(xiàn)對(duì)電磁運(yùn)動(dòng)軌跡的精確預(yù)測(cè)和深入分析。以下是一個(gè)基于當(dāng)前技術(shù)

發(fā)表于 07-15 16:22 ?410次閱讀

工廠視頻智能分析系統(tǒng)解決方案 TensorFlow

工廠視頻智能分析系統(tǒng)解決方案通過安裝在工廠生產(chǎn)施工作業(yè)現(xiàn)場(chǎng)的各個(gè)監(jiān)控裝置，構(gòu)建智能監(jiān)控分析預(yù)警和防范體系，工廠視頻智能分析系統(tǒng)解決

發(fā)表于 07-03 22:48 ?316次閱讀

UPS系統(tǒng)設(shè)計(jì)方案解讀

UPS的應(yīng)用場(chǎng)景日趨多樣化，每個(gè)場(chǎng)景都有其獨(dú)特的需求，對(duì)應(yīng)不同的方案。UPS系統(tǒng)方案指南繼續(xù)上新，本文將聚焦UPS設(shè)計(jì)方案展開講述。

發(fā)表于 06-26 10:06 ?795次閱讀

光伏儲(chǔ)能系統(tǒng)設(shè)計(jì)方案

使用。本文旨在詳細(xì)闡述一個(gè)光伏儲(chǔ)能系統(tǒng)的設(shè)計(jì)方案，包括系統(tǒng)概述、系統(tǒng)組成、設(shè)計(jì)原則、關(guān)鍵技術(shù)、設(shè)計(jì)步驟和預(yù)期效果等方面。

發(fā)表于 05-17 16:36 ?1320次閱讀

Keil使用AC6編譯提示CUDA版本過高怎么解決？

\' ArmClang: warning: Unknown CUDA version 10.2. Assuming the latest supported version 10.1

發(fā)表于 04-11 07:56

LED顯示屏設(shè)計(jì)方案

1、LED顯示屏基礎(chǔ)知識(shí)2、LED顯示屏設(shè)計(jì)要素3、LED顯示屏驅(qū)動(dòng)方案4、LED顯示屏控制系統(tǒng)

發(fā)表于 04-03 17:21 ?12次下載

基于 PCIe 的多路視頻采集與顯示子系統(tǒng)介紹

電子發(fā)燒友網(wǎng)站提供《基于 PCIe 的多路視頻采集與顯示子系統(tǒng)介紹.pdf》資料免費(fèi)下載

發(fā)表于 02-23 09:47 ?0次下載

V4L2視頻采集，基于PCIe的多路視頻采集與顯示子系統(tǒng)

視頻采集與顯示子系統(tǒng)可以實(shí)時(shí)采集多路視頻信號(hào)，并存儲(chǔ)到視頻采集隊(duì)列中，借助高效的硬實(shí)時(shí)視頻幀出入

發(fā)表于 02-22 20:05 ?968次閱讀

諾瓦星云成功上市，專注LED顯示控制及視頻處理技術(shù)

近日，主營LED顯示控制系統(tǒng)及視頻處理系統(tǒng)產(chǎn)品研發(fā)、生產(chǎn)和銷售的諾瓦星云，在深圳證券交易所成功上市。這家自2008年成立的公司，長期專注于視頻

發(fā)表于 02-18 11:17 ?950次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

基于CUDA技術(shù)的視頻顯示系統(tǒng)設(shè)計(jì)方案

評(píng)論

別墅能源管理系統(tǒng)通信設(shè)計(jì)方案

智能家居系統(tǒng)設(shè)計(jì)方案

打破英偉達(dá)CUDA壁壘？AMD顯卡現(xiàn)在也能無縫適配CUDA了

復(fù)雜電磁環(huán)境模擬系統(tǒng)設(shè)計(jì)方案

電磁頻譜數(shù)據(jù)綜合管理系統(tǒng)設(shè)計(jì)方案

電磁頻譜管理系統(tǒng)設(shè)計(jì)方案

電磁軌跡預(yù)測(cè)分析系統(tǒng)設(shè)計(jì)方案

工廠視頻智能分析系統(tǒng)解決方案 TensorFlow

UPS系統(tǒng)設(shè)計(jì)方案解讀

光伏儲(chǔ)能系統(tǒng)設(shè)計(jì)方案

Keil使用AC6編譯提示CUDA版本過高怎么解決？

LED顯示屏設(shè)計(jì)方案

基于 PCIe 的多路視頻采集與顯示子系統(tǒng)介紹

V4L2視頻采集，基于PCIe的多路視頻采集與顯示子系統(tǒng)

諾瓦星云成功上市，專注LED顯示控制及視頻處理技術(shù)