在異構(gòu)計(jì)算架構(gòu)中,GPU與CPU通過PCIe總線連接在一起來協(xié)同工作,CPU所在位置稱為為主機(jī)端(host),而GPU所在位置稱為設(shè)備端(device),兩者優(yōu)勢互補(bǔ)。
CUDA作為GPU的編程模型,提供了對其他編程語言的支持,例如常用的C/C++,Python等。
下面在windows系統(tǒng)下,使用VS2022對GPU進(jìn)行CUDA編程。
開始之前你需要準(zhǔn)備的硬件是:一塊GPU顯卡。并假設(shè)你已經(jīng)提前安裝了VS2022,而且具備一定的軟件編程經(jīng)驗(yàn)。
安裝CUDA
首先進(jìn)行CUDA編程模型的安裝,根據(jù)自己的系統(tǒng)情況到CUDA官網(wǎng)下載安裝包。下載完成后進(jìn)行安裝,過程很簡單。
安裝完成后,“win+R”輸入cmd打開終端后輸入:nvcc -V,檢驗(yàn)安裝是否成功。
若需要下載以前的版本,你還可以點(diǎn)擊查看你需要下載的CUDA版本:
創(chuàng)建VS2022項(xiàng)目
CUDA安裝完成后,打開VS2022創(chuàng)建新項(xiàng)目,選擇CUDA runtime。
新建完成后有一個簡單的例程,直接進(jìn)行調(diào)試即可看到下面的結(jié)果:
在CUDA中,用host指代CPU及其內(nèi)存,用device指代GPU及其內(nèi)存。
CUDA程序既包含host程序,又包含device程序,它們分別在CPU和GPU上運(yùn)行。
同時,host與device之間可以進(jìn)行數(shù)據(jù)拷貝。
在CUDA中是通過函數(shù)類型限定詞開區(qū)別host和device上的函數(shù),主要的三個函數(shù)類型限定詞如下:
__global__:在device上執(zhí)行,從host中調(diào)用(一些特定的GPU也可以從device上調(diào)用),返回類型必須是void,不支持可變參數(shù),不能成為類成員函數(shù)。
注意用__global__定義的kernel是異步的,這意味著host不會等待kernel執(zhí)行完就執(zhí)行下一步。
__device__:在device上執(zhí)行,僅可以從device中調(diào)用,不可以和__global__同時用。
__host__:在host上執(zhí)行,僅可以從host上調(diào)用,一般省略不寫,不可以和__global__同時用,但可和__device__,此時函數(shù)會在device和host都編譯。
該例程雖然簡單,也反映了典型的CUDA程序流程:
分配host內(nèi)存,并進(jìn)行數(shù)據(jù)初始化;
分配device內(nèi)存,并從host將數(shù)據(jù)拷貝到device上;
在device上調(diào)用CUDA的核函數(shù)(kernel)完成進(jìn)行并行計(jì)算;
將device上的運(yùn)算結(jié)果拷貝到host上;
釋放device和host上分配的內(nèi)存。
其中,kernel是在device上線程中并行執(zhí)行的函數(shù),核函數(shù)用__global__符號聲明,在調(diào)用時需要用<<
審核編輯:劉清
-
PCIE總線
+關(guān)注
關(guān)注
0文章
58瀏覽量
13381 -
python
+關(guān)注
關(guān)注
56文章
4797瀏覽量
84711 -
CUDA
+關(guān)注
關(guān)注
0文章
121瀏覽量
13631
原文標(biāo)題:安裝CUDA,并使用VS2022開始CUDA編程
文章出處:【微信號:雷達(dá)通信電子戰(zhàn),微信公眾號:雷達(dá)通信電子戰(zhàn)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論