計算機(jī)視覺與人工智能的關(guān)系
計算機(jī)視覺顧名思義,就是讓計算機(jī)具備像人眼一樣觀察和識別的能力,更進(jìn)一步的說,就是指用攝像機(jī)和電腦代替人眼對目標(biāo)進(jìn)行識別、跟蹤和測量,并進(jìn)一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。
作為一個科學(xué)學(xué)科,計算機(jī)視覺研究相關(guān)的理論和技術(shù),試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取“信息”的人工智能系統(tǒng)。計算機(jī)視覺目前還主要停留在圖像信息表達(dá)和物體識別階段,人工智能更強調(diào)推理和決策。
人工智能與計算機(jī)視覺是什么關(guān)系?
第一,它是一個人工智能需要解決的很重要的問題;
第二,它是目前人工智能的很強的驅(qū)動力。因為它有很多應(yīng)用,很多技術(shù)是從計算機(jī)視覺誕生出來以后,再反運用到AI領(lǐng)域中去;
第三,計算機(jī)視覺擁有大量的量子AI的應(yīng)用基礎(chǔ)。
圖像處理、計算機(jī)視覺和模式識別領(lǐng)域的區(qū)別和聯(lián)系
一、區(qū)別
1.數(shù)字圖像處理(Digital Image Processing)
數(shù)字圖像處理是對已有的圖像進(jìn)行變換、分析、重構(gòu),得到的仍是圖像。
Digital Image Processing,簡稱 DIP。輸入的是圖像,輸出的也是圖像。Photoshop中對一副圖像應(yīng)用濾鏡就是典型的一種圖像處理。常見操作有模糊、灰度化、增強對比度等。
圖像處理,這個主要針對圖像圖像的基本處理,如圖像檢索或則圖像識別,壓縮,復(fù)原等等操作。機(jī)器視覺技術(shù)其實就是工業(yè)數(shù)字圖像處理。
2.計算機(jī)圖形學(xué)(Computer Graphics)
計算機(jī)圖形學(xué)是給定關(guān)于景象結(jié)構(gòu)、表面反射特性、光源配置及相機(jī)模型的信息,生成圖像。
圖形學(xué)講的是圖形,也就是圖形的構(gòu)造方式,是一種從無到有的概念,從數(shù)據(jù)得到圖像。
Computer Graphics,簡稱 CG 。輸入的是對虛擬場景的描述,通常為多邊形數(shù)組,而每個多邊形由三個頂點組成,每個頂點包括三維坐標(biāo)、貼圖坐標(biāo)、rgb顏色等。輸出的是圖像,即二維像素數(shù)組。
計算機(jī)圖形學(xué),主要涉及圖形成像及游戲類開發(fā),如opengl等,還有就是視頻渲染等。
3.計算機(jī)視覺(Computer Vision)
計算機(jī)視覺是給定圖像,推斷景象特性實現(xiàn)的是從模型到圖像的變換,也就是說從圖像數(shù)據(jù)提取信息,包括景象的三維結(jié)構(gòu),運動檢測,識別物體等。
Computer Vision,簡稱 CV。輸入的是圖像或圖像序列,通常來自相機(jī)或usb攝像頭。輸出的是對于圖像序列對應(yīng)的真實世界的理解,比如檢測人臉、識別車牌。
計算機(jī)視覺,里面人工智能的東西更多一些,不僅僅是圖像處理的知識,還涵蓋了人工智能,機(jī)器學(xué)習(xí)等領(lǐng)域知識
4.模式識別(Pattern Recognition)
模式識別則是從特征空間到類別空間的變換。研究內(nèi)容包括特征提取(PCA,LDA,LFA,Kernel,Mean Shift,SIFT,ISOMAP,LLE);特征選擇;分類器設(shè)計(SVM,AdaBoost)等。
PR(模式識別)本質(zhì)就是分類,根據(jù)常識或樣本或二者結(jié)合進(jìn)行分類,可以對圖像進(jìn)行分類,從圖像得到數(shù)據(jù)。
二、聯(lián)系
計算機(jī)圖形學(xué)是計算機(jī)視覺的逆問題,兩者從最初相互獨立的平行發(fā)展到最近的融合是一大趨勢。圖像模式的分類是計算機(jī)視覺中的一個重要問題,模式識別中的許多方法可以應(yīng)用于計算機(jī)視覺中。
Computer Graphics和Computer Vision是同一過程的兩個方向。Computer Graphics將抽象的語義信息轉(zhuǎn)化成圖像,Computer Vision從圖像中提取抽象的語義信息。Image Processing探索的是從一個圖像或者一組圖像之間的互相轉(zhuǎn)化和關(guān)系,與語義信息無關(guān)。
CG 中也會用到 DIP,現(xiàn)今的三維游戲為了增加表現(xiàn)力都會疊加全屏的后期特效,原理就是 DIP,只是將計算量放在了顯卡端。
CV 更是大量依賴 DIP 來打雜活,比如對需要識別的照片進(jìn)行預(yù)處理。
最后還要提到近年來的熱點——增強現(xiàn)實(AR),它既需要 CG,又需要 CV,當(dāng)然也不會漏掉 DIP。它用 DIP 進(jìn)行預(yù)處理,用 CV 進(jìn)行跟蹤物體的識別與姿態(tài)獲取,用 CG 進(jìn)行虛擬三維物體的疊加。
-
圖像處理
+關(guān)注
關(guān)注
27文章
1292瀏覽量
56764 -
模式識別
+關(guān)注
關(guān)注
3文章
45瀏覽量
14337 -
人工智能
+關(guān)注
關(guān)注
1791文章
47314瀏覽量
238648 -
計算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1698瀏覽量
46005
發(fā)布評論請先 登錄
相關(guān)推薦
評論