伴隨著圖像處理技術的飛速發(fā)展,推動了圖像識別技術的產生和發(fā)展,并逐漸成為人工智能領域中重要的組成部分,并廣泛地運用于面部識別、指紋識別、醫(yī)療診斷等等領域中,發(fā)揮重要作用。
這也給學生思考課題給了更多的空間,今天小編就來淺談熱門課題方向中圖像識別技術,希望給學生更多的啟發(fā)!
圖像識別技術概述
圖像識別技術的含義
圖像識別是人工智能的一個重要領域,是指利用計算機對圖像進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。一般工業(yè)使用中,采用工業(yè)相機拍攝圖片,然后再利用軟件根據(jù)圖片灰階差做進一步識別處理。
在具體應用實踐中,特別識別除了要弄清識別的對象具有是什么樣的物體外,還應該明確其所在的的位置和姿態(tài)。當前圖像識別已經被廣泛應用到各個領域中,例如交通領域中的車牌號識別、交通標志識別、軍事領域中的飛行物識別、地形勘察、安全領域中的指紋識別、人臉識別等。
圖像識別技術的原理
圖像識別原理主要是需處理具有一定復雜性的信息,處理技術并不是隨意出現(xiàn)在計算機中,主要是根據(jù)一些醫(yī)學研究人員的實踐,結合計算機程序對相關內容模擬并予以實現(xiàn)。該技術的計算機實現(xiàn)與人類對圖像識別的基本原理基本類似,在人類感覺及視覺等方面只是計算機不會受到任何因素的影響。人類不只是結合儲存在腦海中的圖像記憶進行識別,而是利用圖像特征對其分類,再利用各類別特征識別出圖片。計算機也采用同樣的圖像識別原理,采用對圖像重要特征的分類和提取,并有效排除無用的多余特征,進而使圖像識別得以實現(xiàn)。有時計算機對上述特征的提取比較明顯,有時就比較普通,這將對計算機圖像識別的效率產生較大影響。
圖像識別技術的過程
由于圖像識別技術的產生是基于人工智能的基礎上,所以計算機圖像識別的過程與人腦識別圖像的過程大體一致,歸納起來,該過程主要包括4個步驟:
1是獲取信息,主要是指將聲音和光等信息通過傳感器向電信號轉換,也就是對識別對象的基本信息進行獲取,并將其向計算機可識別的信息轉換;
2是信息預處理,主要是指采用去噪、變換及平滑等操作對圖像進行處理,基于此使圖像的重要特點提高;
3是抽取及選擇特征,主要是指在模式識別中,抽取及選擇圖像特征,概括而言就是識別圖像具有種類多樣的特點,如采用一定方式分離,就要識別圖像的特征,獲取特征也被稱為特征抽取;
4是設計分類器及分類決策,其中設計分類器就是根據(jù)訓練對識別規(guī)則進行制定,基于此識別規(guī)則能夠得到特征的主要種類,進而使圖像識別的不斷提高辨識率,此后再通過識別特殊特征,最終實現(xiàn)對圖像的評價和確認。
圖像識別技術的常見形式
首先圖像識別的發(fā)展經歷了三個階段:文字識別、數(shù)字圖像處理與識別、物體識別。
文字識別的研究是從 1950年開始的,一般是識別字母、數(shù)字和符號,從印刷文字識別到手寫文字識別,應用非常廣泛。
數(shù)字圖像處理和識別的研究開始于1965年。數(shù)字圖像與模擬圖像相比具有存儲,傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優(yōu)勢,這些都為圖像識別技術的發(fā)展提供了強大的動力。
物體的識別主要指的是對三維世界的客體及環(huán)境的感知和認識,屬于高級的計算機視覺范疇。它是以數(shù)字圖像處理與識別為基礎的結合人工智能、系統(tǒng)學等學科的研究方向,其研究成果被廣泛應用在各種工業(yè)及探測機器人上。
隨著計算機及信息技術的迅速發(fā)展,圖像識別技術的應用逐漸擴大到諸多領域,尤其是在面部及指紋識別、衛(wèi)星云圖識別及臨床醫(yī)療診斷等多個領域日益發(fā)揮著重要作用。通常圖像識別技術主要是指采用計算機按照既定目標對捕獲的系統(tǒng)前端圖片進行處理,在日常生活中圖像識別技術的應用也十分普遍,比如車牌捕捉、商品條碼識別及手寫識別等。隨著該技術的逐漸發(fā)展并不斷完善,未來將具有更加廣泛的應用領域。
基于神經網(wǎng)絡的圖像識別技術
目前,基于神經網(wǎng)絡的圖像識別是一種比較新型的技術,是以傳統(tǒng)圖像識別方式為基礎,有效融合神經網(wǎng)絡算法。在此,神經網(wǎng)絡主要是指人工神經網(wǎng)絡,換而言之就是本文中的神經網(wǎng)絡不是動物體的神經網(wǎng)絡,而主要是指人類采用人工模擬動物神經網(wǎng)絡方式的一種神經網(wǎng)絡。針對基于神經網(wǎng)絡的圖像識別技術,目前,在基于神經網(wǎng)絡的圖像識別技術中,遺傳算法有效結合 BP 神經網(wǎng)絡是最經典的一種模型,該模型可在諸多領域中進行應用。諸如智能汽車監(jiān)控中采用的拍照識別技術,若有汽車從該位置經過時,檢測設備將產生相應的反應,檢測設備啟動圖像采集裝置,獲取汽車正反面的特征圖像,在對車牌字符進行識別的過程中,就采用了基于神經網(wǎng)絡和模糊匹配的兩類算法。
基于非線性降維的圖像識別技術
采用計算機識別圖像是基于高維形式的一種識別技術,不管原始圖片的分辨率如何,該圖片產生的數(shù)據(jù)通常都具有多維性特征,這在一定程度上增大了計算機識別的難度。為使計算機的圖像識別性能更為高效,采用隨圖像降維方法就是一種最直接而有效的方法。一般情況下,可對降維劃分為非線性降維與線性降維兩類,比如最普遍的線性降維方式就是主成分分與線性奇異分析等,該方式的特點是簡單、理解更容易等,再對數(shù)據(jù)集合采用線性降維方式處理求解的投影圖像使該數(shù)據(jù)集合的低維最優(yōu)。
在信息技術中作為近年來新興的圖像識別技術已廣泛應用于眾多應用領域,隨著信息技術的日新月異,圖像識別技術也得到十分迅猛的發(fā)展。在眾多社會領域中,有效應用圖像識別技術將使社會與經濟價值得到充分發(fā)揮。
小編相信,通過本次的科普,很多同學都對圖像識別有了更深的理解,希望可以拓寬同學們的思路,利用人工智能的圖像識別技術解決更多問題,造福社會,造福世界!
-
計算機
+關注
關注
19文章
7496瀏覽量
88002 -
圖像識別
+關注
關注
9文章
520瀏覽量
38274 -
AI
+關注
關注
87文章
30919瀏覽量
269172
發(fā)布評論請先 登錄
相關推薦
評論