圖像識別技術是信息時代的一門重要的技術,其產生目的是為了讓計算機代替人類去處理大量的物理信息。隨著計算機技術的發展,人類對圖像識別技術的認識越來越深刻。圖像識別技術的過程分為信息的獲取、預處理、特征抽取和選擇、分類器設計和分類決策。簡單分析了圖像識別技術的引入、其技術原理以及模式識別等,之后介紹了神經網絡的圖像識別技術和非線性降維的圖像識別技術及圖像識別技術的應用。從中可以總結出圖像處理技術的應用廣泛,人類的生活將無法離開圖像識別技術,研究圖像識別技術具有重大意義。
1、圖像識別技術的引入
圖像識別是人工智能的一個重要領域。圖像識別的發展經歷了三個階段:文字識別、數字圖像處理與識別、物體識別。圖像識別,顧名思義,就是對圖像做出各種處理、分析,最終識別我們所要研究的目標。今天所指的圖像識別并不僅僅是用人類的肉眼,而是借助計算機技術進行識別。雖然人類的識別能力很強大,但是對于高速發展的社會,人類自身識別能力已經滿足不了我們的需求,于是就產生了基于計算機的圖像識別技術。這就像人類研究生物細胞,完全靠肉眼觀察細胞是不現實的,這樣自然就產生了顯微鏡等用于精確觀測的儀器。通常一個領域有固有技術無法解決的需求時,就會產生相應的新技術。圖像識別技術也是如此,此技術的產生就是為了讓計算機代替人類去處理大量的物理信息,解決人類無法識別或者識別率特別低的信息。
1.1 圖像識別技術原理
其實,圖像識別技術背后的原理并不是很難,只是其要處理的信息比較繁瑣。計算機的任何處理技術都不是憑空產生的,它都是學者們從生活實踐中得到啟發而利用程序將其模擬實現的。計算機的圖像識別技術和人類的圖像識別在原理上并沒有本質的區別,只是機器缺少人類在感覺與視覺差上的影響罷了。人類的圖像識別也不單單是憑借整個圖像存儲在腦海中的記憶來識別的,我們識別圖像都是依靠圖像所具有的本身特征而先將這些圖像分了類,然后通過各個類別所具有的特征將圖像識別出來的,只是很多時候我們沒有意識到這一點。當看到一張圖片時,我們的大腦會迅速感應到是否見過此圖片或與其相似的圖片。其實在“看到”與“感應到”的中間經歷了一個迅速識別過程,這個識別的過程和搜索有些類似。在這個過程中,我們的大腦會根據存儲記憶中已經分好的類別進行識別,查看是否有與該圖像具有相同或類似特征的存儲記憶,從而識別出是否見過該圖像。機器的圖像識別技術也是如此,通過分類并提取重要特征而排除多余的信息來識別圖像。機器所提取出的這些特征有時會非常明顯,有時又是很普通,這在很大的程度上影響了機器識別的速率。總之,在計算機的視覺識別中,圖像的內容通常是用圖像特征進行描述。
1.2 模式識別
模式識別是人工智能和信息科學的重要組成部分。模式識別是指對表示事物或現象的不同形式的信息做分析和處理從而得到一個對事物或現象做出描述、辨認和分類等的過程。
計算機的圖像識別技術就是模擬人類的圖像識別過程。在圖像識別的過程中進行模式識別是必不可少的。模式識別原本是人類的一項基本智能。但隨著計算機的發展和人工智能的興起,人類本身的模式識別已經滿足不了生活的需要,于是人類就希望用計算機來代替或擴展人類的部分腦力勞動。這樣計算機的模式識別就產生了。簡單地說,模式識別就是對數據進行分類,它是一門與數學緊密結合的科學,其中所用的思想大部分是概率與統計。模式識別主要分為三種:統計模式識別、句法模式識別、模糊模式識別。
2、圖像識別技術的過程
既然計算機的圖像識別技術與人類的圖像識別原理相同,那它們的過程也是大同小異的。圖像識別技術的過程分以下幾步:信息的獲取、預處理、特征抽取和選擇、分類器設計和分類決策。
信息的獲取是指通過傳感器,將光或聲音等信息轉化為電信息。也就是獲取研究對象的基本信息并通過某種方法將其轉變為機器能夠認識的信息。
預處理主要是指圖像處理中的去噪、平滑、變換等的操作,從而加強圖像的重要特征。
特征抽取和選擇是指在模式識別中,需要進行特征的抽取和選擇。簡單的理解就是我們所研究的圖像是各式各樣的,如果要利用某種方法將它們區分開,就要通過這些圖像所具有的本身特征來識別,而獲取這些特征的過程就是特征抽取。在特征抽取中所得到的特征也許對此次識別并不都是有用的,這個時候就要提取有用的特征,這就是特征的選擇。特征抽取和選擇在圖像識別過程中是非常關鍵的技術之一,所以對這一步的理解是圖像識別的重點。
分類器設計是指通過訓練而得到一種識別規則,通過此識別規則可以得到一種特征分類,使圖像識別技術能夠得到高識別率。分類決策是指在特征空間中對被識別對象進行分類,從而更好地識別所研究的對象具體屬于哪一類。
3、圖像識別技術的分析
隨著計算機技術的迅速發展和科技的不斷進步,圖像識別技術已經在眾多領域中得到了應用。2015年2月15日新浪科技發布一條新聞:“微軟最近公布了一篇關于圖像識別的研究論文,在一項圖像識別的基準測試中,電腦系統識別能力已經超越了人類。人類在歸類數據庫Image Net中的圖像識別錯誤率為5.1%,而微軟研究小組的這個深度學習系統可以達到4.94%的錯誤率。”從這則新聞中我們可以看出圖像識別技術在圖像識別方面已經有要超越人類的圖像識別能力的趨勢。這也說明未來圖像識別技術有更大的研究意義與潛力。而且,計算機在很多方面確實具有人類所無法超越的優勢,也正是因為這樣,圖像識別技術才能為人類社會帶來更多的應用。
3.1神經網絡的圖像識別技術
神經網絡圖像識別技術是一種比較新型的圖像識別技術,是在傳統的圖像識別方法和基礎上融合神經網絡算法的一種圖像識別方法。這里的神經網絡是指人工神經網絡,也就是說這種神經網絡并不是動物本身所具有的真正的神經網絡,而是人類模仿動物神經網絡后人工生成的。在神經網絡圖像識別技術中,遺傳算法與BP網絡相融合的神經網絡圖像識別模型是非常經典的,在很多領域都有它的應用。在圖像識別系統中利用神經網絡系統,一般會先提取圖像的特征,再利用圖像所具有的特征映射到神經網絡進行圖像識別分類。以汽車拍照自動識別技術為例,當汽車通過的時候,汽車自身具有的檢測設備會有所感應。此時檢測設備就會啟用圖像采集裝置來獲取汽車正反面的圖像。獲取了圖像后必須將圖像上傳到計算機進行保存以便識別。最后車牌定位模塊就會提取車牌信息,對車牌上的字符進行識別并顯示最終的結果。在對車牌上的字符進行識別的過程中就用到了基于模板匹配算法和基于人工神經網絡算法。
3.2非線性降維的圖像識別技術
計算機的圖像識別技術是一個異常高維的識別技術。不管圖像本身的分辨率如何,其產生的數據經常是多維性的,這給計算機的識別帶來了非常大的困難。想讓計算機具有高效地識別能力,最直接有效的方法就是降維。降維分為線性降維和非線性降維。例如主成分分析(PCA)和線性奇異分析(LDA)等就是常見的線性降維方法,它們的特點是簡單、易于理解。但是通過線性降維處理的是整體的數據集合,所求的是整個數據集合的最優低維投影。經過驗證,這種線性的降維策略計算復雜度高而且占用相對較多的時間和空間,因此就產生了基于非線性降維的圖像識別技術,它是一種極其有效的非線性特征提取方法。此技術可以發現圖像的非線性結構而且可以在不破壞其本征結構的基礎上對其進行降維,使計算機的圖像識別在盡量低的維度上進行,這樣就提高了識別速率。例如人臉圖像識別系統所需的維數通常很高,其復雜度之高對計算機來說無疑是巨大的“災難”。由于在高維度空間中人臉圖像的不均勻分布,使得人類可以通過非線性降維技術來得到分布緊湊的人臉圖像,從而提高人臉識別技術的高效性。
3.3 圖像識別技術的應用及前景
計算機的圖像識別技術在公共安全、生物、工業、農業、交通、醫療等很多領域都有應用。例如交通方面的車牌識別系統;公共安全方面的人臉識別技術、指紋識別技術;農業方面的種子識別技術、食品品質檢測技術;醫學方面的心電圖識別技術等。隨著計算機技術的不斷發展,圖像識別技術也在不斷地優化,其算法也在不斷地改進。圖像是人類獲取和交換信息的主要來源,因此與圖像相關的圖像識別技術必定也是未來的研究重點。以后計算機的圖像識別技術很有可能在更多的領域嶄露頭角,它的應用前景也是不可限量的,人類的生活也將更加離不開圖像識別技術。
圖像識別技術雖然是剛興起的技術,但其應用已是相當廣泛。并且,圖像識別技術也在不斷地成長,隨著科技的不斷進步,人類對圖像識別技術的認識也會更加深刻。未來圖像識別技術將會更加強大,更加智能地出現在我們的生活中,為人類社會的更多領域帶來重大的應用。在21世紀這個信息化的時代,我們無法想象離開了圖像識別技術以后我們的生活會變成什么樣。圖像識別技術是人類現在以及未來生活必不可少的一項技術。
-
圖像識別
+關注
關注
9文章
520瀏覽量
38273 -
模式識別
+關注
關注
3文章
45瀏覽量
14335
原文標題:圖像識別的原理、過程、應用前景,精華篇!
文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論