在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

圖像識別的技術原理,會看沒那么簡單

電子設計 ? 來源:互聯網 ? 作者:佚名 ? 2017-12-04 10:46 ? 次閱讀

對人類來說,描述我們眼睛所看到的事物,即“視覺世界”,看起來太微不足道了,以至于我們根本沒有意識到那正是我們時時刻刻在做的事情。在看到某件事物時,不管是汽車、大樹,還是一個人,我們通常都不需要過多的思考就能立刻叫出名字。然而對于一臺計算機來說,區分識別“人類對象”(比如:在小狗、椅子或是鬧鐘這些“非人類對象”中識別出奶奶這一“人類對象”)卻是相當困難的。

能解決這一問題可以帶來非常高的收益。“圖像識別”技術,更寬泛地說是“計算機視覺”技術,是許多新興技術的基礎。從無人駕駛汽車和面部識別軟件到那些看似簡單但十分重要的發展成果——能夠監測流水線缺陷和違規的“智能工廠”,以及保險公司用來處理和分類索賠照片的自動化軟件。這些新興科技是離不開“圖像識別”的。

在接下來的內容里,我們將要探究“圖像識別”所面臨的問題和挑戰,并分析科學家是如何用一種特殊的神經網絡來解決這一挑戰的。

學會“看”是一項高難度、高成本的任務

著手解決這個難題,我們可以首先將元數據應用于非結構化數據。在之前的文章里,我們曾描述過在元數據稀缺或元數據不存在的情況下,進行文本內容分類和搜索遇到的一些問題和挑戰。讓專人來對電影和音樂進行人工分類和標記,確實是一項艱巨的任務。但有些任務不僅艱巨,甚至是幾乎不可能完成的。比如訓練無人駕駛汽車里的導航系統,讓其能夠將其他車輛與正在過馬路的行人區分開來;或者是每天對社交網站上用戶上傳的千千萬萬張的照片和視頻進行標記、分類和篩查。

唯一能夠解決這一難題的方法就是神經網絡。理論上我們可以用常規的神經網絡來進行圖像分析,但在實際操作中,從計算角度看,使用這種方法的成本非常高。舉例來說,一個常規的神經網絡,就算是處理一個非常小的圖像,假設是30*30像素圖像,仍需要900個數據輸入和五十多萬個參數。這樣的處理加工對一個相對強大的機器來說還是可行的;但是,如果需要處理更大的圖像,假設是500*500像素的圖像,那么機器所需的數據輸入和參數數量就會大大增加,增加到難以想象的地步。

除此之外,將神經網絡用于“圖像識別”還可能會導致另一個問題——過度擬合。簡單來說,過度擬合指的是系統訓練的數據過于接近定制的數據模型的現象。這不僅會在大體上導致參數數量的增加(也就是進一步計算支出的增加),還將削弱“圖像識別”在面臨新數據時其他常規功能的正常發揮。

真正的解決方案——卷積

幸運的是,我們發現,只要在神經網絡的結構方式上做一個小小的改變,就能使大圖像的處理更具可操作性。改造后的神經網絡被稱作“卷積神經網絡”,也叫CNNs或ConvNets。

神經網絡的優勢之一在于它的普遍適應性。但是,就像我們剛剛看到的,神經網絡的這一優勢在圖像處理上實際上是一種不利因素。而“卷積神經網絡”能夠對此作出一種有意識的權衡——為了得到一個更可行的解決方案,我們犧牲了神經網絡的其他普遍性功能,設計出了一個專門用于圖像處理的網絡。

在任何一張圖像中,接近度與相似度的關聯性都是非常強的。準確地說,“卷積神經網絡”就是利用了這一原理。具體而言就是,在一張圖像中的兩個相鄰像素,比圖像中兩個分開的像素更具有關聯性。但是,在一個常規的神經網絡中,每個像素都被連接到了單獨的神經元。這樣一來,計算負擔自然加重了,而加重的計算負擔實際上是在削弱網絡的準確程度。

卷積網絡通過削減許多不必要的連接來解決這一問題。運用科技術語來說就是,“卷積網絡”按照關聯程度篩選不必要的連接,進而使圖像處理過程在計算上更具有可操作性。“卷積網絡”有意地限制了連接,讓一個神經元只接受來自之前圖層的小分段的輸入(假設是3×3或5×5像素),避免了過重的計算負擔。因此,每一個神經元只需要負責處理圖像的一小部分(這與我們人類大腦皮質層的工作原理十分相似——大腦中的每一個神經元只需要回應整體視覺領域中的一小部分)。

“卷積神經網絡”的內在秘密

“卷積神經網絡”究竟是如何篩選出不必要的連接的呢?秘密就在于兩個新添的新型圖層——卷積層和匯聚層。我們接下來將會通過一個實操案例:讓網絡判斷照片中是否有“奶奶”這一對象,把“卷積神經網絡”的操作進行分解,逐一描述。

第一步,“卷積層”。“卷積層”本身實際上也包含了幾個步驟:

1.首先,我們會將奶奶的照片分解成一些3×3像素的、重疊著的拼接圖塊。

2.然后,我們把每一個圖塊運行于一個簡單的、單層的神經網絡,保持權衡不變。這一操作會使我們的拼接圖塊變成一個圖組。由于我們一開始就將原始圖像分解成了小的圖像(在這個案例中,我們是將其分解成了3×3像素的圖像),所以,用于圖像處理的神經網絡也是比較好操作的。

3.接下來,我們將會把這些輸出值排列在圖組中,用數字表示照片中各個區域的內容,數軸分別代表高度、寬度和顏色。那么,我們就得到了每一個圖塊的三維數值表達。(如果我們討論的不是奶奶的照片,而是視頻,那么我們就會得到一個四維的數值表達了。)

說完“卷積層”,下一步是“匯聚層”。

“匯聚層”是將這個三維(或是四維)圖組的空間維度與采樣函數結合起來,輸出一個僅包含了圖像中相對重要的部分的聯合數組。這一聯合數組不僅能使計算負擔最小化,還能有效避免過度擬合的問題。

最后,我們會把從“匯聚層”中得出的采樣數組作為常規的、全方位連接的神經網絡來使用。通過卷積和匯聚,我們大幅度地縮減了輸入的數量,因此,我們這時候得到的數組大小是一個正常普通網絡完全能夠處理的,不僅如此,這一數組還能保留原始數據中最重要的部分。這最后一步的輸出結果將最終顯示出系統有多少把握作出“照片中有奶奶”的判斷。

以上只是對“卷積神經網絡”工作過程的簡單描述,現實中,其工作過程是更加復雜的。另外,跟我們這里的案例不同,現實中的“卷積神經網絡”處理的內容一般包含了上百個,甚至上千個標簽

“卷積神經網絡”的實施

重新開始建立一個“卷積神經網絡”是一項非常耗時且昂貴的工作。不過,許多API最近已經實現了——讓組織在沒有內部計算機視覺或機器學習專家的幫助下,完成圖像分析的收集工作。

“谷歌云視覺”是谷歌的視覺識別API,它是以開源式TensorFlow框架為基礎的,采用了一個REST API。“谷歌云視覺”包含了一組相當全面的標簽,能夠檢測單個的對象和人臉。除此之外,它還具備一些附加功能,包括OCR和“谷歌圖像搜索”。

“IBM沃森視覺識別”技術是“沃森云開發者”的重要組成部分。它雖然涵蓋了大量的內置類集,但實際上,它是根據你所提供的圖像來進行定制類集的訓練的。與“谷歌云視覺”一樣,“IBM沃森視覺識別”也具備許多極好的功能,比如OCR和NSFW檢測功能。

Clarif.ai是圖像識別服務的“后起之秀”,它采用了一個REST API。值得一提的是,Clarif.ai包含了大量的單元,能夠根據特定的情境定制不同的算法。像婚禮、旅游甚至食物。

上面的這些API更適用于一些普通的程序,但對于一些特殊的任務,可能還是需要“對癥下藥”,制定專門的解決方案。不過值得慶幸的是,許多數據庫可以處理計算和優化方面的工作,這或多或少地減輕了數據科學家和開發人員的壓力,讓他們有更多精力關注于模型訓練。其中,大部分的數據庫,包括TensorFlow,深度學習4J和Theano,都已經得到了廣泛、成功的應用。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像識別
    +關注

    關注

    9

    文章

    520

    瀏覽量

    38279
收藏 人收藏

    評論

    相關推薦

    基于DSP的快速紙幣圖像識別技術研究

    本課題通過對現有圖像識別技術進行研究和分析,針對當前DSP(數字信號處理)技術的新發展,提出了基于DSP的快速圖像識別概念。快速圖像識別
    發表于 11-05 14:43

    如何構建基于圖像識別的印制線路板精密測試系統?

    如何構建基于圖像識別的印制線路板精密測試系統?圖像識別技術在印刷線路板精密測試中的應用
    發表于 04-27 06:25

    對于圖像識別的引入、原理、過程、應用前景的深度剖析

    抽取和選擇、分類器設計和分類決策。簡單分析了圖像識別技術的引入、其技術原理以及模式識別等,之后介紹了神經網絡的
    的頭像 發表于 12-21 15:01 ?6485次閱讀

    簡單介紹圖像識別技術在各類行業的應用

    其實對于圖像識別技術,大家已經不陌生,人臉識別、虹膜識別、指紋識別等都屬于這個范疇,但是圖像識別
    的頭像 發表于 01-23 11:26 ?3.5w次閱讀

    圖像識別技術 推動智能科技時代發展

    隨著圖像識別技術的不斷發展和應用,圖像識別概念,我相信大家都有所了解,知道它是什么,簡單來件,就是對圖像進行
    的頭像 發表于 06-18 10:22 ?3608次閱讀

    使用FPGA平臺實現遺傳算法的圖像識別的研究設計說明

    利用模板匹配方法,采用基于遺傳算法的圖像識別技術,完成了對圖像目標識別的算法驗證。在此基礎上進行了基于該算法的圖像識別系統的FPGA實現,并
    發表于 01-26 15:02 ?13次下載
    使用FPGA平臺實現遺傳算法的<b class='flag-5'>圖像識別的</b>研究設計說明

    卷積神經網絡用于圖像識別的原理

    在機器視覺領域,圖像識別是指軟件識別人物、場景、物體、動作和圖像寫入的能力。為了實現圖像識別,計算機可以結合人工智能軟件和攝像機使用機器視覺技術
    發表于 08-20 09:56 ?1269次閱讀
    卷積神經網絡用于<b class='flag-5'>圖像識別的</b>原理

    編程語言那么多,最適合圖像識別的是哪種呢?

    這段時間垃圾分類相關小程序、APP的上線,讓圖像識別又一次進入人們的視線,我國圖像識別技術在全世界都排在前列。
    的頭像 發表于 01-09 09:14 ?919次閱讀

    如何使用Python進行圖像識別的自動學習自動訓練?

    如何使用Python進行圖像識別的自動學習自動訓練? 使用Python進行圖像識別的自動學習和自動訓練需要掌握一些重要的概念和技術。在本文中,我們將介紹如何使用Python中的一些常用庫和算法來實現
    的頭像 發表于 01-12 16:06 ?596次閱讀

    圖像識別技術原理 圖像識別技術的應用領域

    圖像識別技術是一種通過計算機對圖像進行分析和理解的技術。它借助計算機視覺、模式識別、人工智能等相關技術
    的頭像 發表于 02-02 11:01 ?2505次閱讀

    圖像檢測和圖像識別的區別是什么

    詳細的比較和分析。 定義和概念 圖像檢測(Image Detection)是指利用計算機視覺技術圖像中的特定目標進行定位和識別的過程。它通常包括目標的檢測、分類和定位三個步驟。
    的頭像 發表于 07-03 14:41 ?1034次閱讀

    圖像識別屬于人工智能嗎

    屬于。圖像識別是人工智能(Artificial Intelligence, AI)領域的一個重要分支。 一、圖像識別概述 1.1 定義 圖像識別是指利用計算機技術
    的頭像 發表于 07-16 10:44 ?1164次閱讀

    圖像識別技術的原理是什么

    圖像識別技術是一種利用計算機視覺和機器學習技術圖像進行分析和理解的技術。它可以幫助計算機識別
    的頭像 發表于 07-16 10:46 ?1066次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機視覺領域的核心任務之一,它涉及到從圖像中提取特征并進行分類、識別和分析的過程。隨著深度學習技術的不斷發展,圖像識別算法已
    的頭像 發表于 07-16 11:14 ?5644次閱讀

    圖像檢測和圖像識別的原理、方法及應用場景

    圖像檢測和圖像識別是計算機視覺領域的兩個重要概念,它們在許多應用場景中發揮著關鍵作用。 1. 定義 1.1 圖像檢測 圖像檢測(Object Detection)是指在
    的頭像 發表于 07-16 11:19 ?4294次閱讀
    主站蜘蛛池模板: 成人欧美一区二区三区| 深夜视频在线| 精品卡1卡2卡三卡免费视频| 国产午夜影院| 精品国产乱子伦一区| 精品国产午夜久久久久九九| 国内自拍2021| 我被黑人巨大开嫩苞在线观看 | cum4k在线| 婷婷九月色| 久久久一本波多野结衣| 911精品国产91久久久久| 4455四色永久免费| 久久国内视频| 操www| japanese 69hdxxxx日本| 免费在线亚洲| 婷婷色婷婷| 欧洲综合网| 国产婷婷一区二区三区| 在线免费色视频| 免费看片免| 国产精品久久久久久久9999| 久色中文| 天天躁夜夜躁狠狠躁2021西西 | 成人国产日本亚洲精品| 午夜高清免费在线观看| 国产伦精品一区二区| 在线观看日本免费视频大片一区 | www.天天射| 亚洲高清不卡视频| 亚洲毛片免费在线观看| 一级aaaaaa片毛片在线播放| 视频色版| 国产三区视频| 日本zzzwww大片免费| 免费人成网站线观看合集| 成年1314在线观看| 伊人久久大| 免费国产网站| 夜干夜夜|