在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

人工神經網絡中語音分析與圖像識別的研究

0BFC_eet_china ? 來源:互聯網 ? 作者:佚名 ? 2017-09-27 14:20 ? 次閱讀

卷積神經網絡(Convolutional Neural Network, CNN)是人工神經網絡的一種,是當下語音分析和圖像識別領域的研究熱點。

這篇文章用最簡明的語言和最直觀的圖像,帶你入門CNN。準備好了嗎?Let’s go——

我們先從最基礎的內容說起。

對二維數字信號(圖像)的操作,可以寫成矩陣形式。

比如對圖像做平滑,一個典型的8領域平滑,其結果中的每個值都來源于原對應位置和其周邊8個元素與一個3X3矩陣的乘積:

也就相當于對原矩陣,按照順序將各區域元素與W矩陣相乘,W 矩陣為:

這也被稱作核(Kernel, 3X3)

其處理效果如下:

也就是,這個核對圖像進行操作,相當于對圖像進行了低通濾波。因此這個核也被稱為濾波器,整個操作過程按照概念稱為卷積。

擴展來講,對二維圖像的濾波操作可以寫成卷積,比如常見的高斯濾波、拉普拉斯濾波(算子)等。

濾波器跟卷積神經網絡有什么關系呢。不如我們預想一個識別問題:我們要識別圖像中的某種特定曲線,也就是說,這個濾波器要對這種曲線有很高的輸出,對其他形狀則輸出很低,這也就像是神經元的激活

我們設計的濾波器和想要識別的曲線如下:

假設上面的核(濾波器)按照卷積順序沿著下圖移動:

那么當它移動到上面的位置時,按照矩陣操作,將這個區域的圖像像素值與濾波器相乘,我們得到一個很大的值(6600):

而當這個濾波器移動到其他區域時,我們得到一個相對很小的值:

如此,我們對整個原圖進行一次卷積,得到的結果中,在那個特定曲線和周邊區域,值就很高,在其他區域,值相對低。這就是一張激活圖。對應的高值區域就是我們所要檢測曲線的位置。

在訓練卷積審計網絡(CNN)的某一個卷積層時,我們實際上是在訓練一系列的濾波器(filter)。比如,對于一個32x32x3(寬32像素x高32像素xRGB三通道)的圖像,如果我們在CNN的第一個卷積層定義訓練12個濾波器,那就這一層的輸出便是32X32X12.按照不同的任務,我們可以對這個輸出做進一步的處理,這包括激活函數,池化,全連接等。

簡單來說,訓練CNN在相當意義上是在訓練每一個卷積層的濾波器。讓這些濾波器組對特定的模式有高的激活,以達到CNN網絡的分類/檢測等目的。

一個實際CNN(AlexNet)第一個卷積層的濾波器>

卷積神經網絡的第一個卷積層的濾波器用來檢測低階特征,比如邊、角、曲線等。隨著卷積層的增加,對應濾波器檢測的特征就更加復雜(理性情況下,也是我們想要的情況)。

比如第二個卷積層的輸入實際上是第一層的輸出(濾波器激活圖),這一層的濾波器便是用來檢測低價特征的組合等情況(半圓、四邊形等),如此累積,以檢測越來越復雜的特征。實際上,我們的人類大腦的視覺信息處理也遵循這樣的低階特征到高階特征的模式。

可參考之前文章《為什么無彩色系(黑白灰色)在色彩搭配中可以和諧地與任何彩色搭配?》:https://www.zhihu.com/question/27380522/answer/36794240

最后一層的濾波器按照訓練CNN目的的不同,可能是在檢測到人臉、手寫字體等時候激活[1]。

所以,在相當程度上,構建卷積神經網絡的任務就在于構建這些濾波器。也就是,將這些濾波器變成這樣(改變濾波器矩陣的值,也就是Weight)的——能識別特定的特征。這個過程叫做訓練

在訓練開始之時,卷積層的濾波器是完全隨機的,它們不會對任何特征激活(不能檢測任何特征)。這就像剛出生的孩子,TA不知道什么是人臉、什么是狗,什么是上下左右。

TA需要學習才知道這些概念,也就是通過接觸人臉、狗、上下左右,并被告知這些東西分別是人臉、狗、上下左右。然后TA才能在頭腦中記住這些概念,并在之后的某一次見到之后能準確的給出結果。

把一個空白的濾波其,修改其權重(weights)以使它能檢測特定的模式,整個過程就如工程里面的反饋。

想想一下,如果有一只無意識的猴子,完全隨機的修改一個5X5濾波器矩陣的25個值,那完全可能經過一定的輪次之后,這個濾波器能夠檢測棱角等特征。這是一種無反饋的訓練情況。對神經網絡的訓練當然不能如此,我們不可能靠運氣去做這件事情。

舉個例子,我們要訓練一個用于分類的神經網絡,讓它能判定輸入圖像中的物體最可能是十個類別的哪一類。那么,訓練過程就是這樣的:

第一次訓練,輸入一張圖像,這個圖像通過各層卷積處理輸出量一組向量[1,1,1,1,1,1,1,1,1,1], 也就是,對于完全由隨機濾波器構建的網絡,其輸出認為這張圖等概率的是十個類別中的某一種。

但是對于訓練,我們有一個Gound Thuth, 也就是這張圖中物體所屬的類別:[0,0,1,0,0,0,0,0,0,0],也就是屬于第三類。這時候我們可以定義一個損失函數,比如常見的MSE(mean squared error)。

我們假定L是這個損失函數的輸出。這時候我們的目的就是,讓L的值反饋(這種神經網絡概念下稱為 back propagation, 反向傳輸)給整個卷積神經網絡,以修改各個濾波器的權重,使得損失值L最小。

這是一個典型的最優化問題。當然地,在工程上我們幾乎不可能一次就把濾波器的權重W修改到使L最小的情況,而是需要多次訓練和多次修改。

如果情況理想的話,權重修改的方向是使得L的變化收斂的。這也就是說很可能達到了我們訓練這個神經網絡的目的——讓各個卷積層的濾波器能夠組合起來最優化的檢測特定的模式。

參考文獻

[1] Zeiler, M. D., & Fergus, R. (2014, September). Visualizing and understanding convolutional networks. In European conference on computer vision (pp. 818-833). Springer, Cham.

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4775

    瀏覽量

    100920
  • 圖像識別
    +關注

    關注

    9

    文章

    520

    瀏覽量

    38295
  • 人工智能
    +關注

    關注

    1792

    文章

    47446

    瀏覽量

    239061

原文標題:給你一個卷積神經網絡工作原理最直觀的解釋

文章出處:【微信號:eet-china,微信公眾號:電子工程專輯】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    LSTM神經網絡語音識別的應用實例

    語音識別技術是人工智能領域的一個重要分支,它使計算機能夠理解和處理人類語言。隨著深度學習技術的發展,特別是長短期記憶(LSTM)神經網絡的引入,語音
    的頭像 發表于 11-13 10:03 ?650次閱讀

    圖像識別屬于人工智能嗎

    屬于。圖像識別人工智能(Artificial Intelligence, AI)領域的一個重要分支。 一、圖像識別概述 1.1 定義 圖像識別是指利用計算機技術對
    的頭像 發表于 07-16 10:44 ?1207次閱讀

    卷積神經網絡有何用途 卷積神經網絡通常運用在哪里

    和應用場景。 圖像識別 圖像識別是卷積神經網絡最廣泛的應用之一。CNN能夠自動學習圖像的特征,實現對
    的頭像 發表于 07-11 14:43 ?2593次閱讀

    人工神經網絡的特點和優越性不包括什么

    在許多領域都取得了顯著的成果,如圖像識別語音識別、自然語言處理等。然而,人工神經網絡也存在一些局限性和不足之處,以下是對
    的頭像 發表于 07-05 09:26 ?969次閱讀

    人工神經網絡的工作原理及應用

    人工神經網絡(Artificial Neural Networks, ANNs)是一種受到生物神經網絡啟發的計算模型,用于模擬人腦處理信息的方式。它們在許多領域都有廣泛的應用,包括圖像識別
    的頭像 發表于 07-05 09:25 ?739次閱讀

    人工神經網絡模型的分類有哪些

    人工神經網絡(Artificial Neural Networks, ANNs)是一種模擬人腦神經元網絡的計算模型,它在許多領域,如圖像識別語音
    的頭像 發表于 07-05 09:13 ?1285次閱讀

    人工智能神經網絡芯片的介紹

    人工智能神經網絡芯片是一類專門為深度學習和神經網絡算法設計的處理器。它們具有高性能、低功耗、可擴展等特點,廣泛應用于圖像識別語音
    的頭像 發表于 07-04 09:33 ?842次閱讀

    如何設計人臉識別的神經網絡

    識別技術主要分為兩個步驟:人臉檢測和人臉特征提取。人臉檢測是指在圖像定位出人臉的位置和大小,人臉特征提取是指從人臉圖像中提取出能夠表征人臉特征的信息。人臉
    的頭像 發表于 07-04 09:20 ?685次閱讀

    反向傳播神經網絡和bp神經網絡的區別

    神經網絡在許多領域都有廣泛的應用,如語音識別圖像識別、自然語言處理等。然而,BP神經網絡也存在一些問題,如容易陷入局部最優解、訓練時間長、
    的頭像 發表于 07-03 11:00 ?834次閱讀

    卷積神經網絡圖像識別的應用

    卷積神經網絡(Convolutional Neural Networks, CNNs)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。 1. 卷積神經網絡的基本原
    的頭像 發表于 07-02 14:28 ?1195次閱讀

    神經網絡建模的適用范圍有哪些

    自然圖像、醫學圖像、衛星圖像等。神經網絡可以識別圖像
    的頭像 發表于 07-02 11:40 ?654次閱讀

    人工神經網絡的含義和用途是

    神經網絡在許多領域都有廣泛的應用,包括圖像識別語音識別、自然語言處理、推薦系統、預測分析等。 一、人工
    的頭像 發表于 07-02 10:07 ?904次閱讀

    卷積神經網絡語音識別的應用

    隨著人工智能技術的飛速發展,語音識別技術作為人機交互的重要橋梁,受到了廣泛的關注和研究語音識別
    的頭像 發表于 07-01 16:01 ?920次閱讀

    神經網絡圖像識別的應用

    隨著人工智能技術的飛速發展,神經網絡圖像識別領域的應用日益廣泛。神經網絡以其強大的特征提取和分類能力,為圖像識別帶來了革命性的進步。本文將
    的頭像 發表于 07-01 14:19 ?709次閱讀

    如何訓練和優化神經網絡

    神經網絡人工智能領域的重要分支,廣泛應用于圖像識別、自然語言處理、語音識別等多個領域。然而,要使神經網
    的頭像 發表于 07-01 14:14 ?494次閱讀
    主站蜘蛛池模板: 午夜视频啪啪| 国产婷婷一区二区三区| 精品国产乱子伦一区| 国产精品麻豆va在线播放| 深夜偷偷看视频在线观看| 日韩一级片视频| 国产三级精品在线观看| 欧美三级一区二区| 五月婷丁香| 久久久国产高清| 欧美黑人性受xxxx精品| 免费观看在线永久免费xx视频| 18岁女人毛片| 韩国三级视频在线观看| 欧美成人69| 日本免费网站在线观看| 四虎影院2022| 日本黄色免费电影| 日本黄色影片在线观看| 男人天堂网在线观看| 青草青青视频| 四虎电影免费观看网站| 日本番囗| 国产欧美日韩电影| 午夜 福利 视频| 天天综合欧美| 午夜一区二区在线观看| 俺去在线| 成色网| 超色视频| 欧美性猛片xxxxⅹ免费| 久久久午夜精品理论片| 奇米99| 午夜欧美性视频在线播放| 免费大片看黄在观看| julia一区二区三区中文字幕| 99久久国产综合精品国| 午夜看片a福利在线| 亚洲国产成人最新精品资源| 亚洲开心激情网| 性欧美xxxx乳高跟|