已完结小说排行榜,完结小说排行榜,耳根

卷積神經網絡（Convolutional Neural Network, CNN）是人工神經網絡的一種，是當下語音分析和圖像識別領域的研究熱點。

這篇文章用最簡明的語言和最直觀的圖像，帶你入門CNN。準備好了嗎？Let’s go——

我們先從最基礎的內容說起。

對二維數字信號（圖像）的操作，可以寫成矩陣形式。

比如對圖像做平滑，一個典型的8領域平滑，其結果中的每個值都來源于原對應位置和其周邊8個元素與一個3X3矩陣的乘積：

也就相當于對原矩陣，按照順序將各區域元素與W矩陣相乘，W 矩陣為：

這也被稱作核(Kernel, 3X3)

其處理效果如下：

也就是，這個核對圖像進行操作，相當于對圖像進行了低通濾波。因此這個核也被稱為濾波器，整個操作過程按照概念稱為卷積。

擴展來講，對二維圖像的濾波操作可以寫成卷積，比如常見的高斯濾波、拉普拉斯濾波（算子）等。

濾波器跟卷積神經網絡有什么關系呢。不如我們預想一個識別問題：我們要識別圖像中的某種特定曲線，也就是說，這個濾波器要對這種曲線有很高的輸出，對其他形狀則輸出很低，這也就像是神經元的激活。

我們設計的濾波器和想要識別的曲線如下：

假設上面的核（濾波器）按照卷積順序沿著下圖移動：

那么當它移動到上面的位置時，按照矩陣操作，將這個區域的圖像像素值與濾波器相乘，我們得到一個很大的值（6600）：

而當這個濾波器移動到其他區域時，我們得到一個相對很小的值：

如此，我們對整個原圖進行一次卷積，得到的結果中，在那個特定曲線和周邊區域，值就很高，在其他區域，值相對低。這就是一張激活圖。對應的高值區域就是我們所要檢測曲線的位置。

在訓練卷積審計網絡（CNN）的某一個卷積層時，我們實際上是在訓練一系列的濾波器(filter)。比如，對于一個32x32x3（寬32像素x高32像素xRGB三通道）的圖像，如果我們在CNN的第一個卷積層定義訓練12個濾波器，那就這一層的輸出便是32X32X12.按照不同的任務，我們可以對這個輸出做進一步的處理，這包括激活函數，池化，全連接等。

簡單來說，訓練CNN在相當意義上是在訓練每一個卷積層的濾波器。讓這些濾波器組對特定的模式有高的激活，以達到CNN網絡的分類/檢測等目的。

△一個實際CNN（AlexNet）第一個卷積層的濾波器>

卷積神經網絡的第一個卷積層的濾波器用來檢測低階特征，比如邊、角、曲線等。隨著卷積層的增加，對應濾波器檢測的特征就更加復雜（理性情況下，也是我們想要的情況）。

比如第二個卷積層的輸入實際上是第一層的輸出（濾波器激活圖），這一層的濾波器便是用來檢測低價特征的組合等情況（半圓、四邊形等），如此累積，以檢測越來越復雜的特征。實際上，我們的人類大腦的視覺信息處理也遵循這樣的低階特征到高階特征的模式。

可參考之前文章《為什么無彩色系（黑白灰色）在色彩搭配中可以和諧地與任何彩色搭配？》：https://www.zhihu.com/question/27380522/answer/36794240

最后一層的濾波器按照訓練CNN目的的不同，可能是在檢測到人臉、手寫字體等時候激活[1]。

所以，在相當程度上，構建卷積神經網絡的任務就在于構建這些濾波器。也就是，將這些濾波器變成這樣(改變濾波器矩陣的值，也就是Weight)的——能識別特定的特征。這個過程叫做訓練。

在訓練開始之時，卷積層的濾波器是完全隨機的，它們不會對任何特征激活（不能檢測任何特征）。這就像剛出生的孩子，TA不知道什么是人臉、什么是狗，什么是上下左右。

TA需要學習才知道這些概念，也就是通過接觸人臉、狗、上下左右，并被告知這些東西分別是人臉、狗、上下左右。然后TA才能在頭腦中記住這些概念，并在之后的某一次見到之后能準確的給出結果。

把一個空白的濾波其，修改其權重(weights)以使它能檢測特定的模式，整個過程就如工程里面的反饋。

想想一下，如果有一只無意識的猴子，完全隨機的修改一個5X5濾波器矩陣的25個值，那完全可能經過一定的輪次之后，這個濾波器能夠檢測棱角等特征。這是一種無反饋的訓練情況。對神經網絡的訓練當然不能如此，我們不可能靠運氣去做這件事情。

舉個例子，我們要訓練一個用于分類的神經網絡，讓它能判定輸入圖像中的物體最可能是十個類別的哪一類。那么，訓練過程就是這樣的：

第一次訓練，輸入一張圖像，這個圖像通過各層卷積處理輸出量一組向量[1,1,1,1,1,1,1,1,1,1], 也就是，對于完全由隨機濾波器構建的網絡，其輸出認為這張圖等概率的是十個類別中的某一種。

但是對于訓練，我們有一個Gound Thuth, 也就是這張圖中物體所屬的類別：[0，0，1，0，0，0，0，0，0，0]，也就是屬于第三類。這時候我們可以定義一個損失函數，比如常見的MSE（mean squared error）。

我們假定L是這個損失函數的輸出。這時候我們的目的就是，讓L的值反饋(這種神經網絡概念下稱為 back propagation，反向傳輸)給整個卷積神經網絡，以修改各個濾波器的權重，使得損失值L最小。

這是一個典型的最優化問題。當然地，在工程上我們幾乎不可能一次就把濾波器的權重W修改到使L最小的情況，而是需要多次訓練和多次修改。

如果情況理想的話，權重修改的方向是使得L的變化收斂的。這也就是說很可能達到了我們訓練這個神經網絡的目的——讓各個卷積層的濾波器能夠組合起來最優化的檢測特定的模式。

參考文獻

[1] Zeiler, M. D., & Fergus, R. (2014, September). Visualizing and understanding convolutional networks. In European conference on computer vision (pp. 818-833). Springer, Cham.

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4775

瀏覽量
100920
圖像識別

圖像識別

+關注

關注
9

文章
520

瀏覽量
38295
人工智能

人工智能

+關注

關注
1792

文章
47446

瀏覽量
239061

原文標題：給你一個卷積神經網絡工作原理最直觀的解釋

文章出處：【微信號：eet-china，微信公眾號：電子工程專輯】歡迎添加關注！文章轉載請注明出處。

LSTM神經網絡在語音識別中的應用實例

語音識別技術是人工智能領域的一個重要分支，它使計算機能夠理解和處理人類語言。隨著深度學習技術的發展，特別是長短期記憶（LSTM）神經網絡的引入，語音

發表于 11-13 10:03 ?650次閱讀

圖像識別屬于人工智能嗎

屬于。圖像識別是人工智能（Artificial Intelligence, AI）領域的一個重要分支。一、圖像識別概述 1.1 定義 圖像識別是指利用計算機技術對

發表于 07-16 10:44 ?1207次閱讀

卷積神經網絡有何用途卷積神經網絡通常運用在哪里

和應用場景。 圖像識別 圖像識別是卷積神經網絡最廣泛的應用之一。CNN能夠自動學習圖像中的特征，實現對圖

發表于 07-11 14:43 ?2593次閱讀

人工神經網絡的特點和優越性不包括什么

在許多領域都取得了顯著的成果，如圖像識別、語音識別、自然語言處理等。然而，人工神經網絡也存在一些局限性和不足之處，以下是對

發表于 07-05 09:26 ?969次閱讀

人工神經網絡的工作原理及應用

人工神經網絡（Artificial Neural Networks, ANNs）是一種受到生物神經網絡啟發的計算模型，用于模擬人腦處理信息的方式。它們在許多領域都有廣泛的應用，包括圖像識別

發表于 07-05 09:25 ?739次閱讀

人工神經網絡模型的分類有哪些

人工神經網絡（Artificial Neural Networks, ANNs）是一種模擬人腦神經元網絡的計算模型，它在許多領域，如圖像識別、語音

發表于 07-05 09:13 ?1285次閱讀

人工智能神經網絡芯片的介紹

人工智能神經網絡芯片是一類專門為深度學習和神經網絡算法設計的處理器。它們具有高性能、低功耗、可擴展等特點，廣泛應用于圖像識別、語音

發表于 07-04 09:33 ?842次閱讀

如何設計人臉識別的神經網絡

識別技術主要分為兩個步驟：人臉檢測和人臉特征提取。人臉檢測是指在圖像中定位出人臉的位置和大小，人臉特征提取是指從人臉圖像中提取出能夠表征人臉特征的信息。人臉

發表于 07-04 09:20 ?685次閱讀

反向傳播神經網絡和bp神經網絡的區別

神經網絡在許多領域都有廣泛的應用，如語音識別、圖像識別、自然語言處理等。然而，BP神經網絡也存在一些問題，如容易陷入局部最優解、訓練時間長、

發表于 07-03 11:00 ?834次閱讀

卷積神經網絡在圖像識別中的應用

卷積神經網絡（Convolutional Neural Networks, CNNs）是一種深度學習模型，廣泛應用于圖像識別、視頻分析、自然語言處理等領域。 1. 卷積神經網絡的基本原

發表于 07-02 14:28 ?1195次閱讀

神經網絡建模的適用范圍有哪些

自然圖像、醫學圖像、衛星圖像等。神經網絡可以識別圖像中

發表于 07-02 11:40 ?654次閱讀

人工神經網絡的含義和用途是

神經網絡在許多領域都有廣泛的應用，包括圖像識別、語音識別、自然語言處理、推薦系統、預測分析等。一、人工

發表于 07-02 10:07 ?904次閱讀

卷積神經網絡在語音識別中的應用

隨著人工智能技術的飛速發展，語音識別技術作為人機交互的重要橋梁，受到了廣泛的關注和研究。語音識別

發表于 07-01 16:01 ?920次閱讀

神經網絡在圖像識別中的應用

隨著人工智能技術的飛速發展，神經網絡在圖像識別領域的應用日益廣泛。神經網絡以其強大的特征提取和分類能力，為圖像識別帶來了革命性的進步。本文將

發表于 07-01 14:19 ?709次閱讀

如何訓練和優化神經網絡

神經網絡是人工智能領域的重要分支，廣泛應用于圖像識別、自然語言處理、語音識別等多個領域。然而，要使神經網

發表于 07-01 14:14 ?494次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

人工神經網絡中語音分析與圖像識別的研究

△一個實際CNN（AlexNet）第一個卷積層的濾波器>

評論

LSTM神經網絡在語音識別中的應用實例

圖像識別屬于人工智能嗎

卷積神經網絡有何用途卷積神經網絡通常運用在哪里

人工神經網絡的特點和優越性不包括什么

人工神經網絡的工作原理及應用

人工神經網絡模型的分類有哪些

人工智能神經網絡芯片的介紹

如何設計人臉識別的神經網絡

反向傳播神經網絡和bp神經網絡的區別

卷積神經網絡在圖像識別中的應用

神經網絡建模的適用范圍有哪些

人工神經網絡的含義和用途是

卷積神經網絡在語音識別中的應用

神經網絡在圖像識別中的應用

如何訓練和優化神經網絡