择天记,琅琊榜海宴小说,女人书籍排行榜

【導語】本文對梯度函數和損失函數間的關系進行了介紹，并通過可視化方式進行了詳細展示。另外，作者對三種常見的損失函數和兩種常用的激活函數也進行了介紹和可視化。

你需要掌握關于神經網絡訓練的基礎知識。本文嘗試通過可視化方法，對損失函數、梯度下降和反向傳播之間的關系進行介紹。

損失函數和梯度下降之間的關系

為了對梯度下降過程進行可視化，我們先來看一個簡單的情況：假設神經網絡的最后一個節點輸出一個權重數w，該網絡的目標值是0。在這種情況下，網絡所使用的損失函數為均方誤差（MSE）。

當w大于0時，MSE的導數 dy/dw 值為正。dy/dw 為正的原因可以解釋為，w中的正方向變化將導致y的正方向變化。為了減少損失值，需要在w的負方向上進行如下變換：

當w小于0時，MSE的導數 dy/dw 值為負，這意味著w中的正方向變化將導致y的負方向變化。為了減少損失，需要在w的正方向上做如下變換：

因此，權重更新的公式如下：

其中 learning_rate 是一個常量，用于調節每次更新的導數的百分比。調整 Learning_rate 值主要是用于防止w更新步伐太小或太大，或者避免梯度爆炸（梯度太大）或梯度消失的問題（梯度太小）。

下圖展示了一個更長且更貼近實際的計算過程，在該計算過程中，需要使用sigmoid激活函數對權重進行處理。為了更新權重w1，相對于w1的損失函數的導數可以以如下的方式得到：

損失函數對權重的求導過程

從上面闡釋的步驟可以看出，神經網絡中的權重由損失函數的導數而不是損失函數本身來進行更新或反向傳播。因此，損失函數本身對反向傳播并沒有影響。下面對各類損失函數進行了展示：

L2損失函數

MSE（L2損失）的導數更新的步長幅度為2w。當w遠離目標值0時，MSE導數的步長幅度變化有助于向w反向傳播更大的步長，當w更接近目標值0時，該變化使得向w進行反向傳播的步長變小。

L1損失函數

MAE（L1損失）的導數是值為1或負1的常數，這可能不是理想的區分w與目標值之間距離的方式。

交叉熵損失函數

交叉熵損失函數中w的范圍是0和1之間。當w接近1時，交叉熵減少到0。交叉熵的導數是 -1/w。

Sigmoid激活函數

Sigmoid函數的導數值域范圍在0到0.25之間。 sigmoid函數導數的多個乘積可能會得到一個接近于0的非常小的數字，這會使反向傳播失效。這類問題常被稱為梯度消失。

Relu激活函數

Relu是一個較好的激活函數，其導數為1或0，在反向傳播中使網絡持續更新權重或不對權重進行更新。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

函數

函數

+關注

關注
3

文章
4331

瀏覽量
62618
梯度

梯度

+關注

關注
0

文章
30

瀏覽量
10321
可視化

可視化

+關注

關注
1

文章
1194

瀏覽量
20942

原文標題：可視化深入理解損失函數與梯度下降 | 技術頭條

文章出處：【微信號：rgznai100，微信公眾號：rgznai100】歡迎添加關注！文章轉載請注明出處。

常見的幾種可視化介紹

說說常見的幾種可視化一、信息可視化信息可視化就是對抽象數據進行直觀視覺呈現的研究，抽象數據既包含數值數據，也包含非數值數據如文本信息、地圖信息等，它們可通過利用圖形圖像處理、人機交互、

發表于 07-12 07:49

Keras可視化神經網絡架構的4種方法

解模型結構、激活函數、模型參數形狀（神經元數量）等keras 中有一些現成的包可以創建我們的神經網絡模型的可視化表示。前三個包可以在模型訓練之前使用（只需要定義和編譯模型）；但是Ten

發表于 11-02 14:55

keras可視化介紹

, 0.24421487748622894]5 訓練過程的可視化：keras + Tensorboard Tensorboard提供訓練過程可視化的功能，是通過keras的回調函數來實現的。 # 截取部分代碼如下

發表于 08-18 07:53

兩種標準信號之間的函數變換

用函數變換的方法解決兩種標準信號之間的轉換，進而闡述了數學在解決實際問題中的應用。關鍵詞：函數變換、標準信號。Abstract: This paper resolved the conversion between two st

發表于 08-05 08:14 ?8次下載

基于面繪制與體繪制的CT可視化實現方法

醫學圖像三維可視化方法分為面繪制和體繪制。討論了兩種繪制方法的思想和優缺點,介紹了兩種算法的機理和實現過程。采用Visualizati

發表于 02-21 14:48 ?37次下載

函數的可視化與Matlab作

函數的可視化與Matlab作2.1 實驗與觀察：函數的可視化2.1.1 Matlab二維繪圖命令1.周期函數與線性p－周期

發表于 10-17 00:30 ?2219次閱讀

<b class='flag-5'>函數</b>的<b class='flag-5'>可視化</b>與Matlab作

Python的三種函數應用及代碼

布爾值。舉例如下： 2.map()函數的用法 map(func,seq)函數包含兩個參數，map()適用于列表seq所有的元素，它返回一個新的列表（被函數func改變后的列表）。 3.

發表于 11-15 13:07 ?1357次閱讀

Python的<b class='flag-5'>三種</b><b class='flag-5'>函數</b>應用及代碼

ReLU到Sinc的26種神經網絡激活函數可視化大盤點

本文介紹了26個激活函數的圖示及其一階導數，在神經網絡中，激活函數決定來自給定輸入集的節點的輸出，其中非線性

發表于 01-11 17:42 ?3.1w次閱讀

ReLU到Sinc的26<b class='flag-5'>種</b>神經網絡<b class='flag-5'>激活</b><b class='flag-5'>函數</b><b class='flag-5'>可視化</b>大盤點

帕塞瓦定理的兩種常見形式

帕塞瓦定理的兩種常見形式, 在我的《隨機信號分析》里面作為附錄4, 即帕塞瓦定理的兩種常見形式, 第三種形式即不

發表于 04-02 11:13 ?9828次閱讀

CNN的三種可視化方法介紹

導讀對神經網絡進行可視化分析不管是在學習上還是實際應用上都有很重要的意義，基于此，本文介紹了3種CNN的可視化方法：可視化中間特征圖，

發表于 12-29 11:49 ?2449次閱讀

詳解十種激活函數的優缺點

激活函數（Activation Function）是一種添加到人工神經網絡中的函數，旨在幫助網絡學習數據中的復雜模式。類似于人類大腦中基于神經元的模型，

發表于 03-05 16:15 ?1.3w次閱讀

詳解十<b class='flag-5'>種</b><b class='flag-5'>激活</b><b class='flag-5'>函數</b>的優缺點

卷積神經網絡激活函數的作用

起著至關重要的作用，它們可以增加網絡的非線性，提高網絡的表達能力，使網絡能夠學習到更加復雜的特征。本文將詳細介紹卷積神經網絡中激活函數的作用、常見激

發表于 07-03 09:18 ?905次閱讀

前饋神經網絡的基本結構和常見激活函數

和激活函數的非線性變換，能夠學習和模擬復雜的函數映射，從而解決各種監督學習任務。本文將詳細闡述前饋神經網絡的基本結構，包括其組成層、權重和偏置、激活

發表于 07-09 10:31 ?813次閱讀

RNN的損失函數與優化算法解析

函數有以下幾種：交叉熵損失函數：交叉熵（Cross Entropy）是一種評估兩個概率分布之間差異的度量方法，即通過比較模型預測的概率分

發表于 11-15 10:16 ?406次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

三種常見的損失函數和兩種常用的激活函數介紹和可視化

評論