主要內容:
為什么梯度的負方向是局部下降最快的方向?
剛接觸梯度下降這個概念的時候,是在學習機器學習算法的時候,很多訓練算法用的就是梯度下降,然后資料和老師們也說朝著梯度的反方向變動,函數值下降最快,但是究其原因的時候,很多人都表達不清楚。所以我整理出自己的理解,從方向導數這個角度把這個結論證明出來,讓我們知其然也知其所以然~
這次從最優化的角度切入來說明一下:
當我們在某個要優化的函數,這里設為f(x),我們在x點處,然后沿方向 v進行移動,到達f(x+v),圖示表示了移動過程:
上圖顯示了從A點,移動到B點的過程。那么 v方向是什么的時候,局部下降的最快呢?
換成數學語言來說就是, f(x+v)-f(x)的值在 v是什么的時候,達到最大!
下面進行講解:
則 f(x+v)-f(x)=d f(x)v ,則我們可以得出: d f(x)v 為函數值的變化量,我們要注意的是 d f(x) 和 v 均為向量, d f(x)v 也就是兩個向量進行點積,而向量進行點積的最大值,也就是兩者共線的時候,也就是說 v 的方向和 d f(x) 方向相同的時候,點積值最大,這個點積值也代表了從A點到B點的上升量。點積說明如下:
而 df(x)正是代表函數值在x處的梯度。前面又說明了v的方向和df(x)方向相同的時候,點積值(變化值)最大,所以說明了梯度方向是函數局部上升最快的方向。也就證明了梯度的負方向是局部下降最快的方向!
-
算法
+關注
關注
23文章
4626瀏覽量
93151 -
梯度
+關注
關注
0文章
30瀏覽量
10333 -
機器學習
+關注
關注
66文章
8434瀏覽量
132871
原文標題:【直觀理解】為什么梯度的負方向是局部下降最快的方向?
文章出處:【微信號:AI_shequ,微信公眾號:人工智能愛好者社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論