在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用numpy Python庫從零開始構建人工神經網絡

倩倩 ? 來源:51CTO ? 2020-03-27 15:29 ? 次閱讀

為何從零開始?

有許多深度學習庫(Keras、TensorFlow和PyTorch等)可僅用幾行代碼構建一個神經網絡。然而,如果你真想了解神經網絡的底層運作,建議學習如何使用Python或任何其他編程語言從零開始為神經網絡編程。

不妨創建某個隨機數據集:

圖1. 為簡單起見,隨機數據集帶二進制值

上面表格有五列:Person、X1、X2、X3和Y。1表示true,0表示false。我們的任務是創建一個能夠基于X1、X2和X3的值來預測Y值的人工神經網絡。

我們將創建一個有1個輸入層、1個輸出層而沒有隱藏層的人工神經網絡。開始編程前,先不妨看看我們的神經網絡在理論上將如何執行:

ANN理論

人工神經網絡是一種監督式學習算法,這意味著我們為它提供含有自變量的輸入數據和含有因變量的輸出數據。比如在該示例中,自變量是X1、X2和X3,因變量是Y。

首先,ANN進行一些隨機預測,將這些預測與正確的輸出進行比較,計算出誤差(預測值與實際值之間的差)。找出實際值與傳播值之間的差異的函數名為成本函數(cost function)。這里的成本指誤差。我們的目標是使成本函數最小化。訓練神經網絡基本上是指使成本函數最小化。下面會介紹如何執行此任務。

神經網絡分兩個階段執行:前饋階段和反向傳播階段。下面詳細介紹這兩個步驟。

前饋

圖2

來源:單層神經網絡,又叫Perceptron

在ANN的前饋階段,基于輸入節點中的值和權重進行預測。如果看一下上圖中的神經網絡,會看到數據集中有三個特征:X1、X2和X3,因此第一層(又叫輸入層)中有三個節點。

神經網絡的權重基本上是我們要調整的字符串,以便能夠正確預測輸出。請記住,每個輸入特性只有一個權重。

以下是在ANN的前饋階段所執行的步驟:

第1步:計算輸入和權重之間的點積

輸入層中的節點通過三個權重參數與輸出層連接。在輸出層中,輸入節點中的值與對應的權重相乘并相加。最后,偏置項b添加到總和。

為什么需要偏置項?

假設某個人有輸入值(0,0,0),輸入節點和權重的乘積之和將為零。在這種情況下,無論我們怎么訓練算法,輸出都將始終為零。因此,為了能夠做出預測,即使我們沒有關于該人的任何非零信息,也需要一個偏置項。偏置項對于構建穩健的神經網絡而言必不可少。

數學上,點積的總和:

X.W=x1.w1 + x2.w2 + x3.w3 + b

第2步:通過激活函數傳遞點積(X.W)的總和

點積XW可以生成任何一組值。然而在我們的輸出中,我們有1和0形式的值。我們希望輸出有同樣的格式。為此,我們需要一個激活函數(Activation Function),它將輸入值限制在0到1之間。因此,我們當然會使用Sigmoid激活函數。

圖3. Sigmoid激活函數

輸入為0時,Sigmoid函數返回0.5。如果輸入是大正數,返回接近1的值。負輸入的情況下,Sigmoid函數輸出的值接近零。

因此,它特別適用于我們要預測概率作為輸出的模型。由于概念只存在于0到1之間,Sigmoid函數是適合我們這個問題的選擇。

上圖中z是點積X.W的總和。

數學上,Sigmoid激活函數是:

圖4. Sigmoid激活函數

總結一下到目前為止所做的工作。首先,我們要找到帶權重的輸入特征(自變量矩陣)的點積。接著,通過激活函數傳遞點積的總和。激活函數的結果基本上是輸入特征的預測輸出。

反向傳播

一開始,進行任何訓練之前,神經網絡進行隨機預測,這種預測當然是不正確的。

我們先讓網絡做出隨機輸出預測。然后,我們將神經網絡的預測輸出與實際輸出進行比較。接下來,我們更新權重和偏置,并確保預測輸出更接近實際輸出。在這個階段,我們訓練算法。不妨看一下反向傳播階段涉及的步驟。

第1步:計算成本

此階段的第一步是找到預測成本??梢酝ㄟ^找到預測輸出值和實際輸出值之間的差來計算預測成本。如果差很大,成本也將很大。

我們將使用均方誤差即MSE成本函數。成本函數是找到給定輸出預測成本的函數。

圖5. 均方誤差

這里,Yi是實際輸出值,i是預測輸出值,n是觀察次數。

第2步:使成本最小化

我們的最終目的是微調神經網絡的權重,并使成本最小化。如果你觀察仔細,會了解到我們只能控制權重和偏置,其他一切不在控制范圍之內。我們無法控制輸入,無法控制點積,無法操縱Sigmoid函數。

為了使成本最小化,我們需要找到權重和偏置值,確保成本函數返回最小值。成本越小,預測就越正確。

要找到函數的最小值,我們可以使用梯度下降算法。梯度下降可以用數學表示為:

圖6. 使用梯度下降更新權重

Error是成本函數。上面的等式告訴我們找到關于每個權重和偏置的成本函數的偏導數,然后從現有權重中減去結果以得到新的權重。

函數的導數給出了在任何給定點的斜率。為了找到成本是增加還是減少,給定權重值,我們可以找到該特定權重值的函數導數。如果成本隨重量增加而增加,導數將返回正值,然后將其從現有值中減去。

另一方面,如果成本隨重量增加而降低,將返回負值,該值將被添加到現有的權重值中,因為負負得正。

在上面公式中,a名為學習速率,乘以導數。學習速率決定了我們的算法學習的速度。

我們需要對所有權重和偏置重復執行梯度下降操作,直到成本最小化,并且成本函數返回的值接近零。

現在是實現我們迄今為止研究的人工神經網絡的時候了。我們將用Python創建一個簡單的神經網絡,有1個輸入層和1個輸出層。

使用numpy實現人工神經網絡

圖7

圖片來源:hackernoon.com

要采取的步驟:

1.定義自變量和因變量

2.定義超參數

3.定義激活函數及其導數

4.訓練模型

5.做出預測

第1步:先創建自變量或輸入特征集以及相應的因變量或標簽。

#Independent variables

input_set = np.array([[0,1,0],

[0,0,1],

[1,0,0],

[1,1,0],

[1,1,1],

[0,1,1],

[0,1,0]])#Dependent variable

labels = np.array([[1,

0,

0,

1,

1,

0,

1]])

labels = labels.reshape(7,1) #toconvert labels to vector

我們的輸入集含有七個記錄。同樣,我們還創建了一個標簽集,含有輸入集中每個記錄的對應標簽。標簽是我們希望ANN預測的值。

第2步:定義超參數。

我們將使用numpy的random.seed函數,以便在執行以下代碼時可以獲得同樣的隨機值。

接下來,我們使用正態分布的隨機數初始化權重。由于輸入中有三個特征,因此我們有三個權重的向量。然后,我們使用另一個隨機數初始化偏置值。最后,我們將學習速率設置為0.05。

np.random.seed(42)

weights = np.random.rand(3,1)

bias = np.random.rand(1)

lr = 0.05 #learning rate

第3步:定義激活函數及其導數:我們的激活函數是Sigmoid函數。

def sigmoid(x):

return 1/(1+np.exp(-x))

現在定義計算Sigmoid函數導數的函數。

def sigmoid_derivative(x):

return sigmoid(x)*(1-sigmoid(x))

第4步:是時候訓練ANN模型了。

我們將從定義輪次(epoch)數量開始。輪次是我們想針對數據集訓練算法的次數。我們將針對數據訓練算法25000次,因此epoch將為25000。可以嘗試不同的數字以進一步降低成本。

for epoch in range(25000):

inputs = input_set

XW = np.dot(inputs, weights)+ bias

z = sigmoid(XW)

error = z - labels

print(error.sum())

dcost = error

dpred = sigmoid_derivative(z)

z_del = dcost * dpred

inputs = input_set.T

weights = weights - lr*np.dot(inputs, z_del)

for num in z_del:

bias = bias - lr*num

不妨了解每個步驟,然后進入到預測的最后一步。

我們將輸入input_set中的值存儲到input變量中,以便在每次迭代中都保留input_set的值不變。

inputs = input_set

接下來,我們找到輸入和權重的點積,并為其添加偏置。(前饋階段的第1步)

XW = np.dot(inputs, weights)+ bias

接下來,我們通過Sigmoid激活函數傳遞點積。(前饋階段的第2步)

z = sigmoid(XW)

這就完成了算法的前饋部分,現在是開始反向傳播的時候了。

變量z含有預測的輸出。反向傳播的第一步是找到誤差。

error = z - labels

print(error.sum())

我們知道成本函數是:

圖8

我們需要從每個權重方面求該函數的微分,這可以使用微分鏈式法則(chain rule of differentiation)來輕松完成。我將跳過推導部分,但如果有人感興趣,請留言。

因此,就任何權重而言,成本函數的最終導數是:

slope = input x dcost x dpred

現在,斜率可以簡化為:

dcost = error

dpred = sigmoid_derivative(z)

z_del = dcost * dpred

inputs = input_set.T

weights = weight-lr*np.dot(inputs, z_del)

我們有z_del變量,含有dcost和dpred的乘積。我們拿輸入特征矩陣的轉置與z_del相乘,而不是遍歷每個記錄并拿輸入與對應的z_del相乘。

最后,我們將學習速率變量lr與導數相乘,以加快學習速度。

除了更新權重外,我們還要更新偏置項。

for num in z_del:

bias = bias - lr*num

一旦循環開始,你會看到總誤差開始減小;訓練結束時,誤差將保留為很小的值。

-0.001415035616137969

-0.0014150128584959256

-0.0014149901015685952

-0.0014149673453557714

-0.0014149445898578358

-0.00141492183507419

-0.0014148990810050437

-0.0014148763276499686

-0.0014148535750089977

-0.0014148308230825385

-0.0014148080718707524

-0.0014147853213728624

-0.0014147625715897338

-0.0014147398225201734

-0.0014147170741648386

-0.001414694326523502

-0.001414671579597255

-0.0014146488333842064

-0.0014146260878853782

-0.0014146033431002465

-0.001414580599029179

-0.0014145578556723406

-0.0014145351130293877

-0.0014145123710998

-0.0014144896298846701

-0.0014144668893831067

-0.001414444149595611

-0.0014144214105213174

-0.0014143986721605849

-0.0014143759345140276

-0.0014143531975805163

-0.001414330461361444

-0.0014143077258557749

-0.0014142849910631708

-0.00141426225698401

-0.0014142395236186895

-0.0014142167909661323

-0.001414194059027955

-0.001414171327803089

-0.001414148597290995

-0.0014141258674925626

-0.0014141031384067547

-0.0014140804100348098

-0.0014140576823759854

-0.0014140349554301636

-0.0014140122291978665

-0.001413989503678362

-0.001413966778871751

-0.001413944054778446

-0.0014139213313983257

-0.0014138986087308195

-0.0014138758867765552

-0.0014138531655347973

-0.001413830445006264

-0.0014138077251906606

-0.001413785006087985

-0.0014137622876977014

-0.0014137395700206355

-0.0014137168530558228

-0.0014136941368045382

-0.0014136714212651114

-0.0014136487064390219

-0.0014136259923249635

-0.001413603278923519

-0.0014135805662344007

-0.0014135578542581566

-0.0014135351429944293

-0.0014135124324428719

-0.0014134897226037203

-0.0014134670134771238

-0.0014134443050626295

-0.0014134215973605428

-0.0014133988903706311

第5步:作出預測

是時候作出一些預測了。先用[1,0,0]試一下:

single_pt = np.array([1,0,0])

result = sigmoid(np.dot(single_pt, weights) + bias)

print(result)

輸出:

[0.01031463]

如你所見,輸出更接近0而不是1,因此分類為0。

不妨再用[0,1,0]試一下:

single_pt = np.array([0,1,0])

result = sigmoid(np.dot(single_pt, weights) + bias)

print(result)

輸出:

[0.99440207]

如你所見,輸出更接近1而不是0,因此分類為1。

結論

我們在本文中學習了如何使用numpy Python庫,從零開始創建一個很簡單的人工神經網絡,只有1個輸入層和1個輸出層。該ANN能夠對線性可分離數據進行分類。

如果我們有非線性可分離的數據,我們的ANN就無法對這種類型的數據進行分類。下篇將介紹如何構建這樣的ANN。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4776

    瀏覽量

    100952
  • 編程語言
    +關注

    關注

    10

    文章

    1947

    瀏覽量

    34848
  • 深度學習
    +關注

    關注

    73

    文章

    5510

    瀏覽量

    121338
收藏 人收藏

    評論

    相關推薦

    人工神經網絡的原理和多種神經網絡架構方法

    在上一篇文章中,我們介紹了傳統機器學習的基礎知識和多種算法。在本文中,我們會介紹人工神經網絡的原理和多種神經網絡架構方法,供各位老師選擇。 01 人工
    的頭像 發表于 01-09 10:24 ?182次閱讀
    <b class='flag-5'>人工</b><b class='flag-5'>神經網絡</b>的原理和多種<b class='flag-5'>神經網絡</b>架構方法

    如何使用Python構建LSTM神經網絡模型

    構建一個LSTM(長短期記憶)神經網絡模型是一個涉及多個步驟的過程。以下是使用Python和Keras構建LSTM模型的指南。 1. 安裝
    的頭像 發表于 11-13 10:10 ?486次閱讀

    如何構建多層神經網絡

    構建多層神經網絡(MLP, Multi-Layer Perceptron)模型是一個在機器學習和深度學習領域廣泛使用的技術,尤其在處理分類和回歸問題時。在本文中,我們將深入探討如何從頭開始構建
    的頭像 發表于 07-19 17:19 ?942次閱讀

    Python自動訓練人工神經網絡

    人工神經網絡(ANN)是機器學習中一種重要的模型,它模仿了人腦神經元的工作方式,通過多層節點(神經元)之間的連接和權重調整來學習和解決問題。Pyth
    的頭像 發表于 07-19 11:54 ?385次閱讀

    使用NumPy實現前饋神經網絡

    要使用NumPy實現一個前饋神經網絡(Feedforward Neural Network),我們需要從基礎開始構建,包括初始化網絡參數、定
    的頭像 發表于 07-11 16:30 ?1738次閱讀

    BP神經網絡人工神經網絡的區別

    BP神經網絡人工神經網絡(Artificial Neural Networks,簡稱ANNs)之間的關系與區別,是神經網絡領域中一個基礎且重要的話題。本文將從定義、結構、算法、應用及
    的頭像 發表于 07-10 15:20 ?1205次閱讀

    PyTorch神經網絡模型構建過程

    PyTorch,作為一個廣泛使用的開源深度學習,提供了豐富的工具和模塊,幫助開發者構建、訓練和部署神經網絡模型。在神經網絡模型中,輸出層是尤為關鍵的部分,它負責將模型的預測結果以合適
    的頭像 發表于 07-10 14:57 ?530次閱讀

    人工神經網絡模型包含哪些層次

    人工神經網絡(Artificial Neural Network,ANN)是一種模擬人腦神經網絡的計算模型,具有自適應、自學習、泛化能力強等特點。本文將詳細介紹人工
    的頭像 發表于 07-05 09:17 ?657次閱讀

    人工神經網絡模型訓練的基本原理

    人工神經網絡(Artificial Neural Networks,簡稱ANNs)是一種受生物神經網絡啟發而構建的數學模型,用于模擬人腦處理信息的方式。它在機器學習和深度學習領域具有廣
    的頭像 發表于 07-05 09:16 ?745次閱讀

    人工神經網絡模型的分類有哪些

    人工神經網絡(Artificial Neural Networks, ANNs)是一種模擬人腦神經元網絡的計算模型,它在許多領域,如圖像識別、語音識別、自然語言處理、預測分析等有著廣泛的應用。本文將
    的頭像 發表于 07-05 09:13 ?1295次閱讀

    神經網絡的基本原理及Python編程實現

    神經網絡作為深度學習算法的基本構建模塊,模擬了人腦的行為,通過互相連接的節點(也稱為“神經元”)實現對輸入數據的處理、模式識別和結果預測等功能。本文將深入探討神經網絡的基本原理,并結合
    的頭像 發表于 07-03 16:11 ?724次閱讀

    神經網絡人工智能的關系是什么

    神經網絡人工智能的關系是密不可分的。神經網絡人工智能的一種重要實現方式,而人工智能則是神經網絡
    的頭像 發表于 07-03 10:25 ?1227次閱讀

    使用PyTorch構建神經網絡

    PyTorch是一個流行的深度學習框架,它以其簡潔的API和強大的靈活性在學術界和工業界得到了廣泛應用。在本文中,我們將深入探討如何使用PyTorch構建神經網絡,包括從基礎概念到高級特性的全面解析。本文旨在為讀者提供一個完整的、技術性的指南,幫助理解并實踐PyTorch
    的頭像 發表于 07-02 11:31 ?743次閱讀

    人工神經網絡的含義和用途是

    人工神經網絡(Artificial Neural Networks,簡稱ANNs)是一種受生物神經網絡啟發而構建的數學模型,它通過模擬人腦神經
    的頭像 發表于 07-02 10:07 ?917次閱讀

    如何使用Python進行神經網絡編程

    。 為什么使用Python? Python是一種廣泛使用的高級編程語言,以其易讀性和易用性而聞名。Python擁有強大的,如TensorFlow、Keras和PyTorch,這些
    的頭像 發表于 07-02 09:58 ?431次閱讀
    主站蜘蛛池模板: 亚洲视频一区二区在线观看| 日本不卡免费高清一级视频| 手机看片福利盒子| 五月婷婷丁香色| 欧美黑人换爱交换乱理伦片| 久久作爱视频| 日本xxwwwxxxx网站| 一区视频在线| 好硬好湿好爽再深一点h| 伊人网站在线观看| 亚洲国产高清人在线| 色妞妞网| 韩国三级hd中文字幕好大| 2021日本三级理论影院| 天天操天天弄| 98色花堂永久地址国产精品| 亚洲一区二区三区免费| 亚洲综合春色另类久久| 日韩免费精品一级毛片| 黄色短视频免费看| 夜夜操操操| 国产手机在线观看视频| 亚洲一在线| 午夜精品久久久久蜜桃| 美女 免费 视频 黄的| 岛国午夜| 久久天天躁夜夜躁狠狠躁2020| 免费观看视频高清www| 高h细节肉爽文bl文| 三级精品视频在线播放| 国产资源免费观看| 天天襙| 亚洲五月六月丁香激情| a中文字幕1区| 欧美在线视频免费| 福利天堂| 国产情侣出租屋露脸实拍| 欧美性色xo影院在线观看| 四虎影院国产精品| 国产精品国产三级国产普通话对白 | 视频免费在线|