隨著技術的發展,神經網絡的結構越來越復雜,能處理的邏輯也越來越多,比如不同的神經網絡模型能處理圖像類、目標檢測、圖像分割、關鍵點檢測、圖像生成、場景文字識別、度量學習、視頻分類和動作定位等多種任務。
受到生物神經元的啟發,1943年,美國數學邏輯學家沃爾特·皮茨和心理學家沃倫·麥克洛克提出了人工神經元結構,如圖所示。輸入的數據X1,X2,…,X{經過加權和偏置后,由激活函數處理后得到輸出。
現在的神經網絡模型大多采用分層結構,包含輸入層、隱含層和輸出層。其中,輸入層用于數據的輸入,輸出層用于推理結果的輸出,隱含層則是神經網絡中的合成層,介于輸人層(即特征)和輸出層(即預測)之間。神經網絡包含一個或多個隱含層。含有隱含層的神經網絡,隱含層的數量和節點越多,在非線性的激活函數下,神經網絡就可以學習更深層次的特征。
算子
神經網絡模型中各層每個節點的操作都是一個算子,也叫作函數。這些算子是神經網絡的核心單元,用于將上一層的輸出數據作為輸人,計算后輸出到下一層節點。算子的種類非常多,總的來說分為激活函數、計算類算子、歸一化函數、特征提取函數、防過擬合算子、損失函數等。
激活函數
激活函數能對上一層的所有輸人求加權和,然后生成一個輸出值(通常為非線性值),并將其傳遞給下一層,目標是為神經網絡引人非線性。典型的激活函數包括ReLU、Sigmoid等。計算類算子
計算類算子用于張量計算。張量是人工智能計算使用的主要數據結構,最常見的是標量、向量或矩陣。計算類算子包括張量間的加、減、乘、除,BiasAdd,矩陣乘等多種運算。
歸一化函數
歸一化函數用于將不同表征的數據歸約到相同的尺度內,來進一步獲得高頻特征。主要的歸一化函數包括 BatchNorm、LRN等
特征提取
函數能提取待檢測目標部分或全部的特征值,用于神經網絡模型的訓練和推理,主要的特征提取函數包括 Convolution、FullConnection、Correlation和DeConvolution等口防過擬合算子
特征提取函數
防過擬合算子用于神經網絡模型的訓練和推理,主要的防過擬合算子包括Pooling、Mean、ROIPooling 等。
參數
參數是指機器學習系統自行訓練的模型變量。權重和偏置就是神經網絡模型中的重要參數。假設輸入為義,X,···,,輸出為Y,則函數Y為
Y=ZwX+b則權重為 w,偏置為b,它們的值是機器學習系統通過連續的訓練迭代逐漸學習到的。神經網絡模型在訓練過程中通過不斷修改權重和偏置來減小損失函數值,最終達到訓練效果訓練完成后,這些參數將被保存到神經網絡模型中用于推理計算。
標簽
標簽用于神經網絡模型的訓練和推理,表示神經網絡模型可推理的范圍。嚴格意義上標簽不屬于神經網絡模型本身的組成部分,主要用于配合進行結果的判斷,通常是一個單獨的文件。比如一個用于圖像分類模型的標簽文件的內容可能包括貓、狗、樹木等不同物品及其對應的編號,而用于目標分類模型的標簽文件可能還包括具體物品在圖片中所處的區域參數。一般情況下,神經網絡模型的輸出為一個編號,這就需要通過標簽文件的編號來匹配最終的推理結果。
-
神經網絡
+關注
關注
42文章
4777瀏覽量
100995 -
模型
+關注
關注
1文章
3286瀏覽量
49007
發布評論請先 登錄
相關推薦
評論