人工神經網絡和機器學習已經成為大眾媒體的熱門主題。智能機器這一想法勾起了很多人的想象,而且人們特別喜歡把它和人類放一起比較。特別是有一個關于人工智能的底層機制的基礎問題經常出現——這些人工神經網絡的工作方式真的和我們大腦中的神經元相似嗎?
Tl;Dr
不。盡管從高層概念上說,ANN(人工神經網絡)受到了大腦中的神經元和神經網絡的啟發,但這些概念的ML實現和大腦的工作方式大有徑庭。不僅如此,隨著這些年來ML領域的進展,新的復雜想法和技術的提出(RNN、GAN等)——這一聯系進一步削弱了。
關鍵相似點
前饋全連接網絡的高層架構和一般原則體現了人工神經網絡和大腦中的神經網絡的相似性。
從高層看,大腦的神經元由三部分組成:
樹突(輸入機制)—— 通過突觸接受輸入的樹狀結構。輸入可能是來自感覺神經細胞的感覺輸入,也可能是來自其他神經細胞的“計算”輸入。單個細胞可以有多達10萬輸入(每個來自不同的細胞)。
胞體(計算機制)—— 細胞體收集所有樹突的輸入,并基于這些信號決定是否激活輸出(脈沖)。這是一個概括性的說法,因為有些計算在傳入胞體前就完成了(在樹突結構中編碼)。
軸突(輸出機制)—— 一旦胞體決定是否激活輸出信號(也就是激活細胞),軸突負責傳輸信號,通過末端的樹狀結構將信號以脈沖連接傳遞給下一層神經元的樹突。
類似地,ANN中也有等價的結構:
輸入連接—— 每個神經元接受一組輸入,或者來自輸入層(等價于感覺輸入),或者來自網絡中前一層的神經元。
線性計算和激活函數—— 這些“累加”輸入,接著非線性地決定是否激活神經元。
輸出連接—— 這些傳遞激活信號至網絡中下一層的神經元。
類似地,卷積神經網絡借鑒了視覺通路。很酷的一件事情是,CNN原本主要借鑒的是架構(對應特定形狀或模式的較小的核/過濾器,每次應用于較小的區域)。然而,多年之后,當ML研究人員開發了新的可視化CNN隱藏層的技術后,人們發現CNN表示圖像的方式和視皮層的層次表示十分類似——從表示簡單模式的第一層開始,較深的層復合出復雜形狀和對象。
可塑性—— 大腦的獨特性質之一,學習和記憶得以成立的關鍵特性。大腦基于經歷創建新的脈沖連接,廢棄舊的脈沖連接,加強或削弱現有的連接。可塑性甚至在單個神經元中起作用——影響它的電磁行為,以及對特定輸入作出回應觸發激活的趨向。
可塑性這一想法是訓練ANN的關鍵原則——基于批次輸入迭代修改網絡參數(權重)。最近,元學習領域的進展將ANN中可塑性的應用范圍從參數拓展到超參數乃至整個模型。
關鍵區別
大腦神經元的復雜性和魯棒性要比人工神經元復雜強大得多。這不僅體現在神經元的數量及每個神經元的樹突數量上——比我們現在的ANN高出若干數量級,還體現在單個神經元的內部復雜性上:和人工神經元相比,神經元的化學和電學機制精細得多,也強健得多。例如,神經元不是零電位差的——細胞的不同區域可能具有不同的電位,有不同的電流通過。這讓單個神經元可以進行非線性運算,識別隨著時間發生的變動(例如,移動的目標),或者將不同的區域并行映射至不同的樹突區域——這樣整個細胞就可以完成復雜的復合任務。和非常簡單的人造神經元相比,這些都是高級很多的結構和能力。
實現—— 大腦中的神經元是以非常復雜和精細的機制實現的,可以進行非常復雜的非線性計算:
信號在神經元突觸間隙中的化學傳播,是通過神經遞質和感受器完成的,并由各種興奮和抑制元素放大。
基于復雜的時空電磁波推斷邏輯,興奮/抑制性突觸后電位構建了動作電位。
離子通道和微電位差控制脈沖的觸發,細胞體中的脈沖將沿著軸突傳播。
大量我們尚未理解的機制……
和這些相比,ANN中使用的參數、權重、線性函數、激活函數十分簡單粗暴。
在此之上,大腦中的神經元的整體架構要比大多數ANN復雜得多,特別是和常見的前饋網絡相比(前饋網絡的每一層只和前一層、后一層連接)。不過,即使是和多層RNN或者殘差網絡相比,大腦中的神經元網絡也是不可思議地復雜,在許多方向上有著數萬跨“層”、跨區域的樹突。
另一方面,大腦不太可能使用反向傳播這樣的方法——基于誤差函數的偏導數上的鏈式法則。
能源消耗—— 大腦是一個極端高效的計算機,差不多十瓦左右,約為單個CPU能耗的三分之一。
GAN、RL、RNN等新進展—— 在ML的理論和應用上,都不斷涌現新的想法和創新。這些都不再基于大腦的工作機制。它們也許受到了大腦的啟發,或者人類行為的啟發,但在許多方面,現在的ML方面的研究和工作過著屬于自己的生活——迎接自身的挑戰,追尋自身的機遇。
大腦是持續的靈感來源
盡管有上面列出的這些不同,ML研究仍然不斷將大腦列為靈感來源,因為大腦比我們現有的計算設備要強健和高效太多。認識人工神經網絡和大腦的差距,以及關于大腦機制的研究,激發了一些最激動人心也最具挑戰性的ML近期研究。例如:
能效—— 如前所述,大腦的神經元和連接數量比我們創建的任何ANN都要大上若干數量級,但它消耗的能量卻要少若干數量級。這是一個很活躍的研究領域,包括基于DNA和其他分子的生物網絡,以及試圖模仿神經元和突觸的神經形態(neuromorphic)電子開關。
從很小的訓練樣本集學習—— 最有可能是通過一些內置的模型,這些模型對物理法則、心理學、因果關系和其他決定地球上的決策和行動的規則有一些“直覺上的”理解。和現有的通用白板神經網絡相比,這些加速了學習,并能指導預測/行動。
釋放無監督學習和強化學習的威力—— 無監督學習和強化學習是AI的“暗能量”。物理上,暗能量占據了我們的宇宙的大部分,而我們對其知之甚少。與此類似,很明顯我們的大腦主要通過無監督學習和強化學習的方式進行學習。而當前的大部分ML應用使用監督學習。解開這一謎題是構建能像人類一樣學習的機器的關鍵。
新的方法和架構。例如,嗅覺背后的神經系統,可以為新的ML方法提供靈感,處理現有方法無法很好應對的一些問題。
最后,這當然不可能是一個全面的答案,明顯還有很多我沒提到的相似性和區別。例如,來自多倫多的Blake Richards做了一個很棒的簡短演講:從一個新穎獨特的角度陳述了大腦和深度學習在原則上的相似性。事實上,這一問題是我們的時代最激動人心、最復雜、進展最快的兩個研究領域的交匯之處,所以你可以期望在未來我們會了解更多。
-
神經網絡
+關注
關注
42文章
4778瀏覽量
101023 -
人工智能
+關注
關注
1793文章
47604瀏覽量
239546
原文標題:人工神經網絡真的像神經元一樣工作嗎?
文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論