2012年多倫多大學的研究人員首次使用深度學習在ImageNet大規(guī)模視覺識別挑戰(zhàn)賽中獲勝,深度學習漸漸被人們所熟知。而對于AI行業(yè)的從業(yè)者來說,深度學習下的計算機視覺,是使計算機能夠理解圖像背景的一門重要學科,也是人工智能中最具挑戰(zhàn)性的領域之一。目前,國內(nèi)計算機視覺飛速發(fā)展,有了曠視科技face++、商湯科技、極鏈科技Video++等優(yōu)質(zhì)企業(yè)。那么,深度學習究竟是什么呢?本文將詳細的解釋當前深度學習下的兩個熱點問題。
深度學習這一想法本身并不新穎,早在1959年就被討論過。當時受限于算法、硬件水平及數(shù)據(jù)量的限制,沒有得到很好的發(fā)展。近60年,隨著硬件水平的不斷提升,數(shù)據(jù)量的爆炸式增長,深度學習再一次煥發(fā)出勃勃生機,并展現(xiàn)出優(yōu)異的性能。
而計算機視覺領域中關鍵的深度學習,也成為了被關注的焦點。人工神經(jīng)網(wǎng)絡的概念是深度學習算法的主要組成部分,已經(jīng)存在數(shù)十年,第一個神經(jīng)網(wǎng)絡可以追溯到20世紀50年代。由于數(shù)十年的研究以及數(shù)據(jù)和計算資源的可用性,深度學習的概念已經(jīng)從實驗室走出并進入實際領域。
那么深度學習和機器學習是一回事么?
深度學習是一個非常復雜的計算機科學領域,它涉及許多高級數(shù)學概念。但在過去幾年中,學術界已經(jīng)創(chuàng)建了大量的工具和庫來抽象出潛在的復雜性,并使你能夠無須解決過多的數(shù)學問題來開發(fā)深度學習模型。
深度學習和機器學習并不相同,深度學習是機器學習的一個子集。通常,機器學習適用于基于訓練數(shù)據(jù)模型和行為規(guī)則的所有技術,ML技術已經(jīng)投入生產(chǎn)使用了很長時間。在深度學習之前,科學家們必須在編寫“功能”或模塊方面投入大量精力,這些功能可以執(zhí)行模型想要執(zhí)行的任務的一小部分。例如,如果你想要創(chuàng)建一個可以檢測物體的AI模型,你將編寫一段程序來檢測這個物體的特征,而且必須使這些程序足夠強大,以便從不同角度和不同光照條件下檢測這些特征,并告訴不同的物體之間的差異。經(jīng)過以上這些操作后,你才可以在這些基礎上進行基礎學習。
深度學習是科學的嗎?
盡管深度學習過程可以用數(shù)學符號描述,但這個過程本身是不科學的。深度學習就像一個黑匣子,我們無法理解這個系統(tǒng)是如何理解處理特征并完成相關任務的。
以卷積操作舉例,正如TensorFlow手冊中所說,卷積層發(fā)現(xiàn)相關性。許多草葉通常代表一個草坪,在TensorFlow中,系統(tǒng)會花費大量時間來發(fā)現(xiàn)這些相關性。一旦發(fā)現(xiàn)了某些相關性,這種關聯(lián)會導致模型中某些權(quán)重的調(diào)整,從而使得特征提取正確。但從本質(zhì)上來說,所有的相關性開始時對于模型來說都被遺忘了,必須在每次前向傳播和梯度下降的過程中來重新發(fā)現(xiàn)。這種系統(tǒng)實際上是從錯誤中吸取教訓,即模型輸出與理想輸出之間的誤差。
前向和反向傳播過程對圖像理解有一定的意義,有些人在文本上使用了相同的算法。幸運的是,針對于文本任務而言,有更加高效的算法。首先,我們可以使用大腦突觸或編程語言中的常規(guī)指針或?qū)ο笠蔑@式地表示所發(fā)現(xiàn)的相關性,神經(jīng)元與神經(jīng)元之間有關聯(lián)。
所以說,無論是深度學習算法,還是有機學習,都不能說是科學的。它們在缺乏證據(jù)并信任相關性的前提下得出結(jié)論,而不堅持可證明的因果關系。大多數(shù)深層神經(jīng)網(wǎng)絡編程很難得到理想結(jié)果并存在一定的誤差,只能通過從實驗結(jié)果中發(fā)現(xiàn)線索來改進模型。增加網(wǎng)絡層數(shù)不總是有效的,對于大多數(shù)深度神經(jīng)網(wǎng)絡從業(yè)者而言,根據(jù)實驗結(jié)果來調(diào)整改進網(wǎng)絡就是他們的日常工作。沒有先驗模型,就沒有先驗估計。任何深層神經(jīng)網(wǎng)絡可靠性和正確性的最佳估計,都是經(jīng)過大量的實驗得到。
-
機器學習
+關注
關注
66文章
8437瀏覽量
132897 -
深度學習
+關注
關注
73文章
5511瀏覽量
121392
發(fā)布評論請先 登錄
相關推薦
評論