完美世界辰东小说下载,完美世界txt下载,新寡妇村传奇

深度學習的成功和一系列令人驚訝的失敗模式教會了我們處理數(shù)據(jù)的寶貴教訓。本文展示了深度學習真正可以實現(xiàn)什么，與經(jīng)典計算機視覺的區(qū)別是什么，以及進行關(guān)鍵應(yīng)用的潛在危險有哪些。

我們對深度網(wǎng)絡(luò)的黑盒效應(yīng)都很熟悉了。雖然沒有人知道黑盒子里到底經(jīng)歷了什么，然而深度學習的成功以及一系列驚人的失敗模式，提供了如何處理的數(shù)據(jù)的寶貴教訓。

本文作者Piekniewski，將為我們展示深度學習的實際能力、與經(jīng)典計算機視覺的關(guān)系，在關(guān)鍵應(yīng)用上依賴深度學習的潛在危險，以及未來走向。

此人也對AI寒冬論持有堅定的信念，參見文章《深度學習到頂，AI寒冬將至！》《歷史總是在重演，AI寒冬或再來》。

視覺問題中沒有純粹的“簡單”和“復雜”

首先需要就視覺/計算機視覺做一點說明。原則上可以表述如下：給定一臺攝像機拍攝的圖像，計算機可以回答關(guān)于該圖像內(nèi)容的一些問題。

簡單的問題比如“圖像中是否存在三角形”，“圖像中是否存在人臉”；復雜的問題例如“是否有狗在圖像中追逐貓”。這些對人類來說小兒科的問題看似有很多相似的地方，然而事實卻證明這些問題的背后的復雜性存在巨大差異。

同樣是讓計算機回答“圖中是否有XX”的問題，“圖中是否有貓”顯然要比“圖中是否有紅色”更難。你看，試圖將視覺問題劃分為“簡單”或“復雜”將會陷入無止境的深淵。

這一點很重要。因為像我們?nèi)祟愡@種高度視覺化的動物，以上問題都不是問題。但對計算機深度學習來說，確實非常復雜。

傳統(tǒng)計算機視覺存在的問題

傳統(tǒng)的計算機視覺就是使用一套算法，從圖片里提取信息（通常表示為像素值數(shù)組）。比如去噪、增強和檢測的算法，一些方法旨在尋找簡單的幾何圖元，例如邊緣檢測、形態(tài)分析、霍夫變換、斑點檢測、角點檢測、各種圖像閾值處理技術(shù)等。還有特征表示技術(shù)和變換，如定向梯度的直方圖、Haar級聯(lián)等可以用作機器學習分類器的前端以構(gòu)建更復雜的檢測器。

與流行的看法相反，上述工具結(jié)合在一起可以組成非常強大有效的特定物體探測器。人們可以構(gòu)建面部檢測器、汽車檢測器、路牌檢測器，并且它們很可能在精度和計算復雜性方面，優(yōu)于這些特定對象的深度學習解決方案。

但問題是，每個探測器都需要由有能力的人員從頭開始構(gòu)建，低效又昂貴，且不可擴展的。

因此，李上上那些很厲害的探測器只適用于必須高頻場景，還需要證明前期投資的合理性。許多探測器都是專有的，一般公眾無法使用。

優(yōu)秀的面部探測器、車牌閱讀器很多，但狗探測器卻很少。沒有一個心智正常的人會投入人力和物力去編寫狗探測器或分類器，從圖像中分類出一種狗，貴且不切實際。

這是傳統(tǒng)視覺的死穴，卻是深度學習的用武之地。

用一個聰明學生的故事來解釋深度學習的本質(zhì)

想象一下，你正在教授計算機視覺課程。在開始的幾個講座中，學生了解到豐富的技術(shù)（例如上面討論的技術(shù)），接下來就是給學生布置一些任務(wù)。

先從一些簡單的任務(wù)開始，例如通過詢問圖像中是否有圓形或正方形；接下來逐漸提高復雜度。學生每周都要編寫計算機程序來解決下一個任務(wù)。而你來查看代碼，并在某些示例上運行代碼來檢驗效果。

這個學期，來了一個新生，他不跟周圍人說話，也從不問問題。但當他提交第一個解決方案時，你會發(fā)現(xiàn)這是一堆難以理解的代碼，跟你以前看到的代碼都不同。

看起來他正在用一些隨機看的過濾器對每個圖像進行卷積，然后使用一些非常奇怪的邏輯，許多“ifthenelse”語句具有大量搞不懂的參數(shù)來獲得最終答案。你在樣本上運行此代碼，它居然完全正常！你心想，這個方法是在不同尋常難以理解，但管他呢，確實有效啊！

幾周過去了，任務(wù)復雜度在不斷提升，你越來越看不懂這個學生的代碼，但就算是最復雜的任務(wù)，它的效果也令人驚訝。最后一個問題是在一組真實的圖像中區(qū)分貓和狗。其他學生代碼的準確率都沒有超過65％，但新學員的代碼能夠達到95％！太不可思議了。

你對代碼進行了逆向工程，結(jié)果發(fā)現(xiàn)他那堆復雜的代碼，背后的邏輯其實非常簡單：

檢測是否有狗牌：如果有返回“狗”；沒有返回“貓”

如果沒有狗牌，檢測圖像的左側(cè)部分是否比右側(cè)部分更黃：如果是返回“狗”；不是返回“貓”

你把這個學生叫到辦公室問他是怎么想的，他表示其實自己也不知道，他根本不明白貓和狗是什么，只知道通過什么方法將二者區(qū)分出來。這算作弊嗎？從人類的角度來看，是的，他的出發(fā)點和你想的完全不同。

雖然其他學生使用原始數(shù)據(jù)集并沒有得到特別突出的結(jié)果，但也不會出什么奇怪的錯誤。相比而言，新學生的方式雖然在使用當前數(shù)據(jù)集的時候，效果卓著，然而一旦稍微對數(shù)據(jù)集做一點改動，例如將狗牌貼在貓身上，結(jié)果就是完全錯誤的。

深度學習的天賜和詛咒

上面那個新學生的例子，其實很形象的表述了深度學習的特性。

深度學習是一種使用梯度反向傳播的、特定優(yōu)化技術(shù)來生成“程序”（也稱為“神經(jīng)網(wǎng)絡(luò)”）的技術(shù)。上面學生的程序只是構(gòu)建一組轉(zhuǎn)換和條件，將正確的標簽分配給數(shù)據(jù)集中的正確圖像。而且總是在尋求解決問題最省力的方法，比如給定數(shù)據(jù)集里，狗的圖片都在右上角有一道藍色的光暈，那么深度學習就會立刻使用這作為區(qū)分貓狗的標準。

為了消除這些虛假的偏差，我們通常會向訓練集添加更多數(shù)據(jù)、反向傳播生成的“程序”可能非常大、非常復雜，具有數(shù)百萬個參數(shù)和數(shù)千個條件檢查，可以鎖定到組合更精細偏見的組合。任何允許分配正確標簽以統(tǒng)計優(yōu)化目標函數(shù)的東西都會做，無論是否與任務(wù)的“語義精神”相關(guān)。

深度網(wǎng)絡(luò)能否最終鎖定到“語義正確”先驗的東西上？當然可以。但現(xiàn)在有大量證據(jù)表明，實際上并非五次。對抗性的例子表明，對圖像的微小修改都可以導致錯誤的結(jié)果。對類似于先前訓練的數(shù)據(jù)集的新樣本的研究表明，超出原始數(shù)據(jù)集的泛化遠比數(shù)據(jù)集中的泛化弱得多。

自動創(chuàng)建無人能想到的功能，是深度學習的最大優(yōu)勢，同時也是它的最大弱點、因為大多數(shù)時候，至少在語義上是存疑的。

深度學習在什么情況下好用，什么情況下不可用？

深度學習無疑是計算機視覺工具箱的一個有趣補充。現(xiàn)在可以相對容易地“訓練”探測器來探測物體，還可以在一定程度通過調(diào)整探測器來使用更多算力。但同時也需要為深度網(wǎng)絡(luò)的黑盒屬性付出高昂的代價，我們無法確定他如何做出決定，而且跟我們認可的“語義精神”毫無關(guān)系。因此，在輸入數(shù)據(jù)中出現(xiàn)的任何低級偏差都會導致檢測器意外地失敗，而且這些失效條件實際上無法表征。

因此在落地應(yīng)用時，深度學習主要用于對錯誤不敏感、且能夠保證輸入不會與訓練數(shù)據(jù)集有很大差異場景，例如圖像搜索，可能是監(jiān)視，自動零售以及幾乎所有的“非關(guān)鍵任務(wù)”，95％的準確率非常夠用了。

具有諷刺意味的是，大多數(shù)人堅信深度學習在無人駕駛汽車、自動機器人場景下的應(yīng)用是一場革命，Piekniewski認為，只能將這種信念描述為“不幸”的誤解。因為這些場景需要需要實時決策，容錯率極低，經(jīng)常會導致致命的結(jié)果，最近的研究顯示基于深度神經(jīng)的自動駕駛解決方案在現(xiàn)實生活中確實容易受到對抗性攻擊。

還有人對深度學習應(yīng)用在醫(yī)學和診斷中寄予厚望。然而，在這個領(lǐng)域，也有一些相關(guān)的發(fā)現(xiàn)，例如，在一個機構(gòu)數(shù)據(jù)上訓練的模型失敗了，換一個機構(gòu)數(shù)據(jù)卻成功了，說明這些模型使用比許多研究人員所希望的更淺度的數(shù)據(jù)。

數(shù)據(jù)比我們想象的更淺。

深度學習 vs 傳統(tǒng)計算機視覺

深度學習現(xiàn)在非常流行，但傳統(tǒng)的計算機視覺也并非就失去價值。

傳統(tǒng)計算機視覺仍然可以用來構(gòu)建強大的探測器。這些手工做成的探測器可能無法在某些特定數(shù)據(jù)集指標上實現(xiàn)高性能，但可以保證依賴于輸入的“語義相關(guān)”特征集，它的故障模式可以更好地表征和預期。

深度學習提供統(tǒng)計上強大的探測器，而不需要昂貴的特征工程，盡管仍需要大量已標記的數(shù)據(jù)，外加大量GPU和現(xiàn)場的深度學習專家。而且，這些探測器會意外地失效，適用范圍也不容易被（完全）表征。

所以，在容錯率高的場景中，可以選擇深度學習；在容錯率低且計算復雜性更重要的場景中，經(jīng)典機器視覺管道將在可預見的未來繼續(xù)占據(jù)重要位置。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

分類器

分類器

+關(guān)注

關(guān)注
0

文章
152

瀏覽量
13206
計算機視覺

計算機視覺

+關(guān)注

關(guān)注
8

文章
1699

瀏覽量
46055
深度學習

深度學習

+關(guān)注

關(guān)注
73

文章
5511

瀏覽量
121354

原文標題：深度學習的天賜和詛咒：最大的優(yōu)勢也是最大的缺陷

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

請問計算機視覺與深度學習要看什么書？

計算機視覺與深度學習，看這本書就夠了

發(fā)表于 05-21 12:43

深度學習在計算機視覺領(lǐng)域圖像應(yīng)用總結(jié) 精選資料下載

突破的領(lǐng)域，真正讓大家大吃一驚的顛覆傳統(tǒng)方法的應(yīng)用領(lǐng)域是語音識別，做出來的公司是微軟，而不是當時如日中天的谷歌。計算機視覺應(yīng)用深度學習堪稱突

發(fā)表于 07-28 08:22

深度學習與傳統(tǒng)計算機視覺簡介

文章目錄1 簡介1.1 深度學習與傳統(tǒng)計算機視覺1.2 性能考量1.3 社區(qū)支持2 結(jié)論3 參考在計算機

發(fā)表于 12-23 06:17

深度學習是否會取代傳統(tǒng)的計算機視覺？

理解傳統(tǒng)的計算機視覺實際上真的有助于你更好的使用深度學習。例如，計算機視覺中最常見的神經(jīng)網(wǎng)絡(luò)是卷

發(fā)表于 04-02 10:37 ?6240次閱讀

深度學習不能取代計算機視覺技術(shù)背后的真正原因

深度學習只是一種 計算機視覺工具，而不是包治百病的良藥，不要因為流行就一味地使用它。傳統(tǒng)的計算機視覺

發(fā)表于 04-05 11:37 ?4798次閱讀

計算機視覺與機器視覺區(qū)別

　“計算機視覺”，是指用計算機實現(xiàn)人的視覺功能，對客觀世界的三維場景的感知、識別和理解。計算機

發(fā)表于 12-08 09:27 ?1.3w次閱讀

深度學習在計算機視覺上的四大應(yīng)用

計算機視覺中比較成功的深度學習的應(yīng)用，包括人臉識別，圖像問答，物體檢測，物體跟蹤。

發(fā)表于 08-24 16:16 ?4897次閱讀

機器視覺與計算機視覺的區(qū)別的講解

機器視覺與計算機視覺的區(qū)別的講解。

發(fā)表于 04-27 10:34 ?7次下載

深度學習和傳統(tǒng)計算機視覺技術(shù)在新興領(lǐng)域的比較

是不是深度學習就可以解決所有問題呢？是不是它就比傳統(tǒng)計算機視覺方法好呢？但是深度

發(fā)表于 11-28 11:01 ?1669次閱讀

計算機視覺識別是如何工作的？

計算機視覺識別是一種人工智能技術(shù)，旨在使計算機系統(tǒng)從數(shù)字圖像、視頻等視覺信息中識別和提取有意義信息的能力。

發(fā)表于 02-09 13:41 ?3917次閱讀

機器視覺和計算機視覺的區(qū)別

機器視覺和計算機視覺的區(qū)別 機器視覺和計算機視覺是兩

發(fā)表于 08-09 16:51 ?2064次閱讀

計算機視覺中的九種深度學習技術(shù)

計算機視覺中仍有許多具有挑戰(zhàn)性的問題需要解決。然而，深度學習方法正在針對某些特定問題取得最新成果。在最基本的問題上，最有趣的不僅僅是深度

發(fā)表于 08-21 09:56 ?645次閱讀

用于計算機視覺的經(jīng)典機器學習應(yīng)用分析

深度學習是指在大部分未處理或“原始”數(shù)據(jù)上運行的非常大的神經(jīng)網(wǎng)絡(luò)模型。深度學習通過將特征提取操作拉入模型本身，對計算機

發(fā)表于 11-07 10:11 ?447次閱讀

深度學習在計算機視覺領(lǐng)域的應(yīng)用

隨著人工智能技術(shù)的飛速發(fā)展，深度學習作為其中的核心技術(shù)之一，已經(jīng)在計算機視覺領(lǐng)域取得了顯著的成果。計算機

發(fā)表于 07-01 11:38 ?885次閱讀

計算機視覺和機器視覺區(qū)別在哪

計算機視覺和機器視覺是兩個密切相關(guān)但又有明顯區(qū)別的領(lǐng)域。一、定義 計算機視覺

發(fā)表于 07-09 09:22 ?493次閱讀