在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

到底是什么讓機器學習達不到我們的期待呢?

nlfO_thejiangme ? 2018-03-27 13:56 ? 次閱讀

機器學習雖然能夠在很多地方顯示出強大的力量,同時也被集成到了很多的商業流程中去,但它依舊有一些不完美的地方,今天我們就通過一些典型的例子來深刻感受一下機器學習的局限性。

人臉識別

目前最先進的人臉識別系統可以達到99%的準確率。作為使用最為廣泛的機器學習算法,人臉識別得到了飛速的發展,但在這背后需要我們對幾件事情保持清醒。首先,99%的正確率是來自與驗證數據集的測試結果,而驗證數據集則來自于與訓練數據集相同的數據集,并從中隨機抽取。這就意味著數據的均值和方差與訓練數據十分相似。但當我們將系統置于真實情況下時,實際照片的特性與訓練數據不可能相同,那么實際的精度很有可能低于99%。

模型有時候會將其他的東西識別成人臉(假陽性)或者忘卻漏掉了人臉(假陰性)。不同的模型在不同的階段有著不同的表現,在使用時你需要確定你需要什么樣層次的模型,給出多高的精度是可以接受的。在選擇權衡算法時,一個模型在檢測幾千張臉時錯檢幾十張,而另一個模型可以將準確率提高一半但需要10x的處理時間和運算,那么前者將會是不錯的選擇。剩下的可以交給人類來做,我們對于少量假陽性和假陰性的樣本有著非常快的準確識別能力。

下面是幾個關于模型訓練的數據清理經驗。最好的當然是保證每一張臉都可以很容易地看到,沒有模糊遮擋,也沒有很奇怪的角度。同時圖像要保持適度的分辨率,分辨率太高的圖像容易引入造成算法失效的噪音。

光學字符識別(OCR)

目前最先進的光學字符識別系統對于文件的識別與排版已經有十分優異。基于邊緣檢測、計算機視覺與字符識別的技術使得OCR不斷改進,對于掃描文檔幾乎沒有障礙了。

但目前OCR還不能夠勝任的是非掃描文件的識別,這也是驗證碼還能作為網站人類識別的功能存在。人類對于字母識別有著無與倫比的能力,無論是模糊、扭曲、顏色不同都不在話下,而計算機望塵莫及。

OCR很有用但對于一些場景下使用不當就會文不對題,下面這張球賽的截頻就是一個典型的例子。

上圖如果用OCR識別很有可能生成這樣的一大串:

[0] PREMIER LEAGUE [1] TOT 2 [2] M [3] U [4] 0 [5] 36:2 [6] 4 [7] SPORTS [8] NEW 0 BUR 0 [9] HALFTIME [10] LIVE [11] NBCSN

如果沒有上下文語境我們很難明白識別出的意思,哪里是隊名哪里是logo?這會造成很大的混亂。

我們不應該像使用通用OCR一樣來直接簡單粗暴的套用,而是需要針對情況進行分析。對于上面的例子如果我們想要追蹤球員,那么目標追蹤的方法會很好,但如果想要追蹤比賽分數和時間,那么將OCR限定在固定區域中會是不錯的選擇。

視 頻

視頻是一種很神奇的存在,雖然很多機器學習模型能在視頻上實現和照片一樣的效果,但總會有意想不到的情況。數字世界的解碼和封裝總是與視頻的壓縮率和長寬比耦合在一起。

同時考慮到處理時間和算力的限制,對視頻進行處理時我們往往選擇低分辨的格式。當你選擇低分辨率或者較高的壓縮時,視頻并不會是一組連續的靜態圖片,所以計算機視覺的識別方法將會與靜態圖片中的識別方法有很大的差別。

為了說明這一情況我們可以隨便點開一個視頻并暫停,如下圖所示。人們的臉變得模糊、角度和整體形象都顯得和靜態下十分不同。

下面應該是計算機看到的人臉區域:

你能從中認出圖中的主角是誰嗎?如果對你來說很困難那么對于計算機來說也不容易!

對于人類來說,在視頻中識別人臉很容易,但要把獨立的幀抽取出來你會發現圖像質量出乎意料的差。

但我們也不能否定機器學習,因為機器學習在大多數情況下對于視頻的自動化分類和標注時十分重要的手段。我們需要明白的是我們期望得到的結果以及如何去修正模型實際的表現。如果一個龐大的全球名人識別模型對一段視屏進行檢測可能會出現很多假陽性的結果,但是如果使用一個僅僅包含幾個著名人士的模型來檢測則會得到好得多的結果。如果你的模型表現不好,你還可以從數據的角度來改進,譬如說某個節目中人臉出現的位置就可以作為先驗知識來幫助機器提高正確率。我們需要嘗試不同的模型和工作流總能取得成功。

如何成功的應用機器學習?

機器學習十分強大,有人將它應用于檢測學術造假的論文,也有人將它應用于人臉身份認證、不良內容的裸露檢測等。同樣也用于為用戶推薦商品和服務的推薦引擎上,在這樣的場景下假陽性和假陰性的推薦結果不會造成太大影響,事實上一些異常推薦還為用戶探索新事物提供了條件。

還有改善搜索引擎的個性化能力,檢測農作物動物的疾病以及預測產量等等方面。機器學習將會有無數的應用,我們對它充滿期待,但同時也會把握住期待的方向讓機器學習正常運轉。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人臉識別
    +關注

    關注

    76

    文章

    4012

    瀏覽量

    81960
  • 機器學習
    +關注

    關注

    66

    文章

    8422

    瀏覽量

    132723

原文標題:靈魂拷問:是什么讓機器學習達不到我們的期待呢?(開頭有個大事兒)

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    TPA3123 SE工作方式,實際輸出功率達不到標稱的70%,為什么?

    1、SE工作方式,實際輸出功率達不到標稱的70%:現象用示波器在負載兩端觀察,測試正弦波信號的上半周會先于下半周失真,從而影響輸出功率。 2、串擾只有20~40dB,達不到標稱參數:人不解的是,串擾信號波形是正弦波的半周,
    發表于 11-06 08:19

    TPA3136D2音頻功率放大器達不到10W,失真很高是什么原因

    TPA3136D2音頻功率放大器達不到10W,我是按照EVM給的電路圖畫的板子。焊好元器件用8921綜測儀測試時,12V電壓,負載6歐姆時,功率達不到10W,而且即使加大灌入的音頻電壓,失真很高,功率依然達不到10W,是什么原因
    發表于 10-15 08:29

    請問PCM2903C的溫度范圍到底是多少

    如下圖,PCM2903C的溫度范圍到底是多少? 如果用在-25~85℃,是否會出問題?
    發表于 10-14 07:14

    TAS2110 采用內部升壓模式, 輸出功率只有2W不到,是哪里的問題?

    后會恢復,然后又中斷。 所以達不到設計目標5W. 感覺系統哪里有保護啟動了。 請教可能到底是哪里有問題? 哪里起保護了嗎?
    發表于 10-11 06:53

    功放和運放到底是什么區別?

    想請問一下功放和運放到底是什么區別,感覺只要接一個小負載,運放的輸出電流也可以很大啊?到底有什么區別啊
    發表于 09-10 07:00

    運放的輸入電容到底是什么?

    我想請問一下運放的輸入電容到底是什么?
    發表于 09-04 06:52

    制作了VCA810的壓控增益電路,但是帶寬始終達不到35M,為什么?

    我按照器件手冊上的應用方法制作了VCA810的壓控增益電路,但是帶寬始終達不到35M,勉強也就16M。請問可能是什么原因
    發表于 08-26 07:03

    LM833實際放大倍數為4倍達不到設計的20倍,是什么問題

    LM833實際放大倍數為4倍達不到設計的20倍,是什么問題? 附件是相關電路,謝謝!
    發表于 08-19 06:54

    VCA810放大倍數達不到怎么解決?

    請教下大家,由于接收的信號動態范圍很大,我們選用VCA810,但是測試結果只能到-26到28dB,遠遠達不到±40dB,放大大概在給電壓大于-1.7V的時候就開始出現自激振蕩了,下面是電路圖還有
    發表于 08-16 13:33

    運放旁路電容必須靠近芯片引腳的原因到底是什么

    運放旁路電容必須靠近芯片引腳的原因到底是什么?有的說是怕走線的電感與旁路電容形成諧振,旁路電容靠近運放的時候走線的電感不應該更大了嗎(走線越長,走線的寄生電感也就越大)
    發表于 08-01 06:56

    共享單車到底是什么通信原理

    我們經常騎的共享單車到底是什么通信原理,有人了解過嗎? 一、智能車鎖 共享單車最核心的硬件是智能車鎖,主要用于實現控制和定位功能。
    發表于 04-09 10:33 ?864次閱讀
    共享單車<b class='flag-5'>到底是</b>什么通信原理

    Systick到底是用作延時好還是用作定時好?都有什么優缺點?

    功能,作基礎定時用,而不建議用作延時功能,方便后面程序移植. 最好有個定論,方便后面程序的移植,不能各自玩各自的,一個公司里面寫程序的風格和標準需要統一。 想問下各位,Systick到底是用作延時好?還是用作定時好,都有什么優缺點?
    發表于 04-08 07:37

    工字電感的額定電流達不到要求應該怎么解決

    電子發燒友網站提供《工字電感的額定電流達不到要求應該怎么解決.docx》資料免費下載
    發表于 02-28 10:25 ?0次下載

    共享單車到底是什么通信原理?

    我們經常騎的共享單車到底是什么通信原理,有人了解過嗎?下面寶藍小編就帶大家了解下。
    的頭像 發表于 02-25 10:32 ?1428次閱讀
    共享單車<b class='flag-5'>到底是</b>什么通信原理?

    插件磁環電感的電流達不到要求可以這樣處理

    能指標。我們在做插件磁環電感選型的時候,一定會研究電流方面的原因。如果插件磁環電感的額定電流達不到要求又應該如何解決? 在應用中,如果發現使用的插件磁環電感額定電流沒有辦法滿足設備運行要求,應該盡快采取有效措施以保證系
    的頭像 發表于 02-23 10:22 ?356次閱讀
    主站蜘蛛池模板: 欧美猛交xxxx免费看| 黄色超污网站| 一级一级特黄女人精品毛片| 亚洲精品久久婷婷爱久久婷婷| 4455ee日本高清免费观看| 亚洲一区二区三区免费| 69xxx网站| 国产精品免费久久久免费| www色综合| 午夜宅男在线视频| 日韩亚洲人成网站在线播放| 欧美zoozzooz性欧美| 国内精品免费视频精选在线观看| 国产福利资源在线| 亚洲爽爽网| 久草免费色站| caoporn成人免费公开| 日本aaaaa| 亚洲成在人| 日本大片成人免费播放| 激情综合站| 亚洲国产美女精品久久| 免费看欧美一级特黄α大片| 宅男噜噜噜66| 老熟女毛片| 色综合天天网| 久久久久琪琪免费影院| 4hu影院最新地址www| 美女自熨出白浆视频在线播放| 五月激情丁香| 久久精品免费在线观看| 亚洲xx网| 日本h片在线观看| 国产精品7m凸凹视频分类大全| 天天综合网天天做天天受| 成人在线一区二区| 亚洲精品在线视频观看| 天堂网2018| 黄色绿像一级片| 天天爽夜夜爽免费看| 日韩操穴|