自動(dòng)駕駛領(lǐng)域的技術(shù)變革呼之欲出。
如果說(shuō),自動(dòng)駕駛大規(guī)模落地的痛點(diǎn)在于深度學(xué)習(xí)的范疇僅限于圖像等靜態(tài)材料,那很快,自動(dòng)駕駛深度學(xué)習(xí)的范圍將擴(kuò)展到視頻領(lǐng)域。
近日,眾安信息技術(shù)服務(wù)有限公司(以下簡(jiǎn)稱(chēng)“眾安科技”)數(shù)據(jù)科學(xué)實(shí)驗(yàn)室的論文"Dense Dilated Network for Few Shot Action Recognition"(《基于密集擴(kuò)展網(wǎng)絡(luò)的少樣本視頻動(dòng)作識(shí)別》)被ICMR(國(guó)際多媒體圖像分析峰會(huì))錄用,這是深度學(xué)習(xí)在視頻分類(lèi)領(lǐng)域的創(chuàng)新應(yīng)用,在駕駛行為分析、視頻檢索等領(lǐng)域有重要的業(yè)務(wù)價(jià)值。
深度學(xué)習(xí)進(jìn)入“視頻學(xué)習(xí)”時(shí)代
“讀圖”已經(jīng)無(wú)法滿(mǎn)足機(jī)器的學(xué)習(xí)胃口。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表面特征的方法,其概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。目前,深度學(xué)習(xí)的主要素材來(lái)源于文字、圖片,而隨著智能手機(jī)等設(shè)備的發(fā)展,視頻沉淀了大量深度學(xué)習(xí)素材。近年來(lái)人工智能、神經(jīng)網(wǎng)絡(luò)的發(fā)展更是促進(jìn)了視頻的分類(lèi)、識(shí)別的研究。
不過(guò),機(jī)器想要學(xué)習(xí)視頻素材絕非易事。一般來(lái)說(shuō),訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)需要大量標(biāo)記良好的數(shù)據(jù)。對(duì)于機(jī)器來(lái)說(shuō),由于視頻動(dòng)作、視角較多,且視頻每秒都包含了20-30幀畫(huà)面,數(shù)據(jù)規(guī)模較大,機(jī)器的標(biāo)注難度比標(biāo)注圖像復(fù)雜很多倍。另一方面,就視頻本身而言,雖然不同的視頻內(nèi)容差異很大,但同一類(lèi)的視頻在語(yǔ)義上有著很高的相似性,對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō),如何避免“重復(fù)勞動(dòng)”也是擺在現(xiàn)實(shí)面前的一道難題。
針對(duì)上述難題,眾安科技通過(guò)在視頻多樣性中提取高層共有的特性來(lái)實(shí)現(xiàn)機(jī)器學(xué)習(xí)。
眾安科技方面表示,基于機(jī)器學(xué)習(xí)視頻的痛點(diǎn),數(shù)據(jù)科學(xué)實(shí)驗(yàn)室研發(fā)了一種新穎的神經(jīng)網(wǎng)絡(luò)架構(gòu)來(lái)同時(shí)捕獲局部信息和整體時(shí)空信息。具體來(lái)看,眾安科技采用了擴(kuò)張卷積網(wǎng)絡(luò),在這個(gè)網(wǎng)絡(luò)的不同層之間,使用密集連接的方式組合,由此可以融合每一層的輸出,從而學(xué)習(xí)視頻的高級(jí)特征。
和其他網(wǎng)絡(luò)架構(gòu)相比,眾安科技的這款神經(jīng)網(wǎng)絡(luò)架構(gòu)利用每層與之前所有層相連的方式,可以得到從最初局部特征到總體視頻的所有特征信息。而每層網(wǎng)絡(luò)使用了擴(kuò)張卷積(dilated convolution),相比原始的卷積方式,可以更加充分利用時(shí)空信息。因此不需要很深的層數(shù),在少量數(shù)據(jù)下就可以訓(xùn)練效果較好的網(wǎng)絡(luò)。
以目前動(dòng)作類(lèi)別數(shù)、樣本數(shù)較多的數(shù)據(jù)庫(kù)之一UCF101為例,眾安科技在此數(shù)據(jù)庫(kù)的通用視頻數(shù)據(jù)集上進(jìn)行了大量實(shí)驗(yàn),在僅有20%的訓(xùn)練數(shù)據(jù)時(shí)(模擬對(duì)新任務(wù)的快速學(xué)習(xí)),利用該神經(jīng)網(wǎng)絡(luò)架構(gòu),機(jī)器仍然可以學(xué)到每類(lèi)視頻的高層語(yǔ)義特征。
視頻深度學(xué)習(xí)下個(gè)落地場(chǎng)景:出行、醫(yī)療
視頻深度學(xué)習(xí)有望率先在出行和醫(yī)療領(lǐng)域落地。
眾安科技研發(fā)的這款神經(jīng)網(wǎng)絡(luò)架構(gòu)在實(shí)戰(zhàn)中也有很高的應(yīng)用價(jià)值,由于該架構(gòu)只需要少量訓(xùn)練數(shù)據(jù)就可以促進(jìn)不同任務(wù)之間的遷移學(xué)習(xí),幫助系統(tǒng)快速上線(xiàn),從而減少了大量采集數(shù)據(jù)和訓(xùn)練過(guò)程。
如在車(chē)險(xiǎn)領(lǐng)域,可以使用該方法對(duì)路口監(jiān)控或行車(chē)記錄儀等視頻進(jìn)行快速分析,識(shí)別碰撞和高危駕駛片段,從而對(duì)車(chē)主的駕駛行為進(jìn)行建模,實(shí)現(xiàn)車(chē)險(xiǎn)的自主定價(jià)。
此外,在醫(yī)療方面,目前人工智能輔助醫(yī)療的手段除了CT圖片等,還有許多造影等多樣的數(shù)據(jù)有待分析。該方法利用時(shí)序信息,可以針對(duì)造影進(jìn)行識(shí)別診斷,尤其是對(duì)于病例較少的罕見(jiàn)病分析更為高效。
眾安科技數(shù)據(jù)科學(xué)實(shí)驗(yàn)室認(rèn)為,該神經(jīng)網(wǎng)絡(luò)架構(gòu)針對(duì)出行和醫(yī)療領(lǐng)域會(huì)有較大的幫助,這也是該團(tuán)隊(duì)未來(lái)產(chǎn)學(xué)研結(jié)合的落地方向之一。
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4773瀏覽量
100882 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8423瀏覽量
132761 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
784文章
13852瀏覽量
166579
原文標(biāo)題:從圖像識(shí)別走向視頻識(shí)別,眾安科技推出視頻深度學(xué)習(xí)利器
文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論