在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里讀唇AI幫助5億聽障人士

汽車玩家 ? 來源:venturebeat ? 作者:venturebeat ? 2019-12-06 16:00 ? 次閱讀

阿里又出黑科技。新的唇語閱讀 AI 系統(tǒng)在識別準(zhǔn)確率表現(xiàn)上不僅超越基線標(biāo)準(zhǔn),也優(yōu)于專家級人類水平,有望為全球近 5 億聽障人士帶來福音。

阿里巴巴又出黑科技,AI 看唇語知內(nèi)容!

實際上,能夠從視頻中讀取嘴唇的 AI 和機(jī)器學(xué)習(xí)算法并沒有什么不同。早在 2016 年,來自 Google 和牛津大學(xué)的研究人員就詳細(xì)介紹了一種系統(tǒng),該系統(tǒng)可以 46.8% 的準(zhǔn)確度注釋視頻錄像,這個表現(xiàn)明顯優(yōu)于專業(yè)唇語識別人士 12.4% 準(zhǔn)確度。但是,即使是最先進(jìn)的系統(tǒng),也難以克服唇語識別時的歧義問題,這使唇語 AI 的性能一直難以超越音頻語音識別

為了追求更好的性能,浙江阿里巴巴公司和史蒂文斯理工學(xué)院的研究人員聯(lián)合設(shè)計了一種方法,稱為 LIBS,該方法利用從語音識別器中提取的特征作為唇語識別時的補(bǔ)充信息。研究人員表示,LIBS 系統(tǒng)在兩個基準(zhǔn)測試中都達(dá)到了業(yè)界領(lǐng)先的準(zhǔn)確度,在識別字符錯誤率方面,LIBS 分別較基線性能高出 7.66% 和 2.75%。

LIBS 和其他類似的解決方案一樣,都可以幫助聽障人士觀看缺少字幕的視頻。據(jù)估計,全世界有 4.66 億人患有失能性聽力障礙,約占世界人口的5%。根據(jù)世界衛(wèi)生組織的數(shù)據(jù),到 2050 年,這一數(shù)字可能會超過 9 億。

LIBS 會從說話人的視頻中以多種不同尺度提取有用的音頻信息,包括序列級、上下文級和幀級。然后,系統(tǒng)會識別這些信息之間的對應(yīng)關(guān)系,將數(shù)據(jù)與視頻數(shù)據(jù)進(jìn)行對齊(由于開頭或結(jié)尾有時會出現(xiàn)采樣率不一致、視頻和音頻序列的長度不一致等情況),并利用過濾技術(shù)來優(yōu)化蒸餾功能。


LIBS 系統(tǒng)架構(gòu)示意圖

LIBS 的語音識別器和口語閱讀器組件均基于注意力的 seq2seq 體系結(jié)構(gòu),這是一種機(jī)器翻譯方法,可將序列的輸入(即音頻或視頻)映射到帶有標(biāo)簽的輸出和注意力值上。研究人員對上述內(nèi)容在 LRS2 和 CMLR 數(shù)據(jù)集上進(jìn)行了訓(xùn)練,LRS2 包含來自 BBC 的 45000 多個口語句子,CMLR 則是最大的中文普通話口語語料庫,包括了來自中國網(wǎng)絡(luò)電視臺網(wǎng)站的 10 萬余個自然句(包括 3000 多個漢字和 20000 多個短語)。

不過,研究團(tuán)隊也表示,由于某些句子長度太短,該模型難以在 LRS2 數(shù)據(jù)集上實現(xiàn)“合理的”結(jié)果。(解碼器從少于 14 個字符的句子中提取相關(guān)信息時會遇到困難。)但是,一旦對最大長度為 16 個單詞的句子進(jìn)行了預(yù)訓(xùn)練,解碼器將可以通過對上下文級別的知識進(jìn)行設(shè)置,提高 LRS2 數(shù)據(jù)中句子結(jié)尾部分的質(zhì)量。

研究人員在描述其工作的論文中寫道:“ LIBS 減少了對無關(guān)框架的關(guān)注。” “幀級知識提煉進(jìn)一步提高了視頻幀特征的可分辨性,使注意力更加集中。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30947

    瀏覽量

    269213
  • 語音識別
    +關(guān)注

    關(guān)注

    38

    文章

    1741

    瀏覽量

    112677
  • 阿里
    +關(guān)注

    關(guān)注

    6

    文章

    438

    瀏覽量

    32839
收藏 人收藏

    評論

    相關(guān)推薦

    阿里國際推出全球首個B2B AI搜索引擎Accio

    近日,在歐洲科技峰會Web Summit上,阿里國際正式推出了全球首個B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品面向全球商家開放,標(biāo)志著阿里國際正式入局當(dāng)前備受矚目的AI S
    的頭像 發(fā)表于 11-15 16:53 ?706次閱讀

    阿里達(dá)成股東訴訟和解協(xié)議 阿里同意支付超30元和解

    阿里的消息總是被大家關(guān)注;我們看到在26日,阿里巴巴集團(tuán)發(fā)布了一份公告,公告中稱阿里同意支付4.335美元(換算下來約30.87元人民幣
    的頭像 發(fā)表于 10-28 16:28 ?359次閱讀

    阿里巴巴季報出爐 阿里云二季度營收增長6%

    調(diào)整EBITA利潤達(dá)到450.35阿里巴巴的季度經(jīng)營業(yè)績超出市場預(yù)期。AI則是一個大亮點;AI正推動阿里云重回增長。
    的頭像 發(fā)表于 08-16 16:45 ?509次閱讀

    阿里云推出首個域名AI大模型應(yīng)用

    阿里云近日宣布其域名產(chǎn)品服務(wù)已全面完成AI化升級,并成功推出首個基于通義大模型的域名AI應(yīng)用。此次升級不僅引入了“.ai”等40多個熱門新域名后綴,還納入了2000萬個全球域名資源,極
    的頭像 發(fā)表于 08-09 14:55 ?533次閱讀

    Cohere融資5美元,加速AI賽道競爭步伐

    據(jù)最新金融時報報道,加拿大人工智能初創(chuàng)企業(yè)Cohere在最新一輪融資中成功籌集了高達(dá)5美元的資金,這一壯舉不僅鞏固了其在全球AI領(lǐng)域的領(lǐng)先地位,也顯著提升了其與行業(yè)巨頭如OpenAI
    的頭像 發(fā)表于 07-23 14:38 ?542次閱讀

    阿里巴巴完成50美元可轉(zhuǎn)換優(yōu)先票據(jù)發(fā)行

    阿里巴巴已向美國證券交易委員會遞交了6-K表格,內(nèi)容涉及已完成的私募發(fā)行,其中包括初始購買者有權(quán)額外購買最多5美元(約合36.3元人民幣)的票據(jù)。
    的頭像 發(fā)表于 05-30 10:20 ?514次閱讀

    阿里與京東將發(fā)行可轉(zhuǎn)債,擬募集超50美元資金

    5 月 23 日消息,彭博社透露,阿里巴巴正在考慮發(fā)行可轉(zhuǎn)債籌集大約 50 美元資金,以支持股票回購及業(yè)務(wù)增長。據(jù)悉,阿里已與投行溝通發(fā)行事宜,且最早有望于本周啟動發(fā)行程序。
    的頭像 發(fā)表于 05-23 16:13 ?685次閱讀

    阿里云 all in AI 的決心

    “第一個提出MaaS的阿里云,能否成為云廠商在AI時代變革的新范本?”如何抓住AI的機(jī)會?這是進(jìn)入大模型時代后,面對新的起點,各大云廠商在不斷思考的問題。毋庸置疑,AI與云已經(jīng)成為緊密
    的頭像 發(fā)表于 05-17 08:04 ?323次閱讀
    <b class='flag-5'>阿里</b>云 all in <b class='flag-5'>AI</b> 的決心

    阿里宣布派發(fā)約40美元股息 財報顯示AI相關(guān)收入實現(xiàn)三位數(shù)同比增長

    阿里宣布派發(fā)約40美元股息 財報顯示AI相關(guān)收入實現(xiàn)三位數(shù)同比增長 日前,阿里巴巴集團(tuán)發(fā)布了2024財年Q4及全年業(yè)績數(shù)據(jù);財報顯示阿里業(yè)
    的頭像 發(fā)表于 05-15 12:13 ?779次閱讀

    虹軟PhotoStudio AI入駐阿里1688平臺,加碼B2B商拍服務(wù)!

    虹軟PhotoStudio? AI(簡稱PSAI)喜迎新進(jìn)展,已于5月11日正式入駐阿里1688平臺,將為數(shù)千萬網(wǎng)商提供高效、便捷的AI商拍服務(wù)。
    的頭像 發(fā)表于 05-13 11:43 ?615次閱讀
    虹軟PhotoStudio <b class='flag-5'>AI</b>入駐<b class='flag-5'>阿里</b>1688平臺,加碼B2B商拍服務(wù)!

    創(chuàng)客打造智能眼鏡,助人士理解手語

    據(jù)悉,知名創(chuàng)客Nekhil近期將樹莓派進(jìn)行深度改裝,成功研發(fā)出一款可用于解讀手語的智能眼鏡,以解決人士的溝通問題。
    的頭像 發(fā)表于 04-23 15:32 ?485次閱讀

    阿里云內(nèi)部全面推行AI寫代碼

    阿里云正在內(nèi)部全面推行 AI 編程,使用通義靈碼輔助程序員寫代碼、代碼、查 BUG、優(yōu)化代碼等。
    的頭像 發(fā)表于 04-07 09:22 ?563次閱讀

    阿里大模型“通義悟”升級

    阿里旗下的強(qiáng)大模型產(chǎn)品“通義悟”近日迎來了一系列功能升級,其中包括備受矚目的音視頻問答助手“小悟”的正式上線。這一新功能憑借出色的多語言Query處理能力、長篇章文本理解能力以及指令演化框架優(yōu)化
    的頭像 發(fā)表于 03-21 11:30 ?1039次閱讀

    大模型初創(chuàng)公司MiniMax估值超25美元

    近日,據(jù)業(yè)內(nèi)消息人士透露,阿里巴巴集團(tuán)已經(jīng)領(lǐng)投了中國AI初創(chuàng)公司MiniMax的新一輪融資,此次融資后,MiniMax的估值已經(jīng)飆升至超過25美元,顯示出市場對該公司的高度認(rèn)可與期待
    的頭像 發(fā)表于 03-07 10:39 ?1483次閱讀

    讓“聾人”看到聲音 行空板 —“AI助聽器”

    世界上有各種各樣的殘障人士,這些人或不能說話,或聽不見聲音。聾人,是聽力因先天遺傳或后天人為因素而受損的殘疾人,也叫聽力障礙者,簡稱人。根據(jù)最近的全國人口普查統(tǒng)計,全中國大約有2700多萬
    的頭像 發(fā)表于 01-12 13:12 ?452次閱讀
    主站蜘蛛池模板: 国产精品色片| 68日本xxxⅹxxxxx18| 午夜精品一区二区三区在线视| xxxx欧美69免费| 88xx成人永久免费观看| 人色网| 黄色在线播放网址| 亚洲日本一区二区| 久久国产精品免费专区| 一级毛片看真人在线视频 | 成人在线免费电影| 亚洲综合色网站| 欧美另类图片亚洲偷| 91学院派女神| 欧美成人性色生活片天天看| 国产一级毛片午夜| heyzo在线播放4k岛国| 老司机亚洲精品影院在线| 优优国产在线视频| 欧美视频不卡一区二区三区| 在线色站| 日韩免费视频一区二区| 久久久久久久久综合| 伊人网在线免费视频| tv电影天堂| 色之综综| h网站在线观看| 亚洲一级色| 免费一级视频在线播放| www.av网| 国产在线观看福利| 欧美性色黄大片四虎影视| 四虎永久网址| 狠狠色狠狠色综合日日小蛇| 久久综合图片| 伊人网在线视频观看| 国产精品久久久亚洲456| 色中色资源| 色播五月激情五月| 第四色视频| 爱操成人网|