90分鐘超時(shí)放送、1.4萬字干貨解讀,這位人工智能行業(yè)的稀缺女將,究竟返校說了啥?7月2日,浙江大學(xué)第二期“互聯(lián)網(wǎng)+”創(chuàng)新創(chuàng)業(yè)大講堂準(zhǔn)時(shí)“云端”開課,百度集團(tuán)副總裁吳甜作為本期主講嘉賓為學(xué)弟學(xué)妹們帶來《人工智能技術(shù)的實(shí)踐與創(chuàng)新》的分享。
時(shí)值畢業(yè)季,百度吳甜以浙大師姐的身份開啟了在線講堂,以百度的工作為例,生動(dòng)又系統(tǒng)的講解了人工智能技術(shù)的實(shí)踐與創(chuàng)新,幫助學(xué)弟學(xué)妹們加深對(duì)人工智能行業(yè)的了解,并解答了關(guān)于AI技術(shù)發(fā)展的專業(yè)問題。在線收聽的浙大師生們頻頻向這位新晉“技術(shù)流主播”雙擊點(diǎn)贊,不少參與者在收聽分享后,紛紛表示不過癮,希望師姐“加更”。
近十年,人工智能逐漸走入人們的視野,成為大熱風(fēng)口,但在此之前,吳甜就已經(jīng)專注于人工智能領(lǐng)域多年,且見證了NLP等基礎(chǔ)技術(shù)的快速發(fā)展。此次,吳甜從百度AI技術(shù)展開,詳細(xì)介紹了百度大腦的技術(shù)布局,從領(lǐng)先性及易用便捷角度介紹了作為重要開發(fā)工具的深度學(xué)習(xí)平臺(tái)飛槳,以及語義理解技術(shù)解決方案文心ERNIE和智能對(duì)話定制與服務(wù)平臺(tái) UNIT,并圍繞新冠疫情帶來百度AI在戰(zhàn)疫方面的突出表現(xiàn)。在分享最后,吳甜也針對(duì)聽課群體的特點(diǎn),描繪了深度學(xué)習(xí)開發(fā)者的學(xué)習(xí)地圖,介紹了AI Studio學(xué)習(xí)實(shí)踐社區(qū)、各類AI大賽、億元算力支持、AI人才認(rèn)證、就業(yè)、PPDE計(jì)劃等百度在AI人才培養(yǎng)方面的諸多舉措,希望幫助更多學(xué)弟學(xué)妹通過飛槳的社區(qū)和平臺(tái)能夠與更多的開發(fā)者交流,收獲成長。
百度天然具有AI基因,百度大腦是百度AI技術(shù)多年積累和業(yè)務(wù)實(shí)踐的集大成者。吳甜介紹,百度大腦由基礎(chǔ)層、感知層、認(rèn)知層和平臺(tái)層以及AI安全組成。基礎(chǔ)層為大數(shù)據(jù)、算法以及算力的支撐;感知層包括語音、視覺以及AR、VR等能力;認(rèn)知層主要包括自然語言處理和知識(shí)圖譜;平臺(tái)層包括飛槳、百度大腦開放平臺(tái)等,助力AI應(yīng)用創(chuàng)新;此外還有AI安全技術(shù)進(jìn)行保駕護(hù)航。
語音技術(shù)作為重要的基礎(chǔ)技術(shù),一直保持高速發(fā)展,吳甜用視頻案例為大家展示了語音技術(shù)的發(fā)展水平。基于百度自主研發(fā)的SMLTA 流式多級(jí)截?cái)嘧⒁饬δP停?a href="http://www.xsypw.cn/tags/語音識(shí)別/" target="_blank">語音識(shí)別準(zhǔn)確度大幅提升。2019年百度輸入法發(fā)布會(huì)上,一段中英混雜的“職場(chǎng)rap”被百度輸入法準(zhǔn)確識(shí)別,語音識(shí)別已達(dá)到中英文自由切換均可高質(zhì)量識(shí)別的水平。在一段“調(diào)戲”小度音箱的視頻中,打開小度的極客模式,不僅不需重復(fù)“小度小度”喚醒詞,小度還可以準(zhǔn)確區(qū)分對(duì)話與需求,而這正是全雙工免喚醒能力的體現(xiàn),在此能力下,人機(jī)交互越來越順暢。吳甜還為大家播放了多種不同風(fēng)格的音頻,而這些可以媲美人聲的音頻都是由AI語音合成,并通過風(fēng)格和音色遷移技術(shù)實(shí)現(xiàn)的。
小浦、移娃等數(shù)字人小姐姐的出現(xiàn),收獲了現(xiàn)場(chǎng)一大波點(diǎn)贊。在談到虛擬形象合成技術(shù)時(shí),吳甜播放了一段數(shù)字人合集視頻,來自百度智能云與浦發(fā)的小浦、中國移動(dòng)的移娃、澎湃的小菲等虛擬數(shù)字人都源于相同的虛擬形象合成技術(shù),但形象風(fēng)格各不相同,在百度技術(shù)的支持下虛擬數(shù)字人“女團(tuán)”也將走入更多行業(yè)。
除了類比人的感知能力的語音視覺技術(shù),還有類比人認(rèn)知能力的語言與知識(shí)技術(shù)。
吳甜詳解了基于知識(shí)圖譜的視頻理解,在感知技術(shù)提取特征的基礎(chǔ)上,融合了知識(shí)推理和計(jì)算,對(duì)整個(gè)視頻的內(nèi)容有更深度的理解。此外,語言和知識(shí)技術(shù)在醫(yī)療行業(yè)的應(yīng)用,也可以在輔助診療、合理用藥、病歷質(zhì)控等場(chǎng)景起到切實(shí)的幫助作用。百度研發(fā)的ERNIE全面刷新了NLP多項(xiàng)任務(wù)的效果,機(jī)器同傳方面,百度先后提出了一系列新模型,在語音容錯(cuò)、平衡質(zhì)量與時(shí)延、語篇翻譯連貫性和端到端同傳模型等方面取得突破,并研發(fā)了高質(zhì)量、低時(shí)延的機(jī)器同傳系統(tǒng)。在疫情特殊時(shí)期,支持了多場(chǎng)遠(yuǎn)程會(huì)議直播的同聲傳譯。
“深度學(xué)習(xí)框架在技術(shù)棧當(dāng)中的位置類似于操作系統(tǒng)的位置。因?yàn)樗蛳潞?a href="http://www.xsypw.cn/v/tag/137/" target="_blank">芯片、指令集的設(shè)計(jì)相關(guān),向上和大量的應(yīng)用場(chǎng)景是非常相關(guān)的。”在介紹了各種技術(shù)成果后,吳甜帶領(lǐng)大家將目光轉(zhuǎn)向AI開發(fā)平臺(tái)及工具層面。百度的深度學(xué)習(xí)平臺(tái)飛槳是國內(nèi)首個(gè)開源開放、技術(shù)領(lǐng)先、功能完備的產(chǎn)業(yè)級(jí)深度學(xué)習(xí)平臺(tái),包含核心框架、基礎(chǔ)模型庫、端到端開發(fā)套件以及工具組件,具有開發(fā)便捷的深度學(xué)習(xí)框架、超大規(guī)模深度學(xué)習(xí)模型訓(xùn)練技術(shù)、多端多平臺(tái)部署的高性能推理引擎以及產(chǎn)業(yè)級(jí)開源模型庫,四大技術(shù)優(yōu)勢(shì)。近期,飛槳還針對(duì)旺盛的產(chǎn)業(yè)需求推出了企業(yè)版,包含零門檻AI開發(fā)平臺(tái)EasyDL,以及面向大企業(yè)的全功能AI開發(fā)平臺(tái)BML。
此外,吳甜還著重提到了飛槳的預(yù)訓(xùn)練+遷移技術(shù)。她介紹,飛槳提供了許多基于百度大數(shù)據(jù)所訓(xùn)練出來的預(yù)訓(xùn)練模型,這些網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜的大模型與特定場(chǎng)景中的小數(shù)據(jù)量進(jìn)行遷移學(xué)習(xí)之后,可以形成非常出色的場(chǎng)景模型。比如,口罩人臉檢測(cè)模型正是基于ICCV19 Wider Challenge人臉檢測(cè)競(jìng)賽冠軍底座模型,加上真實(shí)口罩?jǐn)?shù)據(jù)微調(diào)實(shí)現(xiàn)的。在垃圾分類場(chǎng)景中,飛槳也起到了提高效率、準(zhǔn)確率的作用。據(jù)吳甜介紹,采用飛槳的目標(biāo)檢測(cè)和圖像分割模型,可以實(shí)現(xiàn)塑料瓶的細(xì)分以及塑料瓶中心點(diǎn)的檢測(cè),使垃圾分揀更準(zhǔn)確高效,同時(shí)通過Paddle Lite,可以高效部署集成到垃圾分揀的產(chǎn)線上。在武漢的一家垃圾分揀廠,采用了這樣一套技術(shù)解決方案后,分選效率從93%左右提升到了97%以上,替代了4-6個(gè)操作工人的人力成本。
NLP的研發(fā)范式也已進(jìn)入以預(yù)訓(xùn)練+微調(diào)的全新時(shí)代,依托于ERNIE的技術(shù)突破,百度推出了語義理解技術(shù)解決方案,旨在讓企業(yè)簡(jiǎn)單、高效靈活地定制開發(fā)最領(lǐng)先的NLP模型。目前,文心通過飛槳企業(yè)版EasyDL、BML為企業(yè)提供平臺(tái)化服務(wù)。以百度Feed流應(yīng)用為例,文心ERNIE技術(shù)解決方案,使得視頻推薦的相關(guān)性提升了8%,更好地滿足了用戶需求。
吳甜還介紹了可以幫助使用者快速構(gòu)建專屬對(duì)話產(chǎn)品的對(duì)話平臺(tái)百度UNIT。她從任務(wù)式對(duì)話和問答對(duì)話等方面深入淺出地展示了UNIT在定制對(duì)話過程中起到的作用。針對(duì)不同的對(duì)話需求,UNIT均提供了相應(yīng)的技術(shù)與功能支持。同時(shí),在對(duì)長對(duì)話的理解處理,與語音技術(shù)的融合方面,UNIT也做了很多工作。以智能客服為例,UNIT不僅能聽懂用戶的訴求,還能基于與用戶的對(duì)話分析發(fā)掘用戶深度的訴求。
在疫情期間,百度與合作伙伴,生產(chǎn)了一系列的AI抗疫產(chǎn)品,比如社區(qū)疫情防控系統(tǒng)、疫情問答機(jī)器人、地鐵口罩檢測(cè)等等,快速實(shí)現(xiàn)了應(yīng)用落地,為疫情防控提供了及時(shí)有力的幫助,用科技創(chuàng)造了價(jià)值。
同時(shí),百度一直致力于打造AI學(xué)習(xí)社區(qū)。比如AI Studio為廣大開發(fā)者的學(xué)習(xí)與實(shí)訓(xùn),提供了超過45萬個(gè)精選項(xiàng)目,億元免費(fèi)算力;算法賽、創(chuàng)意賽、產(chǎn)業(yè)賽三大類型賽事全年無休,以賽促學(xué),近一年累計(jì)舉辦50多場(chǎng),這些對(duì)于學(xué)生群體進(jìn)行開發(fā)帶來便捷。
分享最后,浙大學(xué)子踴躍提問,吳甜一一解惑,分享了關(guān)于醫(yī)療AI、通用型NLP、強(qiáng)化學(xué)習(xí)等方向的見解。吳甜認(rèn)為,AI需要跟行業(yè)自身的問題結(jié)合進(jìn)去,通過飛槳等平臺(tái)、工具與行業(yè)場(chǎng)景相結(jié)合,在應(yīng)用中不斷迭代。關(guān)于人工智能的邊界問題,吳甜表示“人工智能技術(shù)與應(yīng)用越來越廣泛結(jié)合,在能夠定義問題的場(chǎng)景中發(fā)揮出了其價(jià)值,但有如通用對(duì)話系統(tǒng)是通向通用人工智能的重要技術(shù)突破,這個(gè)突破還未真正到來”。
-
百度
+關(guān)注
關(guān)注
9文章
2271瀏覽量
90477 -
人工智能
+關(guān)注
關(guān)注
1792文章
47387瀏覽量
238901 -
ai技術(shù)
+關(guān)注
關(guān)注
1文章
1280瀏覽量
24348
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論