剛剛結束的百度大腦語音能力引擎論壇,向外界披露了這樣一個數字:百度大腦的語音能力引擎日均調用量已經超過100億次。
對照國內8.54億的網民規模,平均每個人要和百度大腦的語音能力引擎每天接觸12次,場景涉及輸入法的語音輸入、智能音箱的語音對話、百度地圖的語音導航、與各種機器人的有趣互動……無論是覆蓋范圍還是使用頻次,早已超過99%的互聯網服務。
可能在不少人的印象里,人工智能還是遙不可及的新事物,百度大腦用數據告訴了我們這樣一個事實:人工智能并不遙遠,甚至已經是生活中不可或缺的一部分。
01 日均調用100億次的背后
如果僅僅盯著數字來看,100億不可謂不龐大,也奠定了百度大腦語音應用規模第一的成績。但比數字本身更有價值的是,百度大腦如何做到語音能力引擎日均調用量超過100億次的規模,以及100億次的語音到底“喚醒”了什么?
第一個問題的答案是開放。截止到目前,百度大腦已經開放了云、端、芯的全棧全場景語音開放能力,廣泛應用于文娛、金融、政務等多個行業和場景,開發者們只需要一個簡單的調用,即可為產品接入百度大腦的智能語音能力。
而從百度大腦語音能力引擎論壇傳遞的消息來看,百度大腦的語音引擎全新發布和升級了14大產品內容,包括基于百度鴻鵠語音芯片的4款硬件模組、開發板,針對智能家居、智能車載、智能IoT設備等端到端的軟硬一體遠場語音交互場景解決方案,語音自訓練平臺、呼叫中心語音解決方案的升級,以及6個在線語音合成精品音庫和5個離線語音合成精品音的發布。
簡單來說,百度大腦已經為語音能力引擎打造了一條應用落地的生態鏈,而且生態鏈所覆蓋的場景和能力還在不斷拓展。
至于第二個問題的答案,不妨先來看三個具體的應用案例。
創維AIoT研究院產品經理李凱在演講中談及創維和百度大腦的合作,在百度鴻鵠語音芯片等軟硬件的賦能下,創維為產品增加了語音交互能力,涉及2500萬臺的電視裝機量,用戶只需要一個語音指令就能找到自己喜歡的電視節目,讓電視的交互從遙控器直接進化到智能語音時代。
北京子杰寶貝科技有限公司將百度大腦的語音能力引擎帶到了醫療領域,之前60%的醫護人員每天要花費45分鐘到90分鐘的時間填寫表單數據。依靠百度大腦的語音識別、自然語言處理等技術,醫護人員如今用語音就能完成表單的錄入。
善行智能在百度大腦的智能語音技術、智能OCR識別、智能物體識別等技術的加持下,打造了可以智能識別障礙物、物品、錢幣等物體,并通過語音播報給用戶的小Q智能導盲眼鏡,幫助盲人群體獨立的認知世界。
誠然,“100億次日均調用量”的背后是人工智能落地應用的生態圈,為合作伙伴帶來了轉型的契機,為醫護人員解決了工作的痛點,也讓盲人群體感受到了AI的溫暖。而這些僅僅是百度大腦技術賦能的冰山一角。
02 AI賽道中的“學霸”人設
除了智能語音的落地應用,百度大腦還在不斷推動語音技術的發展,比如百度語音首席架構師賈磊提出的基于復數CNN網絡的語音增強和語音識別一體化端到端建模技術,相較于傳統基于數字信號處理的麥克陣列算法,新技術的錯誤率降低了30%以上,并且已經被集成到最新發布的百度鴻鵠芯片中。
身為人工智能賽道里的“學霸”,百度大腦并非是擅長語音技術的偏科生,而是一個典型的“別人家的孩子”。
在烏鎮智庫出品的《全球人工智能發展報告》中,專門羅列了中國AI專利ToP 10的企業,百度以935件的專利數量,毋庸置疑的成了榜單上的頭名選手,并與騰訊、阿里等同一陣營的玩家們拉開了較大的差距。
在國際權威研究機構Forrester發布的計算機視覺公有云報告中,在百度大腦的AI視覺技術加持下,百度智能云處于中國市場“領導者”領域最上方 ,在數據、解決方案、應用場景、管理能力等多維度領先于阿里云、騰訊云等廠商。另一份《IDC MarketScape:2019中國AI云服務市場廠商評估》中,憑借在能力和市場兩個維度的優異表現,百度智能云同樣位居領導者象限最上方。
在4月初結束的ICME人臉106關鍵點檢測比賽中,百度大腦力壓阿里、華為、美團、中科大等選手拿到冠軍;6月份的CVPR 2019上,百度大腦又在視頻理解與分析、目標檢測、圖像超分辨、智能城市車輛識別、人臉&人體檢測等領域斬獲了10項冠軍;11月份的ICCV 2019上,百度大腦視覺團隊以mAP值57.13%的成績奪得人臉檢測的冠軍,超過第二名0.47%……
如果從時間上看,2016年百度大腦對外開放至今不過三年時間,縱然離不開百度長期的技術積累,這么短時間里的全面開花無疑佐證了百度大腦的“學霸”人設。這樣的成長速度與百度的技術基因、工程師文化等不無關系,或許還有另外一重原因。
2017年的時候,就有人將中美在人工智能賽道中的角色比作星球大戰里的Luke和Darth Vader,甚至為雙方進行了“戰力”對比:美國AI公司的數量比中國高出1.82倍,流向美國的資金份額比中國高1.54倍,美國的AI人才庫亦是中國的2.01倍……美國在人工智能領域的強力基礎,有賴于Google、亞馬遜、IBM、微軟等先行者,中國人工智能的擔子自然就落到了BAT身上。
某種程度上說,“學霸”百度大腦還肩負著抹平中美AI力量鴻溝的義務,而從一系列國際賽事上的表現、國際權威機構的認證來看,百度大腦也是中國AI領域當之無愧的頭雁,構建起AI的全棧技術布局,平等的賦能每一位開發者,將是百度大腦現在和未來身體力行的使命所在。
03 百度大腦在持續刷新
百度首席技術官王海峰在百度大腦語音能力引擎論壇講到進化和賦能:“AI技術的進化和產業賦能正向循環,相互促進,AI在應用場景中不斷進化。”可以理解為這就是百度大腦對自身的使命,也促使百度大腦在持續“刷新”。
猶記得2016年的百度世界大會上,李彥宏用了相當長的篇幅來講述這個“新概念”,彼時還只是記住了“百度大腦”這個名字,至于會產生什么樣的影響,恐怕很多人并沒有答案。然而短短三年的時間里,百度大腦早已成了生活中的一部分,百度輸入法的語音輸入,入住酒店時的刷臉認證,農田里的遙感無人機,工廠里的智能零件分揀……在那些看得到和看不見的生產生活場景中,都有著百度大腦的身影。
截止到目前,百度大腦已經開放了228項AI能力,擁有超過150萬的開發者用戶,當年李彥宏對百度大腦的寄托已經逐步實現。但百度大腦并沒有止步于此,在完成AI能力與應用場景融合創新的第一步后,百度大腦在5.0升級時被定義為“軟硬一體的AI大生產平臺”,讓AI邁入產業世界與工業大生產進行融合。
與之對應的是,語音技術推出了風格遷移的語音合成技術,僅需20句話就可以制作一個人的專屬聲音;視覺方面形成了適用于不同應用場景的技術矩陣,諸如車輛識別、物體識別、風格轉化、人流量統計等等;語言與知識方面,構建了世界上最大的多元異構知識圖譜……除了技術能力的刷新,百度還將算力、算法和數據打通,以百度智能云為依托,以百度大腦為核心,以飛槳為基礎底座,為各行各業的智能化轉型升級提供強有力的支撐。
市場的反映也印證了百度的正確性,僅以百度大腦人臉公有云服務為例,公有云日均調用量超過1億,開發者超過13萬,用戶使用規模穩居業界第一。并且百度大腦在人臉識別領域積累了1000多家合作伙伴,落地了超過10萬個項目,形成了豐富、完整的人臉產品矩陣。
同樣“刷新”的還有百度大腦的人才體系。就在不久前,著名的計算機和大數據理論領域專家Jeffrey Vitter加入到百度研究院顧問委員會,美國俄勒岡大學教授竇德景也加盟百度研究院擔任大數據實驗室主任。從世界級科學家組成的頂級智囊,到百度龐大的一線工程師,百度大腦在為行業賦能,驅動AI走進工業大生產時代的同時,也在不斷將AI技術做透、做精、做深。
“刷新”是百度大腦的底色,也是持續修煉內功讓AI走進真實世界的態度。
04 寫在最后
從2016到2019,人們對AI的理解已經不再局限于圍棋大戰,可在談論AI的時候,核心算法上的瓶頸仍然是不少開發者的錐心之痛。百度大腦就像一個扛著挑戰一路向前的勇士,在每一個關鍵節點上為業界開辟出一條條新路。
讀懂了這一點,語音能力引擎的100億次日均調用,注定只是百度大腦的一個小目標,因為“讓開發者平等地獲取AI能力”這條路本就沒有終點。
-
AI
+關注
關注
87文章
31028瀏覽量
269381 -
百度
+關注
關注
9文章
2270瀏覽量
90472
發布評論請先 登錄
相關推薦
評論