伴隨著物聯(lián)網(wǎng)時代的到來,語音交互已然成為人與機(jī)器“交流”的重要環(huán)節(jié)。以語音為切入口的布局端成為了許多科技公司的必爭之地。
但語音賽道也有其鮮明的行業(yè)特征:首先,語音的交互流程、交互邏輯較之于圖像更為復(fù)雜,決定了其產(chǎn)品應(yīng)用商業(yè)落地的復(fù)雜性與難度更高,用戶對于產(chǎn)品性能期待值更高;其次,從國內(nèi)市場看,圖像相對于語音賽道而言,擁有更為確定性的場景應(yīng)用,作為語音公司而言,要生存,也意味著更加考驗(yàn)團(tuán)隊(duì)的“市場刨食”能力。
與此同時,由于語音場景碎片化現(xiàn)狀,對于行業(yè)玩家,不僅需要在技術(shù)方面提前布局,反復(fù)打磨,更需具備靈敏的商業(yè)嗅覺,提前發(fā)現(xiàn)并布局市場機(jī)遇。
一個行業(yè)越是“紛繁復(fù)雜”,越能考驗(yàn)身處行業(yè)中企業(yè)的定力和底氣。在語音賽道中,有這樣一家專注語音AI技術(shù)的公司——云知聲,其歷經(jīng)8年的打磨,在語音賽道上探索出自己的生存法則和市場嗅覺。
8年的時間,云知聲也從曾經(jīng)的默默無聞,逐漸成長為行業(yè)領(lǐng)軍企業(yè),不僅在技術(shù)且在商業(yè)化道路方面,也呈領(lǐng)跑趨勢。而在近期,云知聲正式向上交所提交IPO招股書材料,公司正向“科創(chuàng)板AI語音第一股”發(fā)起沖擊。
敢為人先
如何判斷一家AI公司的路走的正確與否呢?云知聲提供了一個很好的研究范本——看一家企業(yè)的路對不對,主要是看其在關(guān)鍵時刻的那幾步走的對不對,而不是看其大多數(shù)時間和其他人做了多少相同的事。
“算力、算法、數(shù)據(jù)”是構(gòu)建人工智能核心技術(shù)的基礎(chǔ)要素,其中帶領(lǐng)AI產(chǎn)業(yè)駛離深水區(qū),實(shí)現(xiàn)真正產(chǎn)業(yè)落地的關(guān)鍵之一就在于算法側(cè)供給提升。在這一方向上,云知聲于2012年率先將深度神經(jīng)網(wǎng)絡(luò)(DNN)應(yīng)用于商業(yè)語音識別系統(tǒng),并在后續(xù)的人工智能浪潮中持續(xù)進(jìn)行前沿算法的商業(yè)實(shí)踐。
基于公司先人一步將DNN引入語音領(lǐng)域,在后續(xù)的人工智能浪潮中持續(xù)進(jìn)行前沿算法的商業(yè)實(shí)踐,例如,后來涌現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)、回歸神經(jīng)網(wǎng)絡(luò)(RNN)、端到端序列建模、生成對抗網(wǎng)絡(luò)(GAN)、注意力轉(zhuǎn)換模型(Transformer)、雙向編碼表征轉(zhuǎn)換模型(BERT)、知識蒸餾(KD)、自監(jiān)督學(xué)習(xí)(SSL)等主流技術(shù)方法,云知聲都是業(yè)界最早的產(chǎn)業(yè)實(shí)踐者之一。
而從現(xiàn)在絕大多數(shù)企業(yè)的選擇來看,DNN已經(jīng)成為了主流選擇。也就是說,云知聲當(dāng)時超前的技術(shù)預(yù)判后來被證實(shí)是正確的。
除了率先擁抱DNN外,云知聲的另一個關(guān)鍵一步就是2015年啟動自主造芯。
據(jù)了解,為了進(jìn)一步降低智能語音交互方案的功耗、提升其喚醒的靈敏性,進(jìn)而滿足更多物聯(lián)網(wǎng)設(shè)備加載語音交互功能的需求,云知聲自2015年起,前瞻性布局人工智能語音芯片,著手開發(fā)uDSP處理器和DeepNet IP技術(shù)。
在此基礎(chǔ)上,云知聲于2018年率先交付人工智能語音芯片——“雨燕”,后于2019年陸續(xù)推出車規(guī)級芯片“雪豹”和面向家居領(lǐng)域的第二款升級版芯片“蜂鳥”系列,并啟動具備“圖像+語音”多模態(tài)交互功能的芯片“海豚”的研發(fā),持續(xù)領(lǐng)跑同業(yè)。
需要注意的是,當(dāng)前越來越多的AI語音公司不約而同地闖入造芯新賽道,從算法出發(fā)“軟硬兼施”已然成為一條必走之途,但也顯得語音AI市場變得異常競爭激烈。與之相比,云知聲所推出的芯片又是否具備在這場競爭中“脫穎而出”的品質(zhì)?
芯片性能優(yōu)越
以云知聲當(dāng)前的主力芯片產(chǎn)品之一“蜂鳥”為例,根據(jù)灼識咨詢研究結(jié)果,其與同期其他市場參與者主力產(chǎn)品相比,“蜂鳥”在語音處理效率和商用成本方面均具有明顯優(yōu)勢。
具體而言,“蜂鳥”芯片采用先進(jìn)的DSP+神經(jīng)網(wǎng)絡(luò)+MCU的異構(gòu)設(shè)計(jì),異構(gòu)設(shè)計(jì)相較傳統(tǒng)的通用CPU架構(gòu),一方面可以大幅度提高芯片的運(yùn)行效率,另一方面可以減少芯片面積以及功耗。其浮點(diǎn)運(yùn)算能力和定點(diǎn)運(yùn)算能力可分別達(dá)到16MAC/時鐘周期、32MAC/時鐘周期,均領(lǐng)先于相同面積下同類芯片的性能。
此外,“蜂鳥”芯片內(nèi)部集成1.5MBSRAM,搭載云知聲自有語音識別算法,可實(shí)現(xiàn)遠(yuǎn)場5m距離,準(zhǔn)確率>98%的遠(yuǎn)場語音識別,相比相同競爭對手所需RAW容量減少近一半,這在對成本敏感競爭激烈的語音芯片市場是至關(guān)重要的。
同時為了最大限度提高芯片的集成度,“蜂鳥”芯片在芯片內(nèi)部集成了FLASH,實(shí)現(xiàn)了真正意義上的單芯片語音解決方案。
今年上半年,得益于規(guī)模化推廣“蜂鳥”,并放棄毛利率較低的產(chǎn)品,云知聲智能語音交互產(chǎn)品直接硬件采購成本占比降至26.17%,毛利率顯著回升。
另外,云知聲還結(jié)合自主產(chǎn)權(quán)的人工智能加速器IP,設(shè)計(jì)并開發(fā)出了車規(guī)級語音AI芯片——“雪豹”,該款芯片與云知聲的人工智能軟件引擎和車聯(lián)網(wǎng)人工智能解決方案進(jìn)行垂直整合,形成完整的云端芯一體解決方案。
目前,車規(guī)級芯片“雪豹”已進(jìn)入吉利汽車的產(chǎn)品穩(wěn)定性測試以及車規(guī)級測試階段,通過后即可在吉利汽車的主流平臺上線。
通過“唯快不破”的造芯發(fā)展思路,云知聲很快在語音識別風(fēng)口中比肩行業(yè)頭部公司。
此次科創(chuàng)板IPO中,云知聲擬投入3.17億元用于“面向物聯(lián)網(wǎng)邊緣計(jì)算的人工智能芯片研發(fā)平臺建設(shè)”項(xiàng)目。該項(xiàng)目旨在通過人工智能芯片研發(fā),提升物聯(lián)網(wǎng)終端的邊緣計(jì)算能力,提高應(yīng)用領(lǐng)域內(nèi)的芯片設(shè)計(jì)水平。
獨(dú)特的云端芯一體化
云知聲董事長/CTO梁家恩博士曾指出,云知聲很早就搭建了被譽(yù)為云知聲版“TensorFlow GKE (Google Kubernetes Engine) ”的 Atlas 機(jī)器學(xué)習(xí)計(jì)算平臺。基于該平臺,向上支撐起信號(AEC/SSP/ISP)、語音(ASR/TTS/VPR/CALL)、語言與認(rèn)知(NLU/NMT/SDS/ICI)、圖像(FID/OD/OCR)等多技術(shù)領(lǐng)域的橫向擴(kuò)展和縱向迭代。
通過將能力封裝在自研 AI 芯片之上,云知聲率先打磨出了獨(dú)特的“云端芯”產(chǎn)品中臺,對核心技術(shù)進(jìn)行了模塊化梳理和整合,從而具備面向市場需求的快速產(chǎn)品化能力,支撐公司以豐富的產(chǎn)品組合為眾多知名企業(yè)提供服務(wù)。
據(jù)了解,云知聲的“云-端-芯”產(chǎn)品中臺落地“AI 生活(家居、車載、機(jī)器人等)”與“AI 服務(wù)(醫(yī)療、教育、政務(wù)、酒店等)”兩大核心場景,繼而貫通云知聲從 AI 技術(shù)到產(chǎn)業(yè)應(yīng)用的生態(tài)閉環(huán)。
在家電領(lǐng)域,公司智能語音交互方案已被格力等家電龍頭采用;在酒店、商業(yè)地產(chǎn)和住宅領(lǐng)域,云知聲與世茂集團(tuán)達(dá)成戰(zhàn)略合作,成立合資公司,面向世茂集團(tuán)下屬的眾多酒店批量交付智慧物聯(lián)解決方案,帶來銷售收入的快速增長。
在醫(yī)療領(lǐng)域,云知聲通過與北京協(xié)和醫(yī)院合作,率先在國內(nèi)落地醫(yī)療病歷轉(zhuǎn)寫解決方案,并在行業(yè)內(nèi)被快速推廣,目前已在100多家醫(yī)院上線使用,超過500多家醫(yī)院在測試使用。此外,公司與平安好醫(yī)生成立合資公司,試水醫(yī)療領(lǐng)域智能硬件產(chǎn)品的開發(fā)。
在汽車領(lǐng)域,云知聲還與億咖通成立合資公司,為戴姆勒奔馳等整車廠提供車載語音解決方案,并攜手探索基于自研車規(guī)級人工智能語音芯片“雪豹”的車載語音解決方案的應(yīng)用。
依托“云-端-芯”產(chǎn)品中臺,云知聲已形成了三大系列、數(shù)十個產(chǎn)品相輔相成、高度融合的產(chǎn)品矩陣。此外,受益于獨(dú)特的產(chǎn)品中臺體系,云知聲的技術(shù)能力到產(chǎn)品落地周期被顯著縮短,驗(yàn)證有效的前沿算法通常可在3-6個月時間內(nèi)應(yīng)用于終端產(chǎn)品,確保了公司產(chǎn)品的開發(fā)效率和競爭力,增強(qiáng)了云知聲的市場競爭力。
結(jié)語
當(dāng)前,人工智能公司們正迎來企業(yè)發(fā)展的黃金時代,一方面,自2015年以來,人工智能就成為了市場熱點(diǎn),相關(guān)產(chǎn)業(yè)正式被提上國家層面戰(zhàn)略,比如十四五規(guī)劃建議稿指出,“要瞄準(zhǔn)人工智能、量子信息、集成電路、生命健康、腦科學(xué)等前沿領(lǐng)域,實(shí)施一批具有前瞻性、戰(zhàn)略性的國家重大科技項(xiàng)目。
按照中央規(guī)劃,未來人工智能核心產(chǎn)業(yè)、人工智能與傳統(tǒng)產(chǎn)業(yè)融合均是戰(zhàn)略發(fā)展重點(diǎn)。平安證券預(yù)計(jì),到2020年我國人工智能核心產(chǎn)業(yè)市場規(guī)模將超過1600億元,帶動相關(guān)產(chǎn)業(yè)市場規(guī)模將超過萬億元。
另一方面,科創(chuàng)板采取更靈活的上市機(jī)制,有利于一批AI企業(yè)加速登陸資本市場。目前云知聲的科創(chuàng)板審核狀態(tài)變更為“已問詢”,IPO進(jìn)程正在穩(wěn)步推進(jìn)中,公司有望成為科創(chuàng)板AI語音第一股。
責(zé)任編輯:tzh
-
芯片
+關(guān)注
關(guān)注
456文章
51090瀏覽量
425966 -
AI
+關(guān)注
關(guān)注
87文章
31399瀏覽量
269805 -
人工智能
+關(guān)注
關(guān)注
1793文章
47590瀏覽量
239486
發(fā)布評論請先 登錄
相關(guān)推薦
評論