本次云知聲開放日聚焦 AI 技術、應用和產業,云知聲董事長/CTO 梁家恩博士與多位云知聲技術專家向深圳的合作伙伴、行業人士全面的秀出了全棧 AI 硬核技術,并與騰訊杰出科學家/騰訊 AI Lab 副主任俞棟、攜住科技聯合創始人葉明、同行者科技聯合創始人葉維、金鷹卡通衛視產品總監戴文博、三諾聲智聯副總經理喬嶠等多位嘉賓,剖析了 AI 技術在酒店、車載、教育等領域的應用及落地。
全棧:技術能力全棧,產業服務全棧
梁家恩博士作為人工智能行業的資深從業者,在現場與我們復盤了發展歷程,他表示,在 AI 大潮退去之后,技術的產業化能力成為了決勝的關鍵。技術如果不能解決產業問題,那么技術將化為企業“炫技”的產物。基于此,梁家恩博士將云知聲的 AI 哲學概括為“全棧”和“硬核”。
“全棧”包含了全棧 AI 技術能力和全棧 AI 落地能力兩個維度。經過多年的發展,目前,云知聲的 AI 能力已經超了單一的語音技術,覆蓋了 Atlas 機器學習超算平臺,信號、語音、圖像、文本的感知和表達能力,知識、理解、分析、決策等認知技術,并朝著多模態人工智能系統方向發展。同時,云知聲通過將能力封裝在自研 AI 芯片之上,打磨了“云端芯”一體化產品體系,推動 AI 技術在家居、車載、兒童、教育、醫療、金融、零售等多個領域實現落地,實現了從 AI 技術到產業應用的生態閉環。
硬核:確實、有效地解決產業規模化痛點
“硬核”,指技術方案能夠確實、有效地解決產業規模化痛點,為終端用戶提供相對成熟的用戶體驗。
以當時最熱門的智能語音為例,經歷了兩年的市場教育,現如今,語音交互技術被廣泛應用到各大場景中,成為了 AI 技術落地最典型的應用案例。然而,在實際使用中,AI 需要面對的情況比實驗室中要復雜得多,一旦產品軟硬件的某一環處理不好,便容易出現“聽不到、聽不懂、答非所問”等問題。針對這類行業痛點,在本次云知聲開放日深圳站現場,云知聲的技術團隊從語音交互技術的拾音、識別和交互等維度,深度剖析了技術難點和解決方案。
在 AIoT 場景下,設備首先要解決的便是遠場拾音問題。云知聲 AI Labs 技術專家關海欣表示,解決遠程語音識別的關鍵在前端信號處理階段,解決回聲、混響和噪音 3 大核心問題,以確保設備可以準確識別到用戶指令。目前,云知聲在回聲消除、混響抑制、噪聲處理等方向均已有成熟的技術方案,相關技術指標均達行業一流水準。另外,未來遠程語音識別還將呈現 DSP+DL 結合、分布式拾音兩大趨勢,對此,云知聲也已經展開了相應的技術部署。
在語音識別階段,則需要在聲學和語言層面,賦予機器感知并語音指令的能力。云知聲 AI Labs 技術專家李軼杰表示,聲學方面,云知聲基于大數據、前沿聲學建模、自適應學習搭建了聲學模型;在語言層面,云知聲創建了一個數據規模大、融合能力強、靈活和個性化的語言模型,以上模型在還將基于超算平臺不斷優化迭代。此外,云知聲還將其語音識別能力延展到語音評測、聲紋識別、情緒識別等多個方向。
在對話階段,圍繞更加自然的人機交互,云知聲打造了流式交互、語用計算與知性會話 3 大硬核能力。云知聲 AI Labs 技術專家單波介紹到,流式交互最大的特點是在多輪對話免喚醒,大大的提升了人機對話過程中的流暢程度;語用計算則是將人機對話內容放置到對應的語境中,讓設備準確的理解人的意圖;最后,知性會話則是通過將知識圖譜應用到人機對話過程中,讓設備準確的響應用戶的問題。
基于上述技術,2013 年,云知聲面向合作伙伴開放對話技能開放平臺(語義云),幫助合作伙伴打造更加自然的人機交互體驗,同時在實踐中不斷提升語義解析能力。目前這一平臺已經支持 200 多個的對話內容,覆蓋通訊、休閑娛樂、醫療健康、交通出行、設備控制等多個場景,語義解析準確率高達 93%。
值得一提的是,語音感知與表達、語言與知識計算只是云知聲硬核 AI 技術的冰山一角,目前,云知聲硬核技術還包含了 AIoT 芯片、超算平臺與圖像、翻譯拓展等。
落地:覆蓋酒店、汽車、兒童、音箱等場景
在大數據、深度學習、超算平臺的加持下,人工智能底層技術將沖破閥值,帶來成熟的體驗,在技術和需求的雙重推動下,人工智能將邁入發展的黃金階段,并掀起新一輪的 AIoT 產業變革。在下午的「智能+」分論壇中,云知聲副總裁康恒、云知聲 AIOS 架構師郭洪光、與攜住科技、同行者科技、金鷹卡通、三諾聲智聯等多位合作伙伴,結合實際案例,深入探討了 AI 技術的在酒店、汽車、兒童和音箱等場景中的應用。
云知聲副總裁康恒表示,在整個產業鏈中,AI 技術是個“基礎設施”,且這一基礎設置不可能在不加以定制的情況下適用全部場景。AI 在落地過程中,需要充分考慮使用場景和落地行業。基于對場景和產業的深度思考,2014 年,云知聲便開始結合產業鏈,將云知聲的 AI 技術賦能到個行業中去。
面向行業,云知聲推出了一站式人工智能平臺 UniOS。云知聲 AIOS 架構師郭洪光表示,與同類產品相比,UniOS 具備開放、垂直兩大特性,其中,開放指的是云知聲面向行業和合作伙伴開放技能平臺和設備平臺,并在此基礎上兼容第三方 AIOS;垂直則代表 UniOS 會針對特定的行業需求輸出解決方案,以此來幫助產業轉型。
攜住科技聯合創始人葉明跟我們介紹了 AI 技術在酒店場景中的應用案例。葉明表示,針對酒店場景,攜住科技基于 AIoT 技術,通過多種設備聯動、場景定制,為酒店客戶帶來全新智能互聯的場景體驗;另一方面,通過信息整合和大數據分析,AI 還將提高酒店管理效率。
同行者科技聯合創始人葉維分享了 AI 語音技術如何助力汽車產業升級。葉維表示,在車載場景下,語音即為服務——語音是用戶與設備、與互聯網連接的主要手段,承載了車聯網資源整合與用戶觸達的功能。因此,車載場景下的 AI 必須聚合豐富的內容和服務,并根據場景進行智能匹配,打造千人千面的智能化體驗。
金鷹卡通衛視產品總監戴文博分享了金鷹卡通對兒童產品智能化的思考。戴文博指出,兒童和家長對智能產品的需求與普通場景十分不同,基于此,金鷹卡通圍繞兒童場景的特征,將 AI 技術與“麥咭”的形象做了深度整合,打造麥咭智能親子智能產品生態。
以帶屏音箱為例,屏幕為人機交互補充重要的視覺信息,更加接近用戶本能,“未來 5 年,單帶屏的智能音箱就會達到 3 億多臺,超過 PC 的規模。”
關于云知聲 Open Day
OpenDay 是云知聲一年一度的對外進行技術分享與交流的活動,是云知聲面向人工智能硬核科技,與合作伙伴、相關學術和產業研究機構等共話人工智能前沿技術與產業應用并探討合作的平臺。2019 首屆云知聲 OpenDay 設北京、深圳、上海、廈門四站。繼北京、深圳站之后,上海站活動將于5月上旬正式開啟。
關于云知聲
云知聲成立于 2012 年,是一家專注于物聯網人工智能,擁有自主知識產權的智能語音人工智能企業。是中國人工智能行業成長最快、商業化落地最好人工智能企業之一。云知聲業務主要覆蓋智慧生活和智慧服務兩大場景,在包括家居、車載、醫療、教育、政府、機器人等領域擁有廣泛布局。客戶涵蓋格力、美的、長虹、海爾、華帝、北京協和醫院、吉利、平安集團、京東、360等。
2018 年 5 月份,云知聲正式推出第一代 UniOne 物聯網 AI 芯片及其解決方案——雨燕(Swift)。該芯片由云知聲自主設計研發,采用云知聲自主 AI 指令集,性能較通用方案提升超過 50 倍。基于該芯片的標準化解決方案,可幫助傳統硬件產品在更短的時間周期內,以更少的成本快速實現 AI 化,實現人機交互智能。
-
AI
+關注
關注
87文章
30896瀏覽量
269108 -
語音識別
+關注
關注
38文章
1739瀏覽量
112661
原文標題:助力AI產業落地,云知聲展示全棧AI硬核技術
文章出處:【微信號:icsmart,微信公眾號:芯智訊】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論