—
近期,亞馬遜發(fā)布了幾款全新的Echo,新Echo可以更快地處理Alexa請求,同時(shí)還有一款配備了10.1英寸的顯示屏。 從當(dāng)下智能音箱上市的趨勢來看,消費(fèi)者對智能音箱“語音識別的響應(yīng)速度”、“強(qiáng)外噪、超大功率音樂播放環(huán)境下的喚醒率”,“隱私”,“語音、視覺識別、觸屏、SLAM多模態(tài)交互”的要求,都在日益提升。 未來,在智能語音處理器中,如何具備:實(shí)時(shí)的精準(zhǔn)語音識別、多模態(tài)交互、更出色的高級音效與差異化,是該領(lǐng)域的關(guān)鍵發(fā)展點(diǎn)。
1全志預(yù)研,與發(fā)展趨勢不謀而合兩年前,全志預(yù)判到了智能語音趨勢的發(fā)展,提前規(guī)劃了專為“語音識別深度學(xué)習(xí)算法”而打造的全新處理器 —— R329。R329提供了一種全新的語音識別硬件加速神經(jīng)網(wǎng)絡(luò),支持int8、int16混合精度流式處理,從而可以在更快地處理請求,語音識別體驗(yàn)更快,平均響應(yīng)時(shí)間從2秒左右減少到200毫秒以內(nèi),這是一個(gè)不容小覷的提升。R329同時(shí)具有同類優(yōu)秀的能源效率,能源消耗減少了25倍,語音處理速度提高了30倍。
核心客戶體驗(yàn)R329 得益于R329本地端側(cè)語音識別深度學(xué)習(xí)算力幾十倍級的提升,R329的核心品牌客戶正逐步建立起以語音識別為核心的安全系統(tǒng)解決方案。比如在智能家居場景,R329可以檢測各種聲音做出智能反應(yīng);比如聽到嬰兒的哭聲時(shí)智能開燈并提醒寶媽;比如主人設(shè)定外出期間在室內(nèi)檢測到開關(guān)門聲、腳步聲自動(dòng)發(fā)出報(bào)警聲和信息提醒等等。 2帶屏智能語音處理器R818與此同時(shí),全志也規(guī)劃了一顆可帶屏的智能語音處理器R818。
核心客戶體驗(yàn)R818 得益于R818本地端側(cè)深度學(xué)習(xí)算力,相較于CortexA35高達(dá)七成的提升的同時(shí),功耗、溫升還出現(xiàn)了明顯的降低。R818的核心品牌客戶可以獲得持續(xù)、穩(wěn)定的高算力輸出,從而逐步建立起更具人性化的語音識別、視覺識別、觸屏多模態(tài)的智能感知交互。比如在智能家居場景,R818可以在小神獸在線觀看超清動(dòng)畫片的同時(shí),通過人臉檢測自動(dòng)進(jìn)入兒童模式,過濾成人內(nèi)容,通過童聲語音,識別圖文并茂的回答寶寶們所提出的十萬個(gè)為什么,通過攝像頭深度學(xué)習(xí)的坐姿檢測培養(yǎng)小神獸良好的坐姿習(xí)慣等等。 3非云端,本地實(shí)現(xiàn)關(guān)于亞馬遜此顆新處理器其能源消耗大大減少、語音速度大幅提升,這些改進(jìn),都得益于處理本身是在設(shè)備上完成的,從而消除了將查詢發(fā)送到云的需求。
而目前智能語音識別趨勢來看,不上傳云端,本地實(shí)現(xiàn)語音識別是更有效的解決方案。R329/R818不僅也能大幅提升設(shè)備端的語音識別能力,同時(shí)還能實(shí)現(xiàn)本地的語音識別,不需要上傳云端、在本地即可實(shí)現(xiàn)各種方言命令的識別,響應(yīng)時(shí)間從2秒降低到200毫秒以內(nèi)。
同時(shí),R329/R818處理器還可實(shí)現(xiàn)離線IOT控制,比如控制空調(diào)、燈、掃地機(jī)、油煙機(jī)、加濕器、窗簾等,且同時(shí)支持多種方言的交互,講粵語的丈母娘和講四川話的老媽都可以自然語言交互。 目前,R329與R818都已成功導(dǎo)入到部分中國Top3的智能音箱客戶,未來,全志科技將在智能語音識別領(lǐng)域持續(xù)發(fā)力,為用戶帶來更高效率的高準(zhǔn)確率的語音識別體驗(yàn)。
集成雙路AUDIO DSP HIFI4,硬件支持32位浮點(diǎn)的高精度前端、后端數(shù)字信號處理算力;
集成AUDIO專用NPU,支持160 MACs,語音識別專用深度學(xué)習(xí)算力超過200GOPS;
集成雙核CortexA53 1.5GHZ,提供生態(tài)配套成熟、完善的用于系統(tǒng)、應(yīng)用和網(wǎng)絡(luò)連接開發(fā)的高效算力;
集成高達(dá)2MB的SRAM,搭配HIFI4實(shí)現(xiàn)50毫瓦雙麥遠(yuǎn)場格可喚醒的超低功耗;
集成高達(dá)256MB的DDR3,為LOCAL ASR、LOCAL NLP、LOCAL TTS等語音識別深度學(xué)習(xí)算法提供充裕的高容量、高帶寬的內(nèi)存支持。
R818芯片規(guī)格介紹
32位、64位浮點(diǎn)運(yùn)算單元相較于CortexA35提升一倍,傳統(tǒng)信號處理算力提升60%以上;
8位、16位定點(diǎn)、整數(shù)運(yùn)算單元相較于CortexA35提升一倍,深度學(xué)習(xí)算法算力提升70%以上;
HPC+制程工藝相較于同級別SOC的LP制程工藝CPU電壓下降20%,CPU峰值運(yùn)行功耗降低40%;
出眾的視頻編解碼能力 (4KP30 H.265Decoder,1080P60 H.264 Encoder) ,完美滿足客戶的視聽盛宴需求;
集成豐富外設(shè)計(jì)口(2路同步并發(fā)MIPI CSI、IR、EMAC、6路uART、LEDC、4路I2S/TDM等),完美匹配各類行業(yè)方案需求。
原文標(biāo)題:不僅可視,也讓語音識別更快更有效 —— 全志R系列智能語音專用處理器
文章出處:【微信公眾號:全志科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
責(zé)任編輯:haq
-
處理器
+關(guān)注
關(guān)注
68文章
19391瀏覽量
230615 -
語音識別
+關(guān)注
關(guān)注
38文章
1742瀏覽量
112781
原文標(biāo)題:不僅可視,也讓語音識別更快更有效 —— 全志R系列智能語音專用處理器
文章出處:【微信號:Allwinnertech,微信公眾號:全志科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論