作者:Sleibso,編譯:蒙面俠客
高性能的語音控制系統在智能家具和機器人的發展過程中顯得越來越重要。語音控制系統的信號采集端使用麥克風陣列會得到更豐富的聲音信號,為聲音定位提供了可能,處理語音的硬件的性能和相應的軟件算法直接決定了語音控制系統的處理效率和精確度。亞馬遜和谷歌等大型互聯網公司都在努力的研究高性能的語音控制系統,作為極客的你是不是也想入手一個硬件平臺,開始自己的智能硬件的開發之旅呢?好的平臺是成功的一半!
亞馬遜的Alexa和Google Home的出現助推了語音控制系統的發展。今天小編帶領各位領略一個適合自己DIY的語音控制系統開發平臺。圖.1為Aaware的價值199美元的遠場開發平臺,它是一款基于云的語音控制系統。遠場語音識別受限于背景噪聲、其他人聲的干擾、回聲、混響等多重復雜的因素,會導致其識別率的降低,而Aaware平臺能夠實現遠場聲音在有噪聲的情況下的高精度的語音識別。小編曾經也做過一些其他的語音控制系統,但是效果都不是特別的理想。看了Aaware的演示視頻之后,發現這款平臺在預處理聲音,消除噪聲,遠場的聲音的捕捉方面有著超強的能力。在驚嘆之余,我們一起來探索一下Aaware遠場開發平臺背后所隱藏的技術秘密。這種遠程遠場聲音捕獲技術展現出的能力如下:
-
無需參考信號就可消除干擾噪聲。(解決方案專注于AEC聲學回聲消除);
-
支持不一致的1D和2D麥克風陣列間距,實現聲源判斷和定位;
-
更多的麥克風使其在嘈雜的環境中獲得更好的效果;
-
對聲音的捕獲,提供單芯片的解決方案,同時支持多詞喚醒以及用戶自定義應用;
圖.1 Aaware的遠場開發平臺
這么多的硬件優勢是基于Xilinx的Zynq SoC或Zynq UltraScale + MPSoC來實現。Aaware的CTO稱贊道,Zynq器件是強于一個嵌入式處理器10倍的性能的器件,這多虧了芯片里面的可編程邏輯,通過可編程邏輯門陣列分擔了片上ARM核心所需要處理的數據,通過圖.2得知,他們之間的數據是通過AMBA總線進行交互的。Aaware能夠根據用戶對性能的需求,將其算法放到單核心的Zynq Z-7007S SoC中或者升級算法到雙核心的Zynq SoC中,如果想要追求更好的性能可以使用Zynq UltraScale+MPSoC器件來搭建遠場語音控制系統。
圖.2 ZYNQ-7000S系列框圖
有了硬件平臺,我們需要進一步的了解一下相應的軟件開發工具鏈,Aaware的算法開發是基于一個特有的工具鏈:
有了工具鏈就可以使得Aware能夠將其想要的功能集成到最小的Zynq Z-7007S SoC中, 如果有更高性能的需求還可以將算法應用到最大的Zynq UltraScale + MPSoC平臺之上。
智能語音控制系統需要在硬件平臺和軟件算法兩方面共同入手。將Aaware 的基于Zynq的遠場聲音捕捉平臺作為一個特例,反應了當下語音控制系統的一種實現方法,硬件平臺使用Xilinx的可編程SOC是一個很好的選擇,因為它支持運行嵌入式實時操作系統的同時能夠快速的處理數據,有著很好的性能功耗比;至于軟件的開發,可謂是五花八門,結合當下自然語言處理和深度學習的快速發展,想必會有更好的算法能夠實現更快更精準的語音控制系統。
-
機器人
+關注
關注
211文章
28524瀏覽量
207561 -
智能家居
+關注
關注
1928文章
9581瀏覽量
185594 -
語言識別
+關注
關注
0文章
15瀏覽量
4838
原文標題:揭示 Aaware Zynq 加速的遠程聲音捕捉平臺背后的秘密
文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發圈】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論