在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音控制的算法和硬件功率上升

龍獻益 ? 來源:uwjfuwer ? 作者:uwjfuwer ? 2022-07-15 15:45 ? 次閱讀

語音控制和語音界面已經(jīng)開始無情地滲透到幾乎所有的消費邊緣設(shè)備類別。語音識別算法AI 加速器硬件的進步意味著該技術(shù)甚至可以用于智能家居設(shè)備(甚至是一些愚蠢的設(shè)備)等功率和成本受限的應用程序。

從用戶端來看,智能家居設(shè)備語音控制背后的驅(qū)動力是顯而易見的。

PicoVoice 首席執(zhí)行官 Alireza Kenarsari-Anhari 告訴 EE Times:“易用性和便利性是目前的主要驅(qū)動力。” 很容易想象當你想要一杯咖啡時,你可以從辦公桌上對著家庭辦公室的咖啡機大喊大叫,或者拿著一籃濕衣服向滾筒式烘干機口述訂單。

我們假設(shè)像這些非便攜式的智能設(shè)備可以永久訪問家庭的 WiFi 連接——那么為什么不在云中進行這種語音處理呢?

在這種情況下,邊緣人工智能的趨勢主要是由隱私驅(qū)動的,Kenarsari-Anhari 說這是消費者的擔憂,但對一些企業(yè)來說是必須的。可靠性是另一個驅(qū)動因素:“如果您的 WiFi 不工作,您的洗衣機停止工作是否有意義?” 他說。

在某些情況下,延遲也很重要;某些應用程序確實需要語音工作負載處理的實時保證,例如游戲。

成本是語音邊緣處理的另一個重要驅(qū)動因素,因為在云中處理這些語音數(shù)據(jù)需要花錢。每次使用云 API 時都付費的商業(yè)模式不適用于家電和消費電子等成本低且每天可能多次使用的用例。

PicoVoice 的 AI 語音到文本推理引擎被設(shè)計為在低于 1 美元的微控制器上獨立于云運行,旨在在原本不可行的應用程序中實現(xiàn)語音控制。這可能包括消費類可穿戴設(shè)備和可聽設(shè)備,它們正處于需要基于微控制器的語音解決方案可以實現(xiàn)的功率效率和成本效率的交叉點。Kenarsari-Anhari 說,功率和成本優(yōu)化的解決方案還可以釋放工業(yè)、安全和醫(yī)療應用的機會。

公司最近推出了 Shepherd,這是一個用于在微控制器上構(gòu)建語音應用程序的無代碼平臺,可與該公司的模型創(chuàng)建軟件 PicoVoice Console 配合使用。Shepherd 支持 ST 和 NXP 的流行 Arm Cortex-M 微控制器,并支持正在開發(fā)的其他設(shè)備。

“我認為語音是一個界面——如果你可以在不編碼的情況下構(gòu)建你的 GUI 或網(wǎng)站,也許使用 WordPress,以類似的方式構(gòu)建語音界面是下一個合乎邏輯的步驟,”Kenarsari-Anhari 說。“Shepherd 正在授權(quán)產(chǎn)品經(jīng)理和 UX 設(shè)計師構(gòu)建原型并快速迭代,但我們的目標是擴大其目標用戶群。如果每個人都可以建立自己的助手會怎樣?將其命名為他們想要的名稱 - 而不是 Alexa!——并賦予它他們想要的個性。”

雖然開發(fā)自然語言處理模型并在沒有專業(yè)軟件的情況下實現(xiàn)它們是完全可能的,但這條路線并不適合所有人。

“當然可以——蘋果、亞馬遜、谷歌和微軟做到了,”他說。“這真的是關(guān)于一個企業(yè)是否有資源,是否致力于圍繞它建立一個組織,是否有能力等待幾年。”

未來的趨勢

語音正在成為下一代技術(shù)用戶的首選界面,Syntiant 的首席執(zhí)行官 Kurt Busch 在去年夏天接受 EE Times 采訪時表示。

Busch 描述了他最小的孩子是如何使用智能手機上的語音界面與他的朋友發(fā)短信的,他可以閱讀,但對于寫作和拼寫還太小。

“他的哥哥姐姐們發(fā)短信,但他這一代人比他們早幾年有了手機,”布施說。“隨著時間的流逝,對于他這一代和年輕一代來說,他們的默認界面是與它交談。”

Busch 的觀點是,語音將成為“未來的觸摸屏”,設(shè)備內(nèi)處理首先在具有鍵盤或鼠標的設(shè)備中提供快速響應的界面,然后在白色家電中提供。

Syntiant 的芯片是專門的 AI 加速器,旨在處理功耗預算低至極低的消費電子設(shè)備中的語音 AI 工作負載。迄今為止,這家初創(chuàng)公司已在全球出貨超過 1000 萬顆芯片,其中大部分已進入手機以實現(xiàn)始終在線的關(guān)鍵字檢測最新的 Syntiant 芯片NDP120可以識別“OK Google”等熱詞,以低于 280 μW 的功率激活 Google 助手。

在未來,Busch 還看到語音控制能夠為每個人實現(xiàn)連接和訪問技術(shù)。

“我們將聲音視為技術(shù)的偉大民主化者,”布希說。“世界上有 30 億人每天靠 2 美元過活。我的假設(shè)是那些人沒有互聯(lián)網(wǎng)接入,可能沒有通過教育系統(tǒng)。這里的自然界面是[speech]。這就是您如何將技術(shù)帶入當今未與技術(shù)交互的第三個世界。我們看到發(fā)展中國家對語音優(yōu)先應用程序產(chǎn)生了濃厚的興趣,以獲取以前可能無法訪問的社會群體,不僅從費用的角度來看,而且從舒適的角度來看。”

市場分割

Knowles 的物聯(lián)網(wǎng)高級總監(jiān) Vikram Shirastava 告訴 EE Times,一個與語音一樣快速增長的市場的危險在于,它可能會迅速變得極其分散,而不僅僅是硬件產(chǎn)品線。

“市場變得支離破碎,比如說,使用的是什么語音識別引擎?” 希拉斯塔瓦說。“市場會變得支離破碎,這取決于您是與電視 SoC 集成還是內(nèi)部是簡單的 MCU,例如微波爐。您會根據(jù)操作系統(tǒng)或聲學環(huán)境獲得碎片——它只是家嗎?是外面的門鈴嗎?不可能有一種萬能的解決方案。你必須找到這些垂直領(lǐng)域的共同點,并嘗試相應地解決語音整合問題。”

Knowles 有一個基于 DSP 的語音控制解決方案,它打算為不同的垂直行業(yè)推出版本。它的方法是將市場碎片歸為具有共同點的市場——例如,家庭控制、電視條形音箱和遙控器可能屬于同一組——然后開發(fā)針對該組應用進行優(yōu)化的解決方案。Shirastava 將這種方法稱為“比統(tǒng)包低一級”,它提供統(tǒng)包的可擴展性,但增加了一些靈活性。

“我們必須有一些不同的版本來解決這種碎片化的某個方面,以便我們能夠覆蓋我們想要追求的垂直領(lǐng)域,”他說。

Knowles 最近發(fā)布的 AISonic 藍牙標準解決方案是一款用于藍牙連接設(shè)備(如智能揚聲器、智能家居設(shè)備、可穿戴設(shè)備和車載語音助手)的語音識別開發(fā)套件。該套件基于 Knowles 的 IA8201 雙核 DSP 芯片,該芯片專為神經(jīng)網(wǎng)絡(luò)處理而設(shè)計,功耗遠低于應用處理器。例如,該芯片可以在 50 mW 以下同時處理用于關(guān)鍵字定位、源分類、波束形成、聲學回聲消除 (AEC) 和源方向估計的單獨 AI 模型。這是通過在 Tensilica DSP 內(nèi)核上用于音頻和 AI 處理的近 400 條自定義指令的指令集擴展實現(xiàn)的,這反過來又允許降低時鐘頻率以節(jié)省功耗。

語音最終會成為大多數(shù)消費類電子產(chǎn)品的默認用戶界面嗎?看起來確實是這樣。先進、高效的 AI 語音控制算法、使開發(fā)人員能夠輕松集成語音的開發(fā)環(huán)境以及不斷增長的能源和成本效益硬件解決方案生態(tài)系統(tǒng)的組合已經(jīng)出現(xiàn),使這一切成為可能。



審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4623

    瀏覽量

    93104
  • 功率
    +關(guān)注

    關(guān)注

    14

    文章

    2069

    瀏覽量

    69947
  • 語音控制
    +關(guān)注

    關(guān)注

    5

    文章

    484

    瀏覽量

    28271
收藏 人收藏

    評論

    相關(guān)推薦

    【「從算法到電路—數(shù)字芯片算法的電路實現(xiàn)」閱讀體驗】+介紹基礎(chǔ)硬件算法模塊

    作為嵌入式開發(fā)者往往比較關(guān)注硬件和軟件的協(xié)調(diào)。本書介紹了除法器,信號發(fā)生器,濾波器,分頻器等基本算法的電路實現(xiàn),雖然都是基礎(chǔ)內(nèi)容,但是也是最常用到的基本模塊。 隨著逆全球化趨勢的出現(xiàn),過去的研發(fā)
    發(fā)表于 11-21 17:05

    離線語音控制模塊,讓生活更懂你!

    離線語音模塊方案在智能家居、醫(yī)療設(shè)備等領(lǐng)域的開發(fā)正日益受到重視。這種方案無需網(wǎng)絡(luò)連接,即可實現(xiàn)語音指令的識別與執(zhí)行,為用戶提供了更加便捷、高效和安全的交互體驗。離線語音控制模塊支持方案
    的頭像 發(fā)表于 11-02 08:07 ?265次閱讀
    離線<b class='flag-5'>語音</b><b class='flag-5'>控制</b>模塊,讓生活更懂你!

    人工智能教學實驗箱_國產(chǎn)處理器:5-29 語音識別控制實驗

    芯片 CI112X 芯片具有較強的CPU運算能力,支持硬件NN加速,以及充足的RAM。能夠完成一些常見的語音處理算法。主要包含了ASR(語音識別)和
    發(fā)表于 10-15 17:09

    物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的語音識別方案_離線語音識別芯片分析

    ,避免了網(wǎng)絡(luò)延遲或不穩(wěn)定對識別速度的影響,從而保證了系統(tǒng)的實時響應能力。 高度穩(wěn)定性和可靠性:離線語音識別芯片采用先進的硬件設(shè)計和算法,能夠在各種環(huán)境下穩(wěn)定運行,不受網(wǎng)絡(luò)狀況的影響,提高了系統(tǒng)的整體穩(wěn)定性和可靠性。 2、數(shù)
    的頭像 發(fā)表于 09-26 17:56 ?699次閱讀
    物聯(lián)網(wǎng)系統(tǒng)智能<b class='flag-5'>控制</b>產(chǎn)品的<b class='flag-5'>語音</b>識別方案_離線<b class='flag-5'>語音</b>識別芯片分析

    為什么FPGA屬于硬件,還需要搞算法

    交流學習,共同進步。 交流問題(一) Q:為什么FPGA屬于硬件,還需要搞算法? 剛?cè)腴T準備學fpga但一開始學的是語法,感覺像是電路用軟件語言描述出來,fpga不用會pcb
    發(fā)表于 09-09 16:54

    用“說”智能控制燈具開關(guān)語音識別芯片NRK3603

    用“說”智能控制燈具開關(guān)是一種基于語音識別技術(shù)的智能家居設(shè)備,它通過內(nèi)置的語音識別芯片,利用離線識別算法,將用戶的語音指令實現(xiàn)對燈具的
    的頭像 發(fā)表于 09-07 09:26 ?400次閱讀
    用“說”智能<b class='flag-5'>控制</b>燈具開關(guān)<b class='flag-5'>語音</b>識別芯片NRK3603

    離線語音控制技術(shù)特點

    離線語音控制通過結(jié)合高性能的音頻前端處理算法和本地AI模型實現(xiàn)了高效的語音識別和控制能力,不依賴于互聯(lián)網(wǎng)連接,同時具備靈活的應用擴展性。這種
    的頭像 發(fā)表于 06-26 18:12 ?526次閱讀
    離線<b class='flag-5'>語音</b><b class='flag-5'>控制</b>技術(shù)特點

    車載語音識別系統(tǒng)語音數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)是指利用機器學習算法實現(xiàn)的一種自然語言處理技術(shù),載語音識別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量,將所聽到的語音轉(zhuǎn)化成可讀取的語言數(shù)字,從而達到實現(xiàn)車輛
    的頭像 發(fā)表于 06-19 15:52 ?385次閱讀
    車載<b class='flag-5'>語音</b>識別系統(tǒng)<b class='flag-5'>語音</b>數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)語音數(shù)據(jù)采集標注案例

    車載語音識別系統(tǒng)是指利用機器學習算法實現(xiàn)的一種自然語言處理技術(shù),載語音識別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量,將所聽到的語音轉(zhuǎn)化成可讀取的語言數(shù)字,從而達到實現(xiàn)車輛
    的頭像 發(fā)表于 06-19 15:49 ?534次閱讀

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評測SDK合集)

    *240 的觸摸顯示屏,屏顯硬件接口為 SPI,觸摸硬件接口為 I2C 。 9麥克風板載的兩個麥克風,連接芯片的 Audio ADC,用于語音相關(guān)應用的錄音。 10硬回采開關(guān)用于控制
    發(fā)表于 06-18 17:33

    語音控制模塊_雷龍發(fā)展

      1,串口   uart串口控制模式,即異步傳送收發(fā)器,通過其完成語音控制。 []()   圖中,GND表示單片機系統(tǒng)電源的參考地,TXD是串行發(fā)送引腳,RXD是串行接收引腳。發(fā)送uart將來
    發(fā)表于 06-14 17:18

    BLDC電機控制算法詳解

    算法。本文將詳細介紹BLDC電機的控制算法,包括電速算法、電流環(huán)控制算法、磁場導向
    的頭像 發(fā)表于 06-14 10:49 ?1148次閱讀

    基于ASR-PRO離線語音芯片,DIY一個可轉(zhuǎn)動的語音控制的月球音響燈

    功能介紹 1、支持語音控制月球燈的底座旋轉(zhuǎn)、3Wled燈片的亮滅。 2、外掛藍牙音頻模塊,手機連接藍牙即可播放音樂。 配置介紹 1、ASR-PRO離線語音模塊(核心板) 2、藍牙音頻接受模塊
    發(fā)表于 05-20 14:45

    MCU配對簡化了語音控制接口設(shè)計

    意法半導體將其STM32微控制器(MCU)硬件和軟件與Sensory的語音控制技術(shù)相結(jié)合,以簡化可穿戴設(shè)備、物聯(lián)網(wǎng)(IoT)和智能家居應用中基于語音
    的頭像 發(fā)表于 05-06 16:21 ?2129次閱讀
    主站蜘蛛池模板: 在线播放网址| 91av视频| 日本综合在线| 狼人狠狠干| 边摸边吃奶边做视频叫床韩剧 | 特色一级黄色片| 香蕉视频啪啪| 日本在线www| 黄色在线免费看| japan高清视频乱xxxxx| 天天射天天操天天| 国产午夜久久影院| h网站免费在线观看| 禁漫羞羞a漫入口| 唯美久草| 毛片在线看免费版| 成年片色大黄全免费网址| 天天干天天操天天操| 国产高清亚洲| 日本不卡高清视频| 午夜三级视频| 美女视频黄视大全视频免费网址| 成人精品亚洲| 免费特黄一区二区三区视频一| 欧美性区| 在线精品视频成人网| 色多多视频在线观看免费大全| 黑色丝袜美美女被躁视频| 黑色丝袜美女被网站| 69xxxxxxxxxhd日本| 在线观看三级视频| 欧美一级特黄aaa大片| 国产美女免费| 人人爽人人干| 又粗又长又色又爽视频| 亚洲va久久久噜噜噜久久狠狠| 欧美午夜在线视频| 永久免费影视在线观看| 国产精品资源在线| 娇妻被黑人蹂躏| 欧美精品hdvideosex|