隨著虛擬語音助手的蓬勃發展,目前正在對各個行業產生影響??赡艽蠹叶挤浅J煜堤O果的siri、微軟的小冰,因為它們都是國際大公司注重的產品,因此,非常受人注目。但是要論虛擬語音助手的可商業化道路,中國的企業要技高一籌。
杭州駭音科技有限公司(以下簡稱:駭音科技)把虛擬語音助手VIA與耳機進行結合,突然之間,讓我們看清耳機的下一步發展趨勢。
駭音科技CEO任博昉說:“耳機發展到今天,人們已經不能僅僅滿足只是娛樂聽歌,它必須承載更多的功能,我們定義人工智能耳機將會是智能手機的控制終端?!?/p>
現在人工智能耳機還沒有普及開來,所以人們對它還沒有概念,但是人工智能耳機卻是耳機的發展趨勢,今后,人們通過耳機就能夠控制手機里的軟件,比如“幫我發一條微信”、“幫我查看快遞”、“我要去XXX”、“我要買衣服”等等,很多日常生活中的瑣事,我們都可以通過語音直接對耳機下達指令,它會一步到位幫我們執行,簡化了我們對手機的操作。
或許很多人還是沒有概念,當看完這篇文章后,你的概念將會逐漸清晰化。
1號機器人網記者:你們的虛擬語音助手VIA有什么特色?它可以做什么事情?
首先,它是隨時隨地的待命;不管你處在什么狀態,只要跟它說一聲“芝麻開門”,它就會被喚醒,然后你只要說出指令,它就會一步到位的執行。
其次,它相當于管家助理,可以幫你解決問題;比如說,今天我有一個重要的會議,需要人提醒,傳統的做法,是拿出手機,然后通過各種操作設置,現在只要對著虛擬語音助手VIA說“芝麻開門,幫我記一下X點鐘會有一個會議,”到預定時間VIA就會提醒你。
還比如,我要打電話給某人,傳統的做法是,拿出手機打開通訊錄,搜索名字,再撥打,現在只要對著虛擬語音助手VIA說:“芝麻開門,幫我打電話給XX,”你的電話就直接撥通過去了,不需要再進行手動操作。大大方便了操作的過程。
最后,再強調一點,目前市面上很多虛擬語音助手都是在模擬耳朵,就是當人與它對話時,讓它聽懂人在說什么。而我們最大的區別就是,我們是通過虛擬語音助手去幫你控制各種各樣的軟件,比如智能手機里有成千上萬的APP,都可以通過虛擬語音助手VIA去控制。
而且,虛擬語音助手VIA還具備學習的功能,任何它不會的操作,只要用戶手動去教會它使用一次,接下來,你只需要通過語音,它就可以按照你手動操作的過程去一步到位的執行。
1號機器人網記者:市面上的虛擬語音助手,如蘋果、微軟等虛擬語音助手都是直接在手機上安裝APP,然后通過手機來互動對話,但你們做成了耳機硬件,在人機交互上兩者會有怎樣的區別?
任博昉:
圖:駭音科技人工智能耳機
不管是蘋果的siri,還是微軟的小冰,它們都是注重機器人的聊天系統,就是讓人與機器人對話,讓機器人能夠像人一樣與人類對話,我覺得這個技術發展會非常的漫長,這不是我們想要追求的方向。
我們追求的是語音技術所能帶來的便捷服務,如幫我查快遞、幫我發微信給某人、打開支付寶支付、我想看XXX電視劇等等,我們強調的是“控制”,直接通過語音來控制各個軟件,讓我們的生活更加便捷。
而我們把虛擬語音助手VIA裝進耳機硬件里,是因為耳機是日常生活中不可替代的設備,我們經常帶著耳機玩手機,既然如此,那我們就讓手機操作更加便捷好了,不需要再對著手機屏幕手動去操作各種軟件。
比如,只要耳機掛在我脖子上,不管我是不是戴著耳塞,這個無所謂,只要耳機是掛在脖子上。那我只需要說:“芝麻開門,我想查看快遞?”、“芝麻開門,打開導航,我想去XXX?”、“芝麻開門,打開微信,給XX發一條微信,今晚一起吃飯。”等等只需要動動嘴,就可以執行了。它能幫我們一步到位執行,很方便。
現階段的語音技術是可以支撐這方面的應用,而且我們已經做了大量的印證,也實現了產品的量產。
通過耳機,我們可以把指令更清晰的傳達給虛擬語音助手,如果是對著手機講,一是操作復雜化了;二是在一些嘈雜的場所,語音識別準確率會大大降低,如果我是通過耳機,不管我是走在馬路上,還是在餐廳里,或是在工地上,我只需要正常說話,它都能夠清晰的聽清我下達的指令。這就是最大的區別。
1號機器人網記者:通過測試你們的人工智能耳機,可以通過語音直接控制手機里的各種軟件,從使用結果來看,確實挺方便,但是每次說話都要說“芝麻開門”才能喚醒工作,這也很麻煩,你們現在有沒有更好的執行方式?
任博昉:這是現階段語音技術最好的展示形式,舉個例子來講,我們4個人坐在一起討論,你要跟一個人說話,要么朝著他的臉,要么指著他說話,要么就叫他的名字,但機器人不一樣,它不知道你是在跟誰說話,所以我們必須要用暗號的方式,讓它知道你是在跟它說話。
因此,我們在前面加一個引子,如“芝麻開門”,作為一個喚醒詞,如果你不給它起一個頭,它不知道你什么時候開始說話,所以必須要有一個喚醒詞;當你喚醒它后,說話又非常長也不行。因為太長的指令,它識別誤差非常大,因此,沒有準確率可言。
如果我們喚醒它之后,加簡短的指令,控制在3秒左右,我們測試的結果是準確率可以達到97%左右,虛擬語音助手執行指令就非常準確,而且高效,這是目前我們通過各種嘗試后,得出的最佳使用方式。
等以后語音技術取得更大的突破后,如機器人可以識別哪些是指令,哪些是廢話的時候,那我們的喚醒方式就不用重復的去講,只需要起一個頭,在一個語境內,我們的所有指令都可以一步到位執行。
1號機器人網記者:我覺得你們的做法比較明智,把語音助手和耳機結合在一起,耳機是現代人的硬需求,可以談談人工智能耳機與普通耳機會有怎樣的差別?今后人們通過耳機會有怎樣的生活方式?
任博昉:我認為耳機與虛擬語音助手結合是大勢所需,兩者結合后,我們可稱之為“人工智能耳機”。
隨著智能手機里涌現出越來越多的應用軟件,耳機原本只是人們用來聽歌的產品,我認為接下來人們對耳機的需求將不僅僅只是聽歌而已,如果僅僅只是聽歌已經不能滿足人們對高科技產品的期待。
我認為人工智能耳機是必然的發展趨勢,我可以通過人工智能耳機隨時隨地控制智能手機,我甚至不用打開手機,通過耳機就能了解我想了解的資訊,以及我想要做什么事情?通過語音就可以完成,這是更便捷的生活方式。
舉個例子來講,脖子上掛著駭音科技的人工智能耳機之后,我只要說:“芝麻開門,給XX發條微信,今晚我們一起吃飯?!本屯晔铝耍挥迷倌贸鍪謾C觸屏操作。待對方收到信息后,回復微信,通過人工智能耳機,你就能夠聽得到對方的回復。
還比如:“芝麻開門,我想買件衣服,”它就幫我打開手機淘寶,然后跳轉到衣服的頁面,供我挑選。
甚至說“芝麻開門,我想去世界之窗,”它就幫我打開高德地圖,直接把路徑導航規劃好,我在行走過程中的導航播放會通過人工智能耳機反饋給我。
所以,今后人工智能耳機將不僅僅是聽歌使用,而是智能手機的控制終端。
下一步,我們還可以做到語言的互通,舉個例子,“芝麻開門,給吉姆發條短信,我很感興趣你的項目,一切按你說的操辦?!边@條信息會自動翻譯成英文發到他的智能手機里,他在美國看到信息后,用英語回復的內容,將會自動翻譯成中文傳到我的智能手機里。屆時世界上不同人種的溝通將不會有語言障礙,所以世界將會更加的平坦。
1號機器人網記者:從技術的角度去講,你們認為虛擬語音助手下一步的發展方向是怎樣?
任博昉:虛擬語音助手發展會有兩大因素推動,第一個是大數據;第二個是智能硬件。
我認為未來虛擬語音助手可以是大腦連接互聯網的通道,比如未來有更多的大數據互通的時候,將會產生巨大的信息流。屆時虛擬語音助手可以提供更加具有針對性的服務。
比如:當我出門的時候,它會跟我講,今天會有局部暴雨,出門注意安全,就不用再麻煩發布黃色預警,因為是局面暴雨,有些區域是沒有下雨的,因此,信息的接收會更有針對性。
而且,當我戴上耳塞時,耳機就是我連接世界的橋梁,它會實時播放一些我感興趣或我關注的資訊,我遇到什么不懂的事情,我可以直接問系統,系統會幫我解答相關的問題。
其次,虛擬語音助手的載體不僅僅是耳機,未來還可以與各種智能硬件結合,它會以各種各樣的形態來滿足不同人的需求。
所以,我認為虛擬語音助手的發展要把握這兩個方向,因此,后續技術發展需要投入很大的資金去運作,我們也希望能夠有更多的資本方和資源方加入到我們這個行列,讓人工智能耳機更快的普及開來。
1號機器人網記者:最后一個問題,耳機算是虛擬語音助手的載體之一,在虛擬語音助手+智能硬件的思路上,你們還有什么新的想法?如果把時間調到未來十年后的場景,你認為那時的人們通過虛擬語音助手可以實現這樣的生活方式?
任博昉:未來虛擬語音助手+智能硬件肯定是多種多樣的,從我們的角度去講,我們還是注重人工智能耳機的研發,但未來我們會考慮不同形態的耳機。
如便攜音箱,因為長時間戴耳塞,人會受不了,而且在與客戶聊天的時候,戴著耳塞也不禮貌,所以我們也制作了耳機的另外一種形態,“便攜音箱”。當然,這個設備還需要再優化,但是便攜音箱的不同就是在于,你只要把它掛在脖子上就可以了。非常的美觀,也可以當做裝飾物。
便攜音箱的亮點就是,你戴在身上,你旁邊的人是聽不到它的聲音,但它的聲音你是可以清晰的聽到。這就大大提升了它的用途。
隨著5G的帶來,我認為未來人們在線能力會越來越強,可以全天候時時刻刻的在線,所以你信息獲取的效率會很高,幾乎你的大腦與互聯網是暢通的。
當你戴上便攜音箱時,它會時時刻刻為你播放資訊,而且是你關注的資訊,打個比方說,今天美國總統特朗普出臺一個政策,它會對哪些行業有影響?目前走勢如何?等等信息不斷播報給你。如果你是股民,它還可以告訴你,你持有的股票目前走勢如何?現在是否要買進還是賣出。你只要回答“是”或“不是”。
如果是十年后的未來,我想象中的場景是,比如:我要回家,“芝麻開門,我要回家,”這時無人駕駛汽車自動行駛過來停在我面前,我上車,它送我到家。
如我要出門,無人駕駛汽車自動停在我家門口,我只要說,我想去哪里?它就自動將我送達。我下車,它可以自己找車位停車。
如果是按照優步的設想,未來無人駕駛汽車都是共享的,所以未來汽車都不用買了??傊?,當我們時時刻刻在線時,我們的生活將會變得非常的便捷,前段時間看到一篇報道,說YouTube宕機一小時,就有人報警,如果未來服務器宕機一小時,那將是重大的事件,等于是讓我們回到原始社會。
當然,這個話題扯的有點遠,但我認為未來的場景可能會是這樣的。
-
智能手機
+關注
關注
66文章
18515瀏覽量
180607 -
耳機
+關注
關注
28文章
3017瀏覽量
81706 -
人工智能
+關注
關注
1792文章
47514瀏覽量
239248
原文標題:駭音科技:人工智能耳機將會是智能手機的控制終端
文章出處:【微信號:robot-1hjqr,微信公眾號:1號機器人網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論