在2014年年末,中興發(fā)布了旗下星星1號的升級版星星2號手機,其語音功能經(jīng)過了增強升級,更純粹以語音沖擊市場。語音技術(shù)是人機交互發(fā)展的重要一環(huán),將成為繼鍵盤、觸摸屏之后的第三種人類交互模式。在經(jīng)歷了鍵盤和觸摸之后,消費電子發(fā)展的人機交互更趨向于釋放解放雙手,那么語音技術(shù)便有著良好的前景,而中興星星2號為我們帶來了突破性發(fā)展,押寶語音功能。
蘋果Siri雖然不是第一個人與手機之間的交互方案,但是它確實把人機之間的智能語音交互帶動起來。星星2號的語音功能出現(xiàn)得比較晚,同時在市場的知名度也不及蘋果、微軟和Google等一眾語音產(chǎn)品,不過中興一向低調(diào)在語音領(lǐng)域耕耘,因此它有底氣接受市場上的挑戰(zhàn)。星星2號的語音功能對決蘋果 Siri,今天我們就直接來看看。
●語音技術(shù)簡析
Siri成立于2007年,2010年被蘋果以2億美金收購,最初是以文字聊天服務(wù)為主,隨后通過與全球最大的語音識別廠商Nuance合作,Siri實現(xiàn)了語音識別功能。Siri 被蘋果收購了之后, 他已經(jīng)被整合為系統(tǒng)的一部分了。
語音助手技術(shù)對比
機型系統(tǒng)版本語音助手技術(shù)功能特點
蘋果SiriiOS 8.2Siri(語音識別廠商Nuance合作)自然語言識別、識別率高、系統(tǒng)功能豐富。
中興星星2號Android 4.4.2聲控技術(shù)是與Nuance合作聲紋解鎖、3MIC降噪、全語音駕駛操作
星星2號的語音技術(shù)經(jīng)過了升級,擁有聲控技術(shù),帶來聲紋解鎖、3MIC降噪、全語音駕駛操作等聲控操作。它的最突出的地方便在于聲紋驗證功能和優(yōu)化于駕駛環(huán)境所使用的語音技術(shù),可以讓手機用戶在駕車時能夠獲得更智能和安全的移動體驗。同時其能實現(xiàn)多個場景下完全脫離雙手操作,語音全程貫通,系統(tǒng)級別的語音嵌入,更為高效。
●中興牽頭成立語音聯(lián)盟
中興一直在語音領(lǐng)域有低調(diào)耕耘,在 2014年的9月份,中興牽頭發(fā)起,Nuance、Audience、高德、百度、中國科學(xué)院自動化所等語音技術(shù)權(quán)威機構(gòu)組成的“智慧語音聯(lián)盟”宣布正式成立,同時行業(yè)首個智能語音技術(shù)規(guī)范標(biāo)準(zhǔn)“5A標(biāo)準(zhǔn)”也隨之正式出爐。“智慧語音聯(lián)盟”成立后,將整合產(chǎn)業(yè)鏈上下游的語音技術(shù)和資源優(yōu)勢,共同完善終端語音生態(tài)系統(tǒng),并為全行業(yè)的智慧語音發(fā)展搭建平臺。
中興牽頭成立智慧語音聯(lián)盟
根據(jù)中興官方的解釋,“智慧語音聯(lián)盟”成員提出“5A標(biāo)準(zhǔn)”,即倡導(dǎo)未來的智能語音解決方案需要具備個性化語音體驗(Anyone)、智能全操控(Anyhow)、全天候操作(Anytime)、千萬級數(shù)據(jù)本地存儲(Anything)以及全環(huán)境使用(Anywhere)這五大特征。要想令智慧語音技術(shù)成為未來智能終端的發(fā)展趨勢,那么行業(yè)的的規(guī)范技術(shù)標(biāo)準(zhǔn)必須先要制定,這也是中興牽頭成立智慧語音聯(lián)盟的初衷。
星星1號已經(jīng)有強大語音功能
其實早在2012年中興就已開始智能語音技術(shù)的自主研發(fā),并與Audience、Nuance等語音技術(shù)企業(yè)合作推出了一系列創(chuàng)新語音應(yīng)用服務(wù),是目前國內(nèi)最早布局手機語音技術(shù)的終端廠商之一。中興旗下的首款全語音操作的應(yīng)用“駕駛助手”獲得不少好評,而星星2號在星星1號的基礎(chǔ)上繼承了強大的語音功能,語音識別率達(dá)到了90%,同時“自定義語音喚醒詞”技術(shù),用戶能夠根據(jù)自己的心情和需要自行定義手機的鎖屏喚醒詞。從中興成立智慧語音聯(lián)盟可以看出,其已經(jīng)為未來的語音操控發(fā)展提早布局。
-------------------------------------------
語音識別技術(shù)資料匯總——快用語音識別技術(shù)來改變世界吧!
●功能一覽
語音助手經(jīng)歷了幾年的發(fā)展,其可以完成的事情已經(jīng)比較豐富。基礎(chǔ)功能方面,包括了打電話、發(fā)短信、設(shè)提醒、查找位置、詢問天氣、打開自帶程序等,這些都是一些很常用的動作設(shè)置。高級功能便包括了一些附近興趣點的搜索、天氣、股票、電影等一系列的生活服務(wù)和語言翻譯等,這里涉及到了O2O的本地化服務(wù),當(dāng)然這些高級的功能必然需要聯(lián)網(wǎng)才能使用。
中興星星2號的語音功能是嵌入在系統(tǒng)層級上面,低功耗的DSP技術(shù)令其語音助手長時間處于準(zhǔn)備狀態(tài),在任何頁面和應(yīng)用都能輕松喚醒語音助手,實現(xiàn)全離線的語音操控。對比蘋果Siri,星星2號能夠離線使用,而蘋果Siri必定需要網(wǎng)絡(luò)才能運行,同時本地語音識別準(zhǔn)確率高,可以輕松快捷完成指令。
繼承星星1號的語音功能,星星2號在基礎(chǔ)的功能上再次優(yōu)化,能讓語音交互更加完善,例如電話、短信、相機、導(dǎo)航等。蘋果Siri能做的事情更加多,同時也可以適度“調(diào)戲”,趣味性更佳。
●功能提升
星星2號的智慧語音在升級后,在語音識別率上提高不少,同時更偏向于自然語言,能夠支持語音在多應(yīng)用間的切換。此外還加入了快速的語音撥號功能,在鎖屏或者待機的時候直接把手機放耳邊然后說出聯(lián)系人名字便可以進行通話,把常規(guī)通話的點亮屏幕-解鎖-打開通話-查找聯(lián)系人(按鍵撥號)這些步驟簡化了。
此外“魔幻指令”是星星2號新增的功能,用戶可以自定義喚醒詞和所對應(yīng)的應(yīng)用,比如錄制“微博”喚醒詞,將它與微博綁定,這樣不論是待機或者熄屏狀態(tài),對星星2號說出“微博”便能快速啟動應(yīng)用,給予用戶更多自定義的快捷語音方式。
●系統(tǒng)級語音功能
星星2號的語音功能貫穿了整個系統(tǒng)層級,而蘋果Siri雖然也是繼承在系統(tǒng)中,不過其語音交互的觸發(fā)仍然需要通過Siri這一頁面聚合,而星星2號可以在任何頁面和應(yīng)用中喚醒直接觸發(fā)功能,而不需要進入一個聚合的頁面。
舉例來說,假如我們需要進入到駕駛導(dǎo)航模式,星星2號的步驟是喚醒語音助手-打開駕駛模式,而蘋果Siri則需要喚醒Siri-打開Siri聚合頁面- 進入駕駛模式(地圖),這兩者之間差距了一步,星星2號的語音助手在喚醒后可以直接進行相關(guān)功能操作,而Siri仍然需要跳轉(zhuǎn)調(diào)用。前者語音功能是在系統(tǒng)的底層,而Siri的語音功能仍然匯集在某個區(qū)或者APP上,需要通過激活才能調(diào)用。這便是兩者在語音交互的一絲差別。接下來我們直接通過視頻來對比兩者的差別。
●功能測試
本次語音測試的功能主要包括激活、解鎖、打電話、發(fā)短信、照相、播放音樂、導(dǎo)航,這些都是我們最有可能使用到的,使用頻率比較高,能考驗語音操控技術(shù)的實用性和易用性。
1:激活方式
中興星星2號語音喚醒啟動方式顯得十分方便,默認(rèn)狀態(tài)下,各種狀態(tài)(黑屏、鎖屏、解鎖亮屏等)下只要對手機發(fā)出“星星2號”(默認(rèn))的指令或亮屏狀態(tài)下長按虛擬主頁鍵,語音助手就可啟動,當(dāng)成功開啟語音助手后,頂部狀態(tài)欄會有語音圖標(biāo)出現(xiàn)。當(dāng)然語音喚醒的啟動手機指令是可以更改的,你們可以設(shè)置諸如“芝麻開門”等,這些都是通過聲紋技術(shù)進行識別。
喚醒方式
Siri的喚醒方式仍然是長按Home鍵,或者設(shè)置界面中可以開啟“嘿Siri”的語音指令也可以快速啟動。在大部分可以用手觸碰操作的場景,語音操作的必要性肯定不高。蘋果Siri可以通過長按Home鍵進行喚醒或者在接通電源的時候才能通過“嘿Siri”語音喚醒(iOS 8),星星2號發(fā)揮了系統(tǒng)級語音功能的優(yōu)勢,無論是待機還是任何應(yīng)用界面都能通過語音喚醒,當(dāng)你在特定不能釋放雙手的場景,諸如駕車的時候,語音喚醒的便捷性體現(xiàn)出來。
2:解鎖
屏幕解鎖是智能手機少不了的一個基本操作。市面上絕大部分手機屏幕解鎖都離不開“滑”或者“按”這樣的手部操作,只有少數(shù)手機能進行語音的解鎖。有那么一個場景,當(dāng)你在電腦面前敲字的時候,此時想打個電話或者聽音樂,你便要暫時敲字拿起手機點亮屏幕解鎖再打電話。如果能通過語音解決所有的動作,那么我們便省下了很多步驟。
聲紋解鎖
在你要打電話、播放音樂前,解鎖手機是必須的。Siri能在鎖屏狀態(tài)下啟動,但是在沒有密碼的未解鎖亮屏狀態(tài)下不能進行解鎖。中興星星2號主打的聲紋解鎖能通過人體獨有的聲學(xué)紋理進行解鎖。我們可以在黑屏狀態(tài)通過語音喚醒,然后說出“解鎖”即可順利解鎖,這過程沒有拖沓,很迅速。
我們按照推薦錄制了“芝麻開門”這語音指令,這一操作需要保證環(huán)境安靜。進行解鎖測試,準(zhǔn)確率與反應(yīng)時間都很不錯,只在語音信息分析的時候需要1-2秒的時間,實用性較高。當(dāng)然聲紋相比較指紋在唯一性上或者安全性上還是有一定的差距,我們嘗試對聲紋解鎖者進行錄音然后回放也能成功解鎖,而使用過程中也有兩個人相似聲紋特征能同時解鎖的情況。當(dāng)然這些情況是比較個別的,總的來說聲紋還是能給予用戶安全加一道門。
3:電話功能
電話功能是一臺手機最基礎(chǔ)的功能,也是日常使用頻率最多的功能之一。通過語音指令進行撥號也可以簡化操作、節(jié)約時間,在特定情形下很有必要。
語音撥號
星星2號的優(yōu)勢在于加入了快速撥號功能,我們拿起手機放耳朵直接說出聯(lián)系人就會撥號,整個操作迅速,不受網(wǎng)絡(luò)、鎖屏等限制,基本在1秒左右便完成。而 Siri的處理方法仍然需要喚醒Siri,對他說出撥號給某聯(lián)系人,隨后確定才會撥出,整個過程想對星星2號多了很多步,效率不高。
4:打開應(yīng)用
照相應(yīng)該我們?nèi)粘4蜷_很頻繁的應(yīng)用,我們以此來測試語音助手打開應(yīng)用的體驗。蘋果Siri在啟動后,我們對它說“打開XXX”便可以啟動某個應(yīng)用,其會迅速反應(yīng),為我們打開應(yīng)用。反應(yīng)時間很快。在打開相機后,操作便會完全變了自定義操作,并無語音控制拍照之類的功能。
音樂與拍照
星星2號在應(yīng)用打開方面表現(xiàn)也不錯,其打開應(yīng)用的方式和Siri幾乎一致,不過相比蘋果Siri,多應(yīng)用之間切換更迅速,例如在打開手電筒的同時可以再次激活語音打開相機并完成拍照。從激活語音到打開單個應(yīng)用的時間幾乎可以忽略不計。對比Siri,在打開手電筒的時候如果想激活相機拍照,便需要再次喚醒 Siri進入聚合界面才能夠再次啟動拍照界面,而星星2號更加直接方便。
啟動語音助手后,我們說“打開相機”,飛速就進入應(yīng)用界面。拍照界面中,我們可以通過說出“拍照、茄子或開始”便能快速進行拍照,具備聲控操作,自拍的時候特別有用。最后要說的一點便是,Siri僅僅是可以打開 XXX應(yīng)用,但是它們不具備退出應(yīng)用的功能,而在星星2號中,語音助手除了能為我們打開應(yīng)用,還能夠退出某個應(yīng)用、進行接聽、掛斷或是進行短信拒接,能夠?qū)崿F(xiàn)全程語音化。
5:駕駛助手
語音操控在功能和場景上,暫時最具實用性的應(yīng)該是駕車的時候。在我們駕車的時候,當(dāng)我們想導(dǎo)航到某一個目的地的時候,與手機溝通總比拿下來再輸入目的地的方法快和酷很多,最重要還是需要照顧駕車的安全性。
導(dǎo)航對比
星星2號的語音導(dǎo)航可以和魔幻指令一起使用,在熄屏狀態(tài)下,只要說出預(yù)先設(shè)定好的魔幻指令詞,星星2號會直接啟動駕駛模式,同時我們也可以喚醒語音助手后打開導(dǎo)航助手。你可以全程用語音控制導(dǎo)航,語音導(dǎo)航非常方便。
從語音導(dǎo)航效果來看,Siri和中興語音助手兩者均可以識別正常的說話方式進行地點的設(shè)定然后路線規(guī)劃導(dǎo)航,不過在導(dǎo)航過程中,星星2號支持語音切換應(yīng)用,包括音樂的控制等等,而蘋果如果想再次進行語音操控,仍然需要手動觸發(fā)Siri才能進行,星星2號的語音更加智能自動化,能做到全程導(dǎo)航語音操控。
●星星2號語音操控全程化
星星2號與Siri對于這幾項日常操作都能輕松完成,不過星星2號顯然語音操控更實用更高效。舉例來說,我們不論是在拍照還是播放音樂的時候,Siri 僅僅可以控制的部分只是打開,而切換下一首、停止音樂、暫停等操作都需要重新激活Siri,拍照更是如此,打開相機之后便會重新回歸所有的手動操作。
我們反觀星星2號,其能夠支持語音多應(yīng)用無縫切換,如語音打開音樂,隨后直接可以語音控制,此外還可以同時打開相機進行拍照。如果你拍照期間想切換下一首歌曲或者暫停,直接語音操控,并不需要重新激活語音助手。星星2號在經(jīng)歷了長時間的研發(fā),語音識別率和反應(yīng)速度已經(jīng)很優(yōu)秀,實用性不俗。
●總結(jié)
從星星2號與蘋果Siri的對比結(jié)果來看,前者算是比較靈活,充分發(fā)揮了其語音系統(tǒng)級別集成的優(yōu)勢,能夠做到全離線、全嵌入式的操控。在多應(yīng)用之間進行方便的語音切換和操控,同時改善了語音識別率,提高到90%,同時硬件性能的提升也加速了它的語音反應(yīng)速度。依靠低功耗的DSP芯片,能夠做到隨時隨地的語音待機而耗費極少的電量。蘋果Siri的優(yōu)勢便在于其識別率高,可以完成的事情也很多,同時支持多語言,不過相對來說較為死板,應(yīng)用之間的語音切換仍然需要喚醒,同時在諸如拍照、音樂的界面便不能進行語音操控,無法做到真正的釋放雙手。
語音識別技術(shù)資料匯總——快用語音識別技術(shù)來改變世界吧!
?
評論
查看更多