百度和騰訊之后,阿里也正式入局智能語音助手。
在人工智能實驗室夏季新品發布會上,阿里正式發布了語音音箱“天貓精靈X1”。
沒錯,所以它的喚醒詞,就是“天貓精靈”。
天貓精靈的價格,只需要499元人民幣。這個價錢,相比起市場上的其他智能音箱,確實非常便宜,此前蘋果Home Pod售價349美元,Google Home129美元,觸屏版的亞馬遜Echo是230美元。
天貓精靈X1于7月5日開始限量公測,用戶和開發者可以在天貓精靈官網(bot.tmall.com)申請公測,8月8日將面向天貓會員用戶進行首批正式發售。
據阿里介紹,天貓精靈X1是阿里人工智能實驗室推出的首款智能語音終端設備,內置第一代中文人機交流系統AliGenie。AliGenie生活在云端,它能夠聽懂中文普通話語音指令,目前可實現智能家居控制、語音購物、手機充值、叫外賣、音頻音樂播放等功能。不過據36氪了解,這個音箱似乎一定要插電源,不能直接充電。
1、天貓精靈有哪些較創新點?
前期體驗過叮咚,語音交互和播放音樂用著還不錯。
這次使用了天貓精靈之后,感覺感覺大體上還是叮咚那套東西,基本上叮咚有的功能,天貓精靈上面也有,無外乎就是兩個語音系統+兩個購物體系+不同外觀內核。給用戶展現傳遞出來的實質,差別不大。
天貓精靈可以充話費,但效果沒那么好,可以加購物車,還可以查物流的,也算是個創新的,因為他本身綁定的就是阿里的帳戶,這個也是別人做不到的獨特優勢之處。
天貓精靈相比于其他智能音箱,增加多的、獨特的地方,就是阿里體系的那套東西,它目前主要是把支付寶的東西給移過去。
阿里巴巴的目標應該就是把這些能用語音實現的功能都把他移過去,比如交水電費、充話費、記賬、查物流等,主觀性小、只是要執行操作就能完成的功能,后期應該都會把它放在上面去,因為這些功能用語音操作都是很容易實現的。主觀性特別強、用語音做不了的東西就不移了,比如說搶紅包,購買衣服,由于可選擇性太多,目前還不合適放進去。
其實用語音去讓天貓精靈去完成這些事情,個人感覺也沒方便多少,不過是好奇新奇罷了,不如直接拿個手機點得快。后面如果做得更完善一點的話,應該還會有個屏幕,比如說調用電視機,這是最簡單的方式。直接可以調用電視機,用電視機顯示屏作為智能音箱的顯示屏使用,這樣既方便有節省空間和屏幕。
有屏幕交互會更好,在音箱的外表面環繞一圈。但音箱設計本身,是出于稍遠距離的交互,而不是近距離的交互,如果是近距離的交互,沒必要做音箱了,做個平板更好用。
遠距離的話,也是有范圍的,超過一定范圍你說話聲音就得喊著說了,時間長了會覺得累。天貓精靈現在宣傳的距離范圍是五到十米。叮咚是十米。保守一點,他用的方案也是比京東的差一些。如果確實能夠十米的話,家里面就夠用了。
2、天貓精靈有哪些做得不太好的體驗?
在使用過程中,天貓精靈的產品經理曾特地打電話過來咨詢使用過程中有什么反饋。個人覺得語言識別的準確性還有待提高。
天貓精靈遠場語音識別這一塊,做得不算好。宣傳的充話費功能,在使用充話費的功能的時候,它讓我報手機號碼,我報完我的手機號碼之后,我的手機號碼最后一位是數字8,它每次都會把最后一位數字8識別成語氣助詞的“吧”,然后提示手機號碼是不正確的。重新試了多次,每次都是同樣的錯誤,改成“給185xxxxx8充值x元話費”,才正確識別。
但在用其他家產品,比如手機上的訊飛輸入法之類的,念得非常快,對著我的手機輸入法用的時候,識別得非常容易,立馬就識別了,響應速度快,識別得非常準確。但是他家的識別得就不太好。
阿里巴巴(或者是使用第三方的)目前是沒有輸入法,像百度,訊飛,搜狗,他們的語音識別做得好,其實很受益于前期輸入法的積累。他們做輸入法開始語音識別的時候,最開始也是非常差,但經過了輸入法這么多語料的迭代,再把這些語料再投回訓練模型里面不斷地訓練。現在他們的模型的識別率,遠遠地高于天貓精靈的識別率,這算是天貓精靈的一個短板,缺乏語音識別歷史的相關技術的積累。
還有一個不太好的體驗,下達語音指令時,必須要暫停其他指令,無法實時。
比如說正在播放音樂時,當我想進行下一個操作,我就用喚醒詞叫它時,它就暫停了當前的音樂播放。不能一邊跟它說,它還在一邊播放音樂,等我說完了命令,它再自然切換。
音箱本身交互也是個問題。其實這個就是語音交互最大的難題,就是他在播放音樂時,他很難同時去采集你說話的聲音,在聽到喚醒詞之后必須要停下來,等待你的重新指令。因為聲音是互相干擾的,在麥克風旁邊放一個音箱,你再打電話的時候,也是一樣的效果。
還有就是兩個人聊天的時候,音箱容易就被誤觸、被喚醒。在和別人在聊天,它在旁邊放著,如果你說的話語中包含一些讀音解決的詞語,其實雖然你不是跟他說的,但是依舊會被識別為指令,進行喚醒。而且目前的喚醒詞只能是“天貓精靈”,不能更換為其他可愛、呆萌、簡單的喚醒詞。這個原因可能是受限于短音節的更難識別準確,所以目前市面基本都是4個字的喚醒詞。
3、天貓精靈使用最多的功能有哪些?
天貓精靈對我真正有用處的、滿足實際生活當中需要的,其實都只是一些實用的小工具,比如定鬧鐘,播放音樂,設個倒計時,告訴時間日期。它里面也提供了的一些娛樂內容。比如給小盆友講故事、聽書,個人需求不算大,最開始可能會因為好奇會玩一下,好奇心一過,后期就很少再使用了,還是要分使用場景和使用需求。
不管是什么東西,都應該是解決用戶在實際生活中的需求,才會有持續用下去的動力。
上述說到使用的小工具,其實手機也有,不過是手機不能遠場使用。音箱放在客廳,就可以直接問他,現在幾點了,不用拿手機,不用做任何事情,它就可以直接告訴你現在幾點了,幫定個幾點的鬧鐘。直接說完這句話就可以了,如果用手機的話,你還要翻,你要選中時間,然后再選中分鐘,然后點保存,包括Echo上面用的最多的功能也是問時間,定鬧鐘,說倒計時,其實都是常見場景中一些較實用的小功能。
4、天貓精靈在使用過程中,有沒有特別好和吸引人的地方?
除了定鬧鐘、問天氣之外,沒有特別多的使用場景。時間在家里來說是不需要的,一般家里都有鐘。播報新聞特別難受,因為特別慢,直接用眼睛看新聞,一會就看完了,很快,但讓音箱播放新聞,一字一句的念,時間很長,絕對受不了。對于現在比較急躁的社會,智能音箱的語音速度不算快,任何功能一個個語音播報的話,對比之下你就會更喜歡用手機瀏覽。
目前暫時沒有太多吸引人的地方,它畢竟只是一個單獨的智能硬件。
如果它能夠形成一整個生態的東西,能夠控制我家里面所有的智能設備的時候,比如關燈,把空調溫度調到26度,幫切換一個電視節目,我想看《人民的名義》第三集,然后直接幫我切換到這個電視劇。如果它能對接天貓體系(阿里智能)的話,應該是可以實現很多很多功能的,如果是形成了一整套客廳內的智能家居生態的話,它就相當于一個客廳的所有的智能家居的一個入口,這時候它的價值會比現在多得多。
5、關于智能音箱的使用和發展
目前智能音箱不是剛需,更多的是滿足科技的好奇心和獵奇。某一些喜歡玩智能音箱的人,他可能會買回來玩。但是目前天貓精靈沒法長期用,因為可玩性不高,除了播放音樂之外,他們沒有把真正可玩的東西做起來。
在語音方面應該繼續深化他的相關功能。至少要有很多定制的功能,能讓別人去玩的功能。
聽歌不叫玩,這只是音箱本身應有的功能,普通藍牙音箱也有播放音樂的功能,智能音箱多了個語音說話,但對要聽歌的人來說是沒有意義的,在手機上點和直接跟對它說,對聽歌的人是沒有區別。
如果就語音上來設計的話,一定是要有更多的交流用途,能設計出語音能做的事情,代替變成剛需的東西,他才會發展。現階段的智能音箱,最多還只算是一個比較初級的功能。天貓精靈現在應該是還算一個比較初級的產品,后期的話要形成一個整體的智能家居的生態鏈的一個入口,這樣才會發揮他應該有的價值。
純粹的語音音箱,發展不會太長久,路線也比較窄。所以智能音箱暫時還沒有看到有很強的應用在里面。智能音箱要真正用起來,還需要多結合的設備,智能音箱要做的話就應該是一個入口、一個控制器,而不僅僅是音箱。
6、國內能夠做起來的一整套智能家居的公司有哪些?
能夠做起來的一整套智能家居的,國內廠家有這兩家:小米,華為。
更有可能的是小米。家里剛買了一套小米的設備,有攝像頭,數碼機,有門鈴,有中樞音箱說話的,門鈴就是站在門口的時候,那個門鈴就會叮咚叮咚,不用按的,有人站在門口,他就會響,小米、小米盒子,還有米家,家里面可以看小孩,小米的家居系列東西很全面,他是全套的。
對于天貓目前只有一個音箱的話,這個可用性、可聯動線就很低。而小米現在他是一個配套的,他能做成一個中樞了,他用Zigbee連在網上,中樞用WIFI連在網上,我看到他就這樣子用了,感覺還可以,在家里面都是老人在用,就做兩個模式,一個是在家,一個是出門,點出門那東西就會自動打開,攝像頭打開,回家點一下,攝像頭就關了,傳感器關了,點門鈴,門就會自動打開。
華為也有配套設施。華為/榮耀也有路由器,有電腦、有手機、有基礎通信設施,也有一套東西在里面了,而且包括監控本來就是華為的強項,他的芯片占了80%-90%的市場。華為的好處就是硬件本來就是他自己的,他有芯片,他有多種技術、人才,包括通訊的那塊東西,他本來就有的,就看他要不要做這個行業了。
阿里和騰訊都在開始做智能音箱,他們的定位可能就是做一個后臺的內容服務整合商,做的是一個平臺;百度想做的是一套系統,給你一個硬件到軟件的整體的方案,包括OS,包括給你開發版,他想做的是給你一個完整的方案,他的目標就是將來成為AI時代的安卓。
BAT這三家公司,定位也不一樣,小米是想做一整套家居生態之類的,各個廠家雖然都在做,想法還是有所不同的。阿里和騰訊他們做內容服務整合商,有著天然優勢,他們包括與之相關聯的公司,包括音樂、新聞、視頻、FM收音機,充分具備這樣的資源。對小公司來說就資源匱乏了。
目前做智能音箱的公司雖然多,但是國內一年的銷量是有限的,即便是叮咚音響,一年的銷量也不足20萬臺。大公司銷量不佳,小公司說做智能音箱基本上是在忽悠。
即使智能音箱行業的號角剛剛吹響,但是由于準入門檻比較高,這個行業基本上沒有小公司生存的余地。沒有什么是小公司能獨立自己做的,語音交互的技術,優質而豐富的內容,硬件原料的供應鏈,這三點都不見得小公司有優勢。
7、如何看待亞馬遜、阿里巴巴、京東等行業巨頭公司做智能音箱呢?小公司還有機會嗎?
現在智能音箱在風口了,大家都去做智能音箱,即便克服困難做成了智能音箱,消費者如何知道并信任你的產品并為此買單?直接跟BAT大公司面對面競爭,大公司的資金、渠道、資源整合能力等,各個角度都秒殺、碾壓小公司,幾乎是沒有任何機會的。
音箱方面,阿里等于是開了個語音的淘寶,小公司去他的語音/智能音箱(平臺)里開個商鋪(應用)就好了,別想也去開個類似的大平臺,你去賣你的東西就好,阿里不會去做很底層的東西,阿里一直都是這樣做的,提供一個大的平臺,大家來平臺里面賣東西就好了,小公司就是賣服務、賣應用,這個市場能做起來能火起來,是因為有很多小公司來平臺賣服務,共建平臺的生態系統。
類似于做手機一樣,做手機的廠商很多,做手機應用的公司更多。亞馬遜的Alex也是,Alex里面有1.5萬+種服務和應用,這1.5萬+種服務和應用,肯定不全部都是亞馬遜自己做的,更多是依靠眾多的第三方公司來提供這些服務,其實這就是眾多小公司的機會。小公司一定要做內容提供商,而不是去做很大的產品。
評論