20世紀90年代,互聯(lián)網(wǎng)還比較封閉,許多用戶依賴美國在線來組織管理網(wǎng)站,他們在一個網(wǎng)站收集信息的同時也要列出其他可能包含有用信息的外部網(wǎng)站。如有體育或金融信息的網(wǎng)站,用戶的瀏覽范圍極大地受到限制,這就好像是“被圍墻包圍的花園”,隨后谷歌公司用一把“大錘”敲開了這些“圍墻”:通過谷歌搜索引擎,人們可以輕松訪問各種網(wǎng)站、自由瀏覽網(wǎng)頁。
但是這幾年,谷歌公司和亞馬遜似乎打算重建“花園圍墻”。
谷歌公司的即時回答功能減少了人們從搜索結(jié)果頁面導航到其他網(wǎng)站的需求;谷歌和亞馬遜分別推出了各自的語音助理,正如數(shù)字營銷機構(gòu)胡歌的創(chuàng)意總監(jiān)索菲·克萊伯所說,“亞歷克莎就是語音版的美國在線。”
谷歌助理和亞歷克莎應用程序都是由谷歌公司和亞馬遜公司自己開發(fā)的,用戶要訪問任何第三方應用程序,必須首先使用谷歌助理或亞歷克莎。例如,如果用戶想使用亞歷克莎的語音調(diào)用功能,可以說:“亞歷克莎,看下《華盛頓郵報》頭條”或“亞歷克莎,玩下《危險邊緣》游戲。”同樣地,用戶也可以說:“打開點評網(wǎng)站Yelp”或“娛樂與體育節(jié)目電視網(wǎng)上有什么新聞?”
如果用戶確切地知道想要的應用程序,這種語音調(diào)用可以很好地工作,否則,這就像在沒有搜索引擎幫助的情況下尋找新網(wǎng)站。因此,當在沒有指定應用程序的情況下提出問題或請求時,亞歷克莎或谷歌助理將可以決定如何實現(xiàn)它。這給了谷歌公司和亞馬遜公司很大的控制權(quán)來決定語音流量的去向。
整個安排看起來很像過去那些“被圍墻包圍的花園”。這并不一定是那些公司(以亞馬遜公司或谷歌公司為代表)為獲得控制權(quán)而有意為之的,盡管它們當然非常樂意從中獲益。語音調(diào)用適合由一個單一的數(shù)字實體來進行,Siri的開發(fā)者們當然也認同這一觀點。
在沒有主導性的語音助理的情況下,每個語音應用程序都是被獨立開發(fā)的,每個語音應用程序都有自己的名字、特定的能力和專門的命令的標識。“我覺得人們記不住1萬個不同的名字和命令集,”切耶爾說,“因此,這個模式不能一直擴大。”
離開蘋果公司后,切耶爾和吉特勞斯開發(fā)了語音助理Viv,他們希望打造一個單一的、全能的語音助理。谷歌公司和亞馬遜公司雖然不希望被人視為“有圍墻的花園的守門人”,但它們一直在往這個方向走。與它們不同的是,Viv團隊已經(jīng)公開宣布它的目標是成為人們需要的最后一臺,也是最好的一臺計算機。
“這是一場競賽,”吉特勞斯說,“一場為用戶設(shè)計單一界面的競賽。”
一.Viv團隊擁有由智能語音領(lǐng)域開拓者所開發(fā)的強大技術(shù)。雖然它的面世較晚,但該團隊已成為這場界面競賽中的一匹“黑馬”。幾年前似乎還是“萬馬奔騰”的競爭場面,但現(xiàn)在勝負已經(jīng)非常明顯了。
讓我們從蘋果公司開始,一個公司接一個公司地分析。Siri是世界上被使用最廣泛的語音助理,它每月處理100億次請求,會說20多種語言,這是個好消息。
壞消息是,蘋果公司沒有按照Siri開發(fā)者的設(shè)想來推進Siri的發(fā)展,這使它的能力沒有預想的那么好。許多科技評論家都把焦點放在Siri身上,不管公平與否,Siri已經(jīng)成為語音人工智能的“出氣筒”。Siri“笨手笨腳”“令人尷尬”(《華盛頓郵報》);“Siri是蘋果公司錯失的最大機會”(《休斯敦紀事報》);“Siri有令人尷尬的不足之處”(《紐約時報》)。技術(shù)分析師杰瑞米·歐陽告訴《今日美國》:“這就好像蘋果公司已經(jīng)完全放棄了Siri。”
雖然這有點言過其實,但蘋果公司被批評并不冤枉,它最初是語音人工智能的領(lǐng)導者,但現(xiàn)在已經(jīng)落到后邊了。直到2018年2月,蘋果公司才發(fā)布了智能音箱HomePod。這已是在谷歌公司推出智能家居設(shè)備谷歌家庭近一年半之后,也是在亞馬遜回聲音箱推出三年半之后的事了。
評論家稱贊了智能音箱HomePod的音質(zhì),但也指出人們需要為它支付更高的費用——發(fā)布時的售價是349美元,而亞馬遜回聲音箱發(fā)布時的價格是99美元。很多人指責Siri在這款設(shè)備上的表現(xiàn)不佳。截至2018年6月,智能音箱HomePod在美國智能音箱市場的份額僅為4%。
蘋果公司在智能語音領(lǐng)域的做法,似乎與它的設(shè)備制造商的背景有關(guān)。因此,蘋果公司將Siri定位為基于設(shè)備的一項重要的特色功能,而不是被銷售的產(chǎn)品。然而,如果像谷歌公司和亞馬遜公司預測的那樣,這種技術(shù)將成為一種環(huán)境性的存在,那么語音助理將至少會給蘋果公司帶來一些風險。
在未來的這種人工智能機器人“生活”在云端、通過廉價商品“發(fā)聲”的世界里,銷售高價電子產(chǎn)品的蘋果公司,與現(xiàn)在相比,可能會變?nèi)鹾芏唷?/p>
二.接下來分析微軟公司,微軟公司擁有世界一流的人工智能部門,員工有8000多人。它擁有強大的必應搜索引擎,可以增強其語音助理回答問題的智能水平。它還有一個成熟的語音助理——微軟小娜。
但微軟公司很難讓它的語音技術(shù)得到用戶的青睞。它在必應和Skype上都有聊天機器人,但這兩個平臺都遠不如谷歌公司或臉書公司的Messenger這種平臺那么受歡迎。用戶可以在手機操作系統(tǒng)Windows Phone上使用微軟小娜,但由于該系統(tǒng)的市場占有率從未突破個位數(shù),裝有該系統(tǒng)的手機已于2017年停售。
在智能音箱方面,配備微軟小娜的哈曼卡頓智能音箱的市場份額非常小,開發(fā)人員不愿意開發(fā)語音應用程序,不愿意眼睜睜地看著它們在一個不受歡迎的平臺上慢慢被大眾遺忘,所以,他們大多都避開了微軟小娜。
盡管面臨這些挑戰(zhàn),但微軟公司并沒有放棄。用戶可以通過Windows操作系統(tǒng)訪問微軟小娜,微軟小娜每月約有1.45億活躍用戶。微軟公司并沒有把微軟小娜作為一款全能型助理來銷售,而是將它定位為一名職場助理,這符合微軟小娜近來的整體戰(zhàn)略:向公司提供軟件和基于云的商業(yè)服務(wù),其中包括人工智能支持的語音技術(shù)。
因此,微軟小娜在智能語音領(lǐng)域不是一個全面的領(lǐng)先者,但微軟公司在公司領(lǐng)域的競爭中還處于穩(wěn)固的有利位置。
臉書公司未來的發(fā)展也是個未知數(shù)。如果它效仿微信的模式——微信實際上是有10億用戶的即時通信平臺——那么臉書公司的狀況會很好,因為他們在Messenger上布置了強大的機器人。但是否會這樣發(fā)展,形勢還不明朗。
除了即時通信平臺,臉書公司還進行了廣泛的語音人工智能研究,但在落地過程中,進展不是很順利。據(jù)報道,臉書公司開發(fā)了一款智能音箱,但在劍橋分析公司的丑聞引發(fā)人們對隱私的擔憂后,該產(chǎn)品的發(fā)布被擱置。所以,臉書公司現(xiàn)在在智能語音領(lǐng)域發(fā)力還不夠。
三.無論以何種標準衡量,谷歌公司和亞馬遜公司都是這場競爭中最受歡迎的贏家。
2018年,只有39款設(shè)備支持與微軟小娜集成,194款設(shè)備支持與Siri集成,而5000多款設(shè)備支持與谷歌助理集成, 2萬款設(shè)備支持與亞歷克莎集成。在全球范圍內(nèi),為谷歌助理開發(fā)的應用小程序有1700多個,為亞歷克莎開發(fā)的應用小程序有5萬個。亞馬遜公司占據(jù)了美國智能音箱市場65%的份額,谷歌公司占據(jù)了20%的份額。
谷歌公司和亞馬遜公司是美國智能語音領(lǐng)域很受歡迎的公司,判斷它們前景的最佳方式是看它們選擇如何從語音業(yè)務(wù)中盈利。當你直接向這兩家公司的高管提出盈利方面的問題時,他們會感到窘迫,會老生常談地說語音技術(shù)還處于早期階段。
他們可能會表示,他們?nèi)栽谂橛脩魧ふ易罴洋w驗,一旦解決了這個問題,回報就會隨之而來。這個回答雖然含糊其詞,但也并非假話。到目前為止,兩家公司都在搶占地盤,在努力吸引盡可能多的用戶,因為它們知道,領(lǐng)先的平臺最終會有多種方式獲得巨額利潤。
不過,即便是現(xiàn)在,兩家公司的高管們肯定也在考慮各種盈利途徑。最簡單的盈利模式是直接從來馬遜回聲音箱和谷歌家庭等設(shè)備的銷售中獲利。但與蘋果公司不同的是,這兩家公司似乎都對這一模式不感興趣,因為它們都在壓低價格以擴大市場份額。
一家獨立研究公司拆解了一臺亞馬遜回聲音箱,并估計其組件的成本約為35美元。算上管理費用和運輸成本,它的實際成本會更高,而亞馬遜網(wǎng)站卻以29.95美元的低價出售它。亞歷克莎開發(fā)和發(fā)布的負責人格雷格·哈特表示:“我們通過讓人們使用我們的服務(wù)來盈利,而不是靠用戶購買設(shè)備來盈利。”
下一個可考慮的盈利模式是做廣告。其他公司可以通過付費的方式在語音助理說話之前或之后植入廣告。但到目前為止,谷歌公司和亞馬遜公司都還不允許這樣操作,但在未來的某個時刻,它們肯定會這么做,問題是哪家公司會第一個開始。
“它們都不想成為第一個這樣做的公司,因為另一個公司會說,‘嘿,我們公司不做廣告,他們公司做廣告。’”語音人工智能領(lǐng)域的企業(yè)家亞當·馬奇克說。
不過,語音廣告似乎不太可能產(chǎn)生與在線廣告和移動廣告相當?shù)氖杖耄驗檫m合播放語音廣告的平臺比較少。如果你使用傳統(tǒng)的谷歌搜索引擎,如搜索廉價航班,那么谷歌公司可以在鏈接列表的頂端投放四個付費搜索廣告,但如果消費者在聽到一個答案之前必須聽四個廣告,他們就不會進行太多的語音搜索。
這對于谷歌公司來說是有問題的。谷歌公司基于廣告的模式——谷歌公司以這種模式創(chuàng)造驚人的巨額收入——是以人們愿意花大量時間來翻閱搜索結(jié)果為前提的。
隨著人們使用手機的時間增加,他們?yōu)g覽搜索結(jié)果頁面所花的時間已經(jīng)減少了,頁面廣告曝光率的下降趨勢伴隨著語音搜索的出現(xiàn)而加劇。“谷歌公司會想,‘哎呀’,”弗雷斯特研究公司的市場分析師詹姆斯·麥奎維說,“當人們開始喜歡語音搜索時,我們的傳統(tǒng)商業(yè)模式就徹底消失了,因為真的不會有太多的廣告模式存在。”
利用語音服務(wù)盈利的最大機會可能出現(xiàn)在電商領(lǐng)域,這顯然對亞馬遜公司有利。在家里的任何地方,用戶都可以通過語音訂購東西——紙巾、薯片、新的烤面包機等。一項市場研究預測,到2022年語音購物的規(guī)模將從目前每年20億美元增加到每年400億美元。另一項研究發(fā)現(xiàn),擁有亞歷克莎設(shè)備的家庭每年花在亞馬遜網(wǎng)站購物的錢比普通家庭多66%。
亞馬遜公司的“糖果罐”變得更甜了。無論何時,只要有人通過語音搜索或訂購產(chǎn)品但沒有指定品牌,亞馬遜網(wǎng)站都會第一個推薦做廣告的品牌。當消費者通過語音購物時,如果他們不喜歡聽到的第一個品牌,就可能會要求提供更多的品牌選擇但也可能不會,這會讓出售商品的公司感到壓力,但增強了亞馬遜公司的影響力。馬奇克說:“突然之間你不再買原來的品牌了,你會買亞馬遜網(wǎng)站告訴你的品牌。”
如果一個公司的產(chǎn)品在搜索結(jié)果中靠前,或最先被提及,那么它的銷售額很可能遠遠高于在搜索結(jié)果中排名靠后的產(chǎn)品。因此,公司會樂于向亞馬遜公司付廣告費。更重要的是,亞馬遜公司有自有品牌,從童裝到狗糧,有上百個品牌,而且品牌數(shù)量還在不斷增加,亞馬遜公司肯定會在語音搜索中優(yōu)先推送這些品牌。
亞馬遜公司尚未公開表示是否會允許其他公司付費以獲得語音搜索排名優(yōu)先權(quán)。它需要以一種足夠透明的方式做到這一點,以免讓客戶覺得自己受騙了。對于付費排名有一個先例:在基于屏幕的亞馬遜網(wǎng)站上,公司付費獲得的產(chǎn)品特色展示信息顯示在其他產(chǎn)品信息之前。
谷歌公司并非沒有意識到電子商務(wù)可能是從語音業(yè)務(wù)中盈利的最佳方式。谷歌公司與沃爾瑪公司、塔吉特公司、好市多公司、科爾士百貨公司、史泰博公司等零售商結(jié)成了聯(lián)盟,這些公司受到共同敵人亞馬遜公司的威脅。
谷歌公司計劃擴大其購物平臺,要成為亞馬遜公司更有力的競爭對手。只要谷歌公司在用戶語音搜索后將其引導到聯(lián)盟公司的網(wǎng)站,谷歌公司就可以通過這一領(lǐng)先的商業(yè)模式收取這些零售商的少量廣告費。
總而言之,在美國智能語音領(lǐng)域?qū)嵙姶蟮墓雀韫菊诳焖俪砷L。
亞歷克莎在市場份額和盈利模式方面都相當有優(yōu)勢,亞馬遜公司在目前的競爭中領(lǐng)先一步。麥奎維說:“地球上每一家想用語音人工智能做點事的公司都在聯(lián)系亞馬遜公司,每個想在語音人工智能方面有所成就的研究生都在聯(lián)系亞馬遜公司……亞馬遜公司在智能語音領(lǐng)域積累了如此多的優(yōu)勢,這真的只剩一個問題,即它會在什么時候選擇大干一場。”
四.時間是2036年4月,地點是Hip 4872——這是位于仙后座星群里的一顆恒星。從地球發(fā)出的無線電信號經(jīng)過近33年的“長途跋涉”后到達這里。無線電信號包括關(guān)于智人的基本信息及關(guān)于人類的數(shù)學、物理、化學和地理的濃縮版知識。里面還有國旗畫面、宇航員莎莉·萊德發(fā)來的信息及大衛(wèi)·鮑伊的歌曲《星俠》的編碼。
上面所有這些都是在一個名為Cosmic Call的外星人探索項目的支持下,通過射電望遠鏡發(fā)射的。如果任何有智慧的生物接收并解讀出這些信號,它們將會收到創(chuàng)建計算機程序的指引,當然,這種可能性是微乎其微的。一旦實現(xiàn),外星人就可以與人類的代表——機器人艾拉交流。
作為勒布納獎得主的聊天機器人,艾拉會聊天和講笑話。它對美食和名人都有自己的看法,它會喋喋不休地談?wù)撛诶咕S加斯和溫哥華等地旅行的事。由于它喜歡瞎猜,總是不按常理出牌,因此它無疑是一個不完美的“地球大使”。但是,它對語言的巧妙運用和顯而易見的交談欲望,使它成為整個Cosmic Call項目中最具人類特色的元素。
當我們在語音技術(shù)的推動下向前邁進時,世界應該擁抱它所創(chuàng)造的充滿希望的人文精神。從魚鉤到火星探測器,我們一直在制造工具。雖然我們制造出了很多對我們有用的東西,但它們在更深層次上都不像我們。即使是類人機器人,它們能做的也只是笨拙地移動,使用語言是人類這個物種真正與眾不同的地方。
語言把我們連接起來,因此,教機器掌握語言不同于通過編程讓它們學會進行衍生品交易、做手術(shù)、進行海底航行或其他事情。我們正在“共享”人類的核心特征。
這份“禮物”不應該隨便“贈送”。語音技術(shù)為世界帶來了新的力量和便利性,但我們不用對其如此敬畏以至于忘記評估其中的許多風險。如果應對得當,語音技術(shù)有可能成為我們發(fā)明的、最有感情的技術(shù)。認為人工智能只能是冷冰冰的算法的觀點是錯誤的,我們可以將最好的價值觀和同理心注入其中。
我們可以讓它變得聰明、令人愉快、精靈古怪并且善解人意。有了語音技術(shù),我們最終可以制造出不那么陌生、更像人類的機器。
-
計算機
+關(guān)注
關(guān)注
19文章
7496瀏覽量
88001 -
人工智能
+關(guān)注
關(guān)注
1791文章
47294瀏覽量
238578 -
智能語音
+關(guān)注
關(guān)注
10文章
784瀏覽量
48776
發(fā)布評論請先 登錄
相關(guān)推薦
評論