大腦
微軟全面擁抱人工智能始于兩年前的 Code 大會。而三個月前剛剛成為微軟 CEO 的 Nadella 出現(xiàn)在大會講臺上,討論著微軟的未來。在他講話結(jié)束時,他展示了 Skype 內(nèi)部的一個新特征。兩個微軟職員上臺演講,一個用英語,一個用德語,Skype 同聲傳譯了他們的講話,讓他們打破了語言交流障礙。這是一次令人印象深刻的演示,Nadella 宣布了年末它就能變成產(chǎn)品進(jìn)入市場。
對回到雷德蒙德的 Skype 團(tuán)隊來說,Nadella 的時間表猶如一枚重磅炸彈。「我太驚訝了,」微軟研究的一位副總 Peter Lee 說。「Satya 真的把我們關(guān)進(jìn)了 Skype Translator 這個監(jiān)獄中。 」最初,這個團(tuán)隊有兩個主要的擔(dān)心。一個是微軟研究從來沒有承擔(dān)過將產(chǎn)品推向市場的任務(wù),研究人員擔(dān)心他們少了很多追求科學(xué)突破的自由。
另一個擔(dān)心是,Nadella 做這個演示的時候,Skype Translator 還不是很好。微軟的語言模型建立在大量正式演講上,比如聯(lián)合國的證詞。但是 Skype 需要翻譯的雙向溝通是非常不同的,里面有更多的「口頭語」,像是一個人在一個詞上來回說好幾遍,或者重復(fù)某句話。還有「代碼混合」的問題,比如講話的人在一個句子中使用多種語言,這在英語之外的語言中很常見。還有唱歌,顯然,事實證明人們在不斷地互相唱歌時,電腦很難分析歌聲。
「基本上說,沒什么是完成的,」Lee 說。「我們已經(jīng)做好的只是訓(xùn)練了我們所有的模型」。但是 Lee 的團(tuán)隊重整旗鼓,擁護(hù)納德拉,于當(dāng)年十二月發(fā)布了預(yù)告。明年這個產(chǎn)品就會在市場上廣泛而自由地和大家見面了。Lee 贊賞 Nadella 為「活動家」,他說最終這個項目做得很愉快。「想象一下,當(dāng)你意識工作沒有一點(diǎn)進(jìn)展時,你必須以某種方式讓人們重整士氣和排除恐懼,」Lee 說。「當(dāng)你做到時,你會看到一些讓人驚訝的新東西。」
這感覺并不像在夸張。微軟現(xiàn)在可以在 8 種不同語言之間翻譯對話——總共 56 種不同組合。而且其底層技術(shù)已經(jīng)對翻譯之外的領(lǐng)域產(chǎn)生了影響。你想看到某種令人難以置信地、甚至魔法般有用的 Bot 嗎?微軟正在 beta 測試能記錄商業(yè)會議并進(jìn)行實時轉(zhuǎn)錄的軟件。這個軟件還能,比如說,在將一個兩人訪談的錄音轉(zhuǎn)錄下來的同時清晰地將兩個說話人區(qū)分開——這可能是所有存在過的記者都想使用的技術(shù)。
「我不能向你說明當(dāng)我們首次實施它時,我們發(fā)現(xiàn)我們的員工在使用 Skype Translator 上效果不佳時有多么令人沮喪,」Lee 說,「但現(xiàn)在我們正在攀登這座高峰,我們有了這些語音和翻譯模型,尤其是語音模型——它們好得讓人震驚。」
與此同時,微軟正將人工智能資源大量投入到它的一些壟斷產(chǎn)品中:Windows 和 Office。人工智能的前景之一是它可以預(yù)測你的需求——這是 Google Now 的基礎(chǔ),將交通,天氣和體育比分在你解鎖手機(jī)的時候推送給你。
微軟正在研究如何將這種人工智能納入到桌面。負(fù)責(zé)監(jiān)督 Cortana 開發(fā)的 Marcus Ash 向我展示了一個原型版本的 Windows,該原型版本大量使用了云推理來預(yù)測我可能想了解什么。當(dāng) Ash 打開開始菜單,一系列建議活動 隨著 Cortana 一起出現(xiàn):對你有意義的名字,你最近打開過的文檔,常見法語單詞的釋義(用戶即將去法國旅行)。得到允許后,Cortana 會將你的聯(lián)系方式,網(wǎng)頁搜索歷史和應(yīng)用使用情況納入到它的推薦系統(tǒng)中。
并且它會隨著時間段變化——例如,軟件開發(fā)者可以提醒用戶他們的應(yīng)用在早上或是午餐時間很有用。「得到你的允許后,使用你的對話,語境信息的想法,能使你更加高效,讓你覺得一切都在掌控之中,這太令我們興奮了,」Ash 說。「許多用戶體驗的工作都是圍繞著簡化,減少摩擦,并真正展現(xiàn)人工智能的力量來進(jìn)行的。」
Ash 最喜歡的例子之一叫做「保險」(commitments)。得到你的允許后,Outlook 可以記下事件,比如你的老板叫你在周末前發(fā)給她一些東西——如果你沒有回復(fù)的話就會自動提醒你。「我的生活相當(dāng)復(fù)雜,我想要忘記不需要記得的事情——特別是郵件,」Ash 說。最近他忘了回復(fù)他自己老板的要求,他說,但是 Cortana 及時提醒了他。
當(dāng)我見到 Office 的市場全球副總裁 Kirk Koenigsbauer 后,我了解到更多這樣的事。他向我展示了許多人工智能使 Office 更易于使用的方式。在 2014 年 9 月,微軟推出了 Delve,一種包含在 Office 365 中的生產(chǎn)效率追蹤應(yīng)用。該應(yīng)用分析你花在郵件和會議上的時間,并在你的日歷中高亮出你為了做更多復(fù)雜的有意義的工作而延長出來的時間。它告訴你有多少人讀了你發(fā)的郵件,以及什么時候讀的。它會提醒你聯(lián)系你還沒有發(fā)郵件的同事。它甚至可以顯示你對你同事和你自己的郵件的回復(fù)時間。
一月,Verge 描述了技術(shù)產(chǎn)業(yè)對殺手級 Bot 的搜尋。接下來的幾個月中,大大小小的公司加快了發(fā)展進(jìn)程。Facebook 開放了自己的一個 Bot 研發(fā)平臺,運(yùn)行在它的流行的 Messenger 應(yīng)用上。谷歌宣布 一個在 Allo(一款即將問世的聊天 App)內(nèi)運(yùn)行的新智能助手和亞馬遜 Echo 競爭對手 Home。基于聲音輸入的 Echo 吸引了很多開發(fā)者,而且據(jù)報道已經(jīng)進(jìn)入了 300 萬戶家庭,并已經(jīng)通過它的 API 增加了 1200 項「技能」。
微軟以它在人工智能上的工作為驕傲,它迫切向外界傳遞著這一次想贏的愿望。六月,微軟邀請我來到它的園區(qū)采訪 Nadella 的幾個頂尖得力干將。他們正在將人工智能打入公司業(yè)務(wù)的每個角落。在接下來的兩天里,微軟向我展示了各種各種的應(yīng)用,這些都是在自然語言處理和機(jī)器學(xué)習(xí)上的進(jìn)展。
這家公司像以往一樣談?wù)撘粋€大游戲。發(fā)現(xiàn)技術(shù)的發(fā)展走向一直是微軟的歷史本能。但是這家公司在某一次使用這個本能時失手了。 它先于同行看見了智能手機(jī)和平板電腦的未來前景。但是蘋果和谷歌還是打敗了微軟。圍繞在微軟在人工智能上的問題很簡單:為什么這一次不一樣了?
在建立 Bot 上微軟獲得的成功已經(jīng)比美國其他公司多了。但是你可能不會注意到,因為它的成功是從中國開始的。
2016 年 1 月,微軟眾多人工智能產(chǎn)品之一小冰出現(xiàn)在中國東方衛(wèi)視的早間新聞上,代替了原有的天氣預(yù)報員。小冰這個名字的發(fā)音與微軟必應(yīng)「Bing」發(fā)音相似,必應(yīng)是微軟常年失敗的一個搜索引擎。但是這個小冰更加健談。攝像頭切到一個動畫圓上,它徘徊在一個虛擬平臺前。小冰的臉換成了麥克風(fēng)圖像,用柔軟的女性嗓音播報天氣,甚至回答屏幕邊角上的問題。
如果你想知道為什么微軟如此看好 Bot,小冰就是一個很好的答案。必應(yīng)的搜索工程主管 Derrick Connell說:「我不會夸張地說我們找到了殺手級 Bot——但是我們已經(jīng)發(fā)現(xiàn)了一個以一種新方式滿足大家對聊天的各種期望的 Bot。」
2014 年,微軟在微信上開通小冰公共號;和微軟的虛擬助手小娜(Cortana)一樣,小冰能回答簡單的問題。但是是以聊天的方式。這個 Bot 對情緒很敏感,能記住你們之前的聊天內(nèi)容。如果你正在經(jīng)歷分手,小冰也許能夠查探出來,并會問你還好嗎。
開通三天后,小冰在微信上的聊天累計達(dá) 150 萬次。之后小冰在新浪微博上也開通了賬號,后來也成為了十分流行的名人賬號。今天已有 4000 萬人使用小冰,與每個粉絲的平均聊天多達(dá) 26 輪。
對 Connell 來說,小冰指明了通向下一代搜索的路。傳統(tǒng)上的網(wǎng)絡(luò)查詢會返回到一個有 10 條藍(lán)色超鏈接的頁面;完美的對話 Bot 會直接返回到正確的答案。
當(dāng)然,在中國的成功無法復(fù)制到美國。(微軟第一個英語語言機(jī)器人實驗 Tay 失敗了。)小冰首次亮相的兩年后,還沒有出現(xiàn)一個操英語的小冰,沒人著急這個事情。但是微軟的高管說,小冰背后的基本架構(gòu)對公司來說是個巨大的機(jī)會。
「這就是現(xiàn)代——你不必成為語音和語言理解專家,」Connell 說,「只要使用我們的工具就行了。用我們的工具去建立自己的品牌 Bot,讓它運(yùn)行在任何一個平臺上——可以是 Slack ,也可以是Facebook Messenger 。我們希望它能像 Skype 或 Windows 那樣成功。但選擇權(quán)在你。」
開發(fā)者們恐懼可能會出現(xiàn) Bot 標(biāo)準(zhǔn)之爭,而微軟的外交卻一反常態(tài)。六月微軟在舊金山組織了一場大會,促進(jìn) Bot 開發(fā)商之間的合作。「我們對 Bot 的互相操作真的很感興趣,我們想有一個 Bot 生態(tài)系統(tǒng),」微軟高級工程師,此次大會(Botness)的組織者 Lili Cheng 說,「它更像是,我們能發(fā)現(xiàn)我們能合作解決的問題和挑戰(zhàn)是什么?」
但是微軟希望通過 Botness 大會把自己置于這場 Bot 變革的中心。如果這家公司成功了,它將會在移動時代有一個全新的開始。在該公司的技術(shù)的驅(qū)動下,Bot 能出現(xiàn)在世界上最流行的消息應(yīng)用中,讓微軟在這個新世界里有一個有利可圖的立足點(diǎn)。
如果你的機(jī)構(gòu)像許多大的硅谷公司一樣使用谷歌應(yīng)用,那你就會對 Delve 感到出乎意料。你不需要像一個呆子一樣自己去找這些有用的信息。如果你是一個經(jīng)理,僅瞟一眼的時間,Delve 就可以告訴你在過去一周你在你的每個雇員身上花了多少時間。這種智能不像普通的人工智能一樣性感,不能預(yù)測你所有的需求——但是它今天能被實現(xiàn),它能運(yùn)作,并且相比之下,谷歌應(yīng)用看起來像一灘疏于管照的死水。
搜索令人滿意的機(jī)器人六個月后,我仍然看好這個普通的概念。它們采用的交互方式比 1-800 號碼和被遺忘的小商業(yè)網(wǎng)站要豐富得多。但是我在 Facebook Messenger 和 Telegram 上看到的東西令我失望:有時它們被認(rèn)為是使用互聯(lián)網(wǎng)的最慢方式。看起來大多機(jī)器人的功能僅比 SmarterChild 時代的 AOL 即時通訊機(jī)器人多,并且它們通過古董的按鈕圖形界面輸入。目前圍繞機(jī)器人和人工智能的討論仍然靠商業(yè)利益驅(qū)動,而不是消費(fèi)者對這項服務(wù)的需求。
大體上,各公司至今對這個問題的回答都是他們正在想辦法。「像許多高科技一樣,人們假設(shè)它現(xiàn)在已經(jīng)被實現(xiàn)了,」當(dāng)五月份我問 Facebook 首席技術(shù)執(zhí)行官 Mike Schroepfer 時他回答說。「并且現(xiàn)在有更多技術(shù)驟待發(fā)展,更多的工作需要做。我認(rèn)為隨著時間的推移,這個問題會得到改善。」
但是參觀微軟使我想知道我還沒有以錯誤的方式思考這個主題。基于聊天的接口通常都單調(diào)乏味。但是機(jī)器學(xué)***增強(qiáng)了它們,并且已經(jīng)被應(yīng)用于你一直在用的工具中了。如果微軟可以普及像 Delve 一樣的智能到它的各個服務(wù)中,那么很合理的說,它就可以提供世界上最強(qiáng)大的生產(chǎn)力套裝。即使大量強(qiáng)大的聊天機(jī)器人平臺無法實現(xiàn),這之中也蘊(yùn)藏了巨大價值。在早期階段,機(jī)器人在前臺經(jīng)常說不出話,這很令人沮喪。但是當(dāng)它們在后臺運(yùn)算的時候,有點(diǎn)像在變魔術(shù)。
(本文來自機(jī)器人e資訊微信號。謝謝作者付出!)
評論
查看更多