PC時(shí)代,瀏覽器成為了互聯(lián)網(wǎng)的一道入口;到了移動(dòng)互聯(lián)網(wǎng)時(shí)代,以App Store為代表各類應(yīng)用商店成為了入口。而到了IOT(物聯(lián)網(wǎng))的時(shí)代,人工智能助手可能會(huì)成為入口。用戶界面的交互方式,最早看到的是Web,然后是App,到了新時(shí)代可能是自然語言。
除了輸入法可以使用語音輸入以外,語音技術(shù)也可以廣泛應(yīng)用在醫(yī)療領(lǐng)域、智能車載、智能可穿戴、智能家居、教育領(lǐng)域等各行各業(yè)。
本期公開課我們請(qǐng)到了訊飛輸入法的創(chuàng)始人翟吉博為大家揭秘人工智能浪潮下人機(jī)交互的未來走向。
“汽車沒有出現(xiàn)之前,人們只想要一匹跑的更快的馬”,這就是創(chuàng)新驅(qū)動(dòng)路徑,也正是因?yàn)檫@種創(chuàng)新精神,人工智能大時(shí)代順勢(shì)而生。人工智能、科學(xué)技術(shù)、人機(jī)交互滲透進(jìn)你我生活的每個(gè)縫隙,我們經(jīng)歷的每種改變、突破甚至革命,都值得借鑒、探索和挖掘。
Part1: 人工智能為何物?
人工智能是能夠和人一樣進(jìn)行感知、認(rèn)知、決策、執(zhí)行的人工程序或系統(tǒng)。
1956年達(dá)特茅斯會(huì)議召開,以麥卡賽、明斯基、羅切斯特和申農(nóng)等為首的一批有遠(yuǎn)見卓識(shí)的年輕科學(xué)家在一起聚會(huì),共同研究和探討用機(jī)器模擬智能的一系列有關(guān)問題,并首次提出了“人工智能”這一術(shù)語,它標(biāo)志著“人工智能”這門新興學(xué)科的正式誕生。
莫爾,麥卡錫,明斯基,塞爾夫里奇,所羅蒙夫(從左至右) 2006 年出席紀(jì)念人工智能學(xué)科50 周年會(huì)議合影
70年代后期,人們發(fā)現(xiàn)過去的理論和模型,只能解決一些非常簡(jiǎn)單的問題,很快人工智能進(jìn)入了第一個(gè)冬天。80年代又興起一撥人工智能的熱潮,包括語音識(shí)別、語音翻譯計(jì)劃,以及日本提出的第五代計(jì)算機(jī)。
元罔達(dá)的《第五代計(jì)算機(jī)》中,第五代計(jì)算機(jī)系統(tǒng)概念圖
到了90年代后期,人們發(fā)現(xiàn)這種東西離實(shí)際生活實(shí)在太遙遠(yuǎn)。IBM在90年代的時(shí)候提出了一款語音聽寫的軟件叫IBM Viavoice,效果其實(shí)不錯(cuò),但是真正用的時(shí)候卻遭冷遇。因此,在2000年左右第二次人工智能的浪潮再次破滅。
人工智能開始進(jìn)入真正爆發(fā)的標(biāo)志,是2006年Geoffrey Hinton提出的深度學(xué)習(xí)技術(shù),以及在圖像、語音識(shí)別以及其他領(lǐng)域內(nèi)取得的一些成功。
Part2: 弱人工智能時(shí)代
人機(jī)交互的發(fā)展
在此次AI公開課上,分享人翟吉博提到了人工智能的三個(gè)階段,他認(rèn)為人工智能可以分為三個(gè)階段,分別是弱人工智能、強(qiáng)人工智能和超人工智能。目前我們常說的人工智能主要是弱人工智能,只擅長(zhǎng)于單個(gè)方面的人工智能。
比如AlphaGo,雖然下圍棋很強(qiáng),但如果讓它下象棋或者國(guó)際象棋,也許就不會(huì)了。還有我們常見的掃地機(jī)器人,它在掃地方面也許具備一定的智能,但它并不能通過學(xué)習(xí),掌握其他的技能,比如它就學(xué)不會(huì)洗碗。弱人工智能和人類智能的區(qū)別在于它并不能通過自適應(yīng)的學(xué)習(xí),掌握它之前并不會(huì)的技能。
人工智能的三個(gè)階段
還有一種是研究人工智能學(xué)者眼中的“強(qiáng)”人工智能,這些人希望能真正破解人類產(chǎn)生智能的奧秘,例如做一個(gè)類似人類大腦的機(jī)器,這樣它就可以通過學(xué)習(xí),掌握不同領(lǐng)域的事情。至于超人工智能,還只存在于科幻電影和小說中,很長(zhǎng)一段時(shí)間內(nèi)還無法實(shí)現(xiàn)。目前,我們還處于弱人工智能時(shí)代。
Part3: 人機(jī)交互的走向
“人機(jī)交互”顧名思義是人與機(jī)器的交互,隨著科技、網(wǎng)絡(luò)、社情、人口、文化等多方面的發(fā)展,人機(jī)交互從最開始的單一刻板到如今越來越“貼心”和人性化,甚至可以想你所想,做你所做。
觸控、語音、體感等交互方式都是自然的人機(jī)交互方式。在未來10年內(nèi),人機(jī)交互將以語音交互為主,觸控、體感交互為輔。
人機(jī)交互的未來:體感交互
萬物互聯(lián)時(shí)代,很多智能設(shè)備也許沒有屏幕,這樣輸入就會(huì)非常麻煩,所以語音輸入成了最自然的解決方案。而且由于許多設(shè)備的不可移動(dòng)性,所以在遠(yuǎn)場(chǎng)情況下,語音交互也是最方便的。除此之外,語音輸入的技術(shù)發(fā)展也早已達(dá)到實(shí)用階段。AI公開課上也提到了,以訊飛輸入法的發(fā)展為例,用戶對(duì)語音輸入習(xí)慣已經(jīng)養(yǎng)成,訊飛輸入法的月活躍用戶達(dá)到1.1億,其中45%的用戶在使用語音輸入,且平均使用次數(shù)高達(dá)15次以上。
在未來,人和機(jī)器交互會(huì)變得和人交流一樣,機(jī)器像一個(gè)老朋友,能夠理解你的任何意圖,并幫你完成。而且機(jī)器還能夠根據(jù)你的習(xí)慣,提供主動(dòng)服務(wù)。
終極的人機(jī)交互可能就是不需要交互,你可以通過腦電波直接控制機(jī)器,就像控制你的身體一樣,機(jī)器成為你的一部分
Part4: 人機(jī)交互的適應(yīng)性
人機(jī)交互應(yīng)該是從人適應(yīng)機(jī)器到機(jī)器適應(yīng)人的一個(gè)過程,例如從鍵盤到鼠標(biāo)到觸摸再到語音就是一個(gè)具體的表現(xiàn)。眾所周知,觸屏交互已經(jīng)成為智能手機(jī)的主要交互方式,或者說是移動(dòng)互聯(lián)網(wǎng)時(shí)代的主流交互方式。可為什么語音、體感現(xiàn)在還沒有大規(guī)模的應(yīng)用?原因主要有兩個(gè):一個(gè)是技術(shù)發(fā)展的程度,一個(gè)是應(yīng)用場(chǎng)景。
語音輸入實(shí)際上直到2010年才開始真正走入實(shí)用,隨著DNN深度神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,目前技術(shù)已經(jīng)成熟,識(shí)別率可以達(dá)到97%以上,現(xiàn)在手機(jī)上已經(jīng)有應(yīng)用場(chǎng)景。但真正大規(guī)模的普及應(yīng)用還在未來。目前手機(jī)上有屏幕,用戶還是會(huì)習(xí)慣按鍵輸入,也許未來等到穿戴設(shè)備出現(xiàn),可能沒有屏幕,用戶必須要用語音輸入。
門捷洛夫曾說:“為了照亮地球深處,在黑暗之中看到蘊(yùn)藏豐富的礦產(chǎn)資源,科學(xué)之燈是必須的”,面對(duì)未知面對(duì)困惑,拋開猶豫不前拋開“沒時(shí)間”的借口,雷厲風(fēng)行的行動(dòng)起來吧,掌握干貨,才能成為時(shí)代弄潮兒!
-
人機(jī)交互
+關(guān)注
關(guān)注
12文章
1209瀏覽量
55432 -
智能家居
+關(guān)注
關(guān)注
1928文章
9578瀏覽量
185519 -
人工智能
+關(guān)注
關(guān)注
1792文章
47409瀏覽量
238923
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論