機(jī)器學(xué)習(xí)和互聯(lián)網(wǎng)意味著海量數(shù)據(jù)和復(fù)雜的聯(lián)系,同時也意味著人類無法理解的運(yùn)行過程——人工智能的“黑箱”是近期學(xué)界熱議的一個話題,當(dāng)我們無法理解算法和它生產(chǎn)出的內(nèi)容,它會怎樣改變?nèi)祟惖乃枷牒驼麄€世界的運(yùn)行?與此同時,完全無法理解這些數(shù)據(jù)意味著什么的人工智能,真的是在分析世界嗎?技術(shù)發(fā)展伴隨而來的是人類對自身的懷疑,也許在未來,關(guān)于世界的知識和對世界的理解之間的鴻溝會日漸加深。原文標(biāo)題為Machine Learning Widens the Gap Between Knowledge and Understanding,摘自David Weinberger的新書《日常混亂:技術(shù)、復(fù)雜性以及我們?nèi)绾卧谝粋€充滿可能性的新世界中發(fā)展》(EVERYDAY CHAOS: Technology, Complexity, and How We’re Thriving in a New World of Possibility)。
Deep Patient的程序不知道被敲頭會讓人類感到頭暈,也不知道糖尿病人不應(yīng)該一次吃5磅的三角巧克力,它甚至不知道肱骨和腕骨相連。它只知道研究人員在2015年給它提供的東西:70萬名患者的醫(yī)療記錄。這是一堆完全沒有可理解框架的混亂數(shù)據(jù)。
然而,在分析了這些數(shù)據(jù)之間的關(guān)系之后,Deep Patient不僅能夠診斷出個別患者罹患特定疾病的可能性(在某些情況下,它甚至比人類醫(yī)生更準(zhǔn)確),包括一些迄今為止完全無法預(yù)測的疾病。
如果你問你的醫(yī)生,為什么Deep Patient認(rèn)為現(xiàn)在就開始服用他汀類藥物或做個預(yù)防性手術(shù)可能比較明智,你的醫(yī)生可能沒法告訴你原因,但這不是因?yàn)樗?她不夠聰明,也不是因?yàn)樗?她醫(yī)術(shù)不高。Deep Patient是一種深度學(xué)習(xí)的人工智能(它本身就是機(jī)器學(xué)習(xí)的一種),盡管它不知道這些數(shù)據(jù)代表什么,但它可以發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)系。
基于此,它組裝了一個信息點(diǎn)網(wǎng)絡(luò)——每個信息點(diǎn)都有權(quán)重,能夠決定它所連接的點(diǎn)有多大可能會“觸發(fā)”(該觸發(fā)會影響它們所連接的點(diǎn),就像觸發(fā)大腦中的神經(jīng)元一樣)。舉個例子,Deep Patient認(rèn)為,某個病人有72%的幾率患上精神分裂癥,想要理解它為什么會作出這樣的診斷,醫(yī)生就必須進(jìn)入這數(shù)百萬個信息點(diǎn)以及它們之間的聯(lián)系和權(quán)重網(wǎng)絡(luò)之中——這實(shí)在是太多了,他們之間的關(guān)系也太復(fù)雜了。
當(dāng)然,作為一名患者,你可以選擇拒絕接受Deep Patient的概率性結(jié)論,但這樣做是有風(fēng)險(xiǎn)的。現(xiàn)實(shí)情況是,在某些情況下,Deep Patient比人類醫(yī)生的預(yù)測準(zhǔn)確得多,但是它完全無法解釋它的預(yù)測,這是一種人工智能“黑箱”。
這也是未來,遠(yuǎn)超醫(yī)學(xué)這一個領(lǐng)域。
你手機(jī)的導(dǎo)航系統(tǒng)、輸入預(yù)測、語言翻譯、音樂推薦等等功能都依賴于機(jī)器學(xué)習(xí)。
隨著人工智能變得越來越先進(jìn),它會越來越神秘。谷歌的AlphaGo對圍棋一無所知,“只是”從13萬場有記錄棋局中分析出6000萬步棋,但它依然擊敗了全世界排名最高的人類棋手。如果你研究AlphaGo的原理,想弄明白它為什么會下這一步棋而不是那一步棋,你可能只會看到數(shù)據(jù)之間一組復(fù)雜得難以形容的加權(quán)關(guān)系。AlphaGo可能無法用人類能夠理解的方式告訴你,為什么它會下這樣一步棋。
然而,AlphaGo的一步棋讓一些評論者啞口無言,圍棋大師樊麾說:“這不是人類的一步棋。我從來沒見過人類這么走。”然后他輕輕地感嘆:“太美了,太美了。”
深度學(xué)習(xí)的算法之所以有效,是因?yàn)樗鼈儽热魏稳祟惗寄芨玫夭蹲降接钪娴膹?fù)雜性、流動性,甚至是宇宙之美——每件事都在影響著其他事物,世界是普遍聯(lián)系的。
諸如機(jī)器學(xué)習(xí)這樣的工具和策略正越來越多地讓我們直面我們?nèi)粘I钪须y以理解的錯綜復(fù)雜。但這種好處是有代價的:我們需要放棄我們對于理解世界和世界上發(fā)生的事情的堅(jiān)持。
膚淺理解
我們?nèi)祟愰L期以來都有這樣的印象:如果我們能夠理解事物發(fā)生背后那不可改變的規(guī)律,我們就能夠完美地預(yù)測、計(jì)劃和管理未來。例如,如果我們知道天氣變化的原理,天氣預(yù)報(bào)就能告訴我們上班時是否要帶把傘;如果我們知道是什么讓人們在Facebook信息流中點(diǎn)擊這個帖子而不是另一個帖子,我們就能策劃出完美的廣告方案;如果我們知道流行病背后的發(fā)生機(jī)制,我們就能阻止它的傳播……通過發(fā)現(xiàn)支配我們世界的規(guī)律和模式,我們了解了事情是如何發(fā)生的,我們對理解世界感到義不容辭。
考慮到我們的知識總是不完善的,這個假設(shè)建立在一個更深奧的假設(shè)之上:可知論。似乎我們與宇宙之間有一個不成文的約定,那就是如果我們足夠努力、足夠清晰地思考,宇宙就會交出它的秘密,因?yàn)橛钪媸强芍模辽僭谀撤N程度上是順從我們意志的。
但是現(xiàn)在,我們的新工具(特別是機(jī)器學(xué)習(xí)和互聯(lián)網(wǎng))讓我們認(rèn)識到我們周圍數(shù)據(jù)和信息的廣泛性,我們開始接受世界的復(fù)雜性遠(yuǎn)遠(yuǎn)超過我們以往用來解釋它的法則和模型。我們創(chuàng)造的這些新的、容量大的機(jī)器比我們更接近于“理解世界”的層次。
而它們,作為機(jī)器,什么都不理解。
David Weinberger的《日常混亂:技術(shù)、復(fù)雜性以及我們?nèi)绾卧谝粋€充滿可能性的新世界中發(fā)展》(EVERYDAY CHAOS: Technology, Complexity, and How We’re Thriving in a New World of Possibility)封面
這反過來又挑戰(zhàn)了我們在更深層次上持有的另一種假設(shè):宇宙可知,是因?yàn)椋ㄎ覀兗僭O(shè))我們?nèi)祟愖銐颡?dú)特,能夠理解宇宙的運(yùn)行。至少從古希伯來人開始,我們就認(rèn)為自己是上帝創(chuàng)造的獨(dú)一無二的生物,有能力接受上帝對真理的啟示。自古希臘以來,我們就把自己定義為理性的生物,能夠看到世界表面混亂之下的邏輯和秩序。我們最基本的戰(zhàn)略依賴于我們和世界之間的這種特殊關(guān)系。
放棄人類這個物種的傳統(tǒng)自我認(rèn)知是無比痛苦的。感覺被信息過載壓碎,緊張地等待接下來的發(fā)生在商業(yè)、政府、文化中的混亂……這些情緒只是深層問題的局部痛感:我們并不像我們認(rèn)為的那樣能很好地適應(yīng)我們的宇宙。我們的大腦無法像人工智能那樣準(zhǔn)確、快速地分析或預(yù)測事件。進(jìn)化給了我們適應(yīng)生存的思維,但這種思維只是順便發(fā)現(xiàn)了真相。我們的物種與眾不同,我們有情感、直覺、創(chuàng)造力,這種主張開始變得過于一廂情愿,甚至有點(diǎn)絕望。
這種幻滅是我們應(yīng)該接受的——不僅僅是因?yàn)椴还芪覀兘邮芘c否,它都在發(fā)生。我們理解和管理未來的能力正開始經(jīng)歷偉大飛躍:我們開始制定相關(guān)策略,開始考慮世界的復(fù)雜性,而不是總要把世界縮小到一個我們可以預(yù)測、控制、感到舒適的大小。
我們正在經(jīng)歷這一飛躍,因?yàn)樗呀?jīng)使我們能夠更高效、更有成效地與更多人、更多想法接觸,更有創(chuàng)意,更快樂。它已經(jīng)使我們在商業(yè)和個人生活中的許多最基本的想法和最習(xí)慣的做法重新語境化。它正在我們文化的每一個角落產(chǎn)生回響。
這些跡象在我們周圍隨處可見,但在許多情況下,它們隱藏在看似正常且顯而易見的實(shí)踐和想法中。例如,在機(jī)器學(xué)習(xí)出現(xiàn)之前,互聯(lián)網(wǎng)已經(jīng)讓我們習(xí)慣了這些變化。
A/B測試之謎
當(dāng)巴拉克·奧巴馬(Barack Obama)第一次參加總統(tǒng)競選時,他在自己的網(wǎng)站上試用了兩個版本的注冊按鈕,結(jié)果發(fā)現(xiàn),與“現(xiàn)在加入我們(Join Us Now)”或“現(xiàn)在注冊(Sign Up Now)”此類按鈕名稱相比,標(biāo)有“了解更多(Learn more)”的按鈕吸引了更多的點(diǎn)擊。
另一項(xiàng)測試顯示,奧巴馬一家的一張黑白照片獲得的點(diǎn)擊量,出人意料地遠(yuǎn)超此前使用的彩色照片。
然后,他們在同一頁面放入“了解更多”按鈕和黑白照片,結(jié)果是:注冊人數(shù)增加了40%。
總的來說,在競選中,1300萬郵件列表名單中將近三分之一的名單、大約7500萬美元的捐款都是由于這樣的A/B測試提高了網(wǎng)站的表現(xiàn)。A/B測試即網(wǎng)站把一個廣告或內(nèi)容的不同版本分發(fā)給一定量的幾組隨機(jī)用戶,然后用測試結(jié)果來決定用戶最終將會看到哪個版本的內(nèi)容。
更令人驚訝的是,奧巴馬團(tuán)隊(duì)發(fā)現(xiàn),與純文本信息相比,奧巴馬在集會上煽動群眾的視頻點(diǎn)擊率要低得多。考慮到奧巴馬作為演說家的才能著實(shí)不一般,這種差異該怎么解釋啊?團(tuán)隊(duì)并不知道,他們也并不需要知道。數(shù)據(jù)告訴他們應(yīng)該在競選網(wǎng)站上發(fā)布哪些內(nèi)容,即使沒有告訴他們原因,他們也照做不誤。結(jié)果很好:更多的點(diǎn)擊、更多的捐款、可能更多的選票。
A/B測試已經(jīng)成為一種常見的實(shí)踐:谷歌的搜索結(jié)果是A/B測試的結(jié)果;Netflix上電影的布局來自A/B測試;甚至《紐約時報(bào)》使用的一些標(biāo)題也是A/B測試的結(jié)果……2014年至2016年,必應(yīng)的軟件工程師進(jìn)行了2.12萬次A/B測試,其中三分之一的測試給服務(wù)帶來變化。
A/B測試有效果,甚至不需要懂它為什么有效。為什么在亞馬遜上,如果笑容燦爛的女性圖片在網(wǎng)頁左邊的話,該廣告會提高銷量呢?我們可以制造一個理論,但我們?nèi)匀唤ㄗh針對下一個廣告的位置進(jìn)行A/B測試。奧巴馬的黑白照片吸引了更多點(diǎn)擊,并不意味著他的對手約翰·麥凱恩(John McCain)也應(yīng)該棄用他的彩色照片。亞馬遜為戶外燒烤架進(jìn)行推廣活動時,使用藍(lán)色背景而不是綠色背景,這讓我們沒有理由認(rèn)為它有可能會適用于室內(nèi)燒烤。
事實(shí)上,影響人們偏好的因素完全有可能是微觀的、短暫的。也許50歲以上的男性更喜歡模特在左邊的廣告,但前提是廣告的標(biāo)題很有趣,而來自底特律的女性在兩天陰沉沉的天氣之后終于呼吸到燦爛的陽光,她們這會兒更喜歡模特在右邊的廣告。也許有些人剛看完對比度強(qiáng)烈的視頻,他們現(xiàn)在更喜歡黑白照片,而其他人則可能因?yàn)檠蠡?duì)剛輸?shù)粢粓霰荣惗矚g彩色的版本。也許會出現(xiàn)一些能夠歸納的理論,也許不能,我們不知道。原因可能和世界本身一樣千差萬別。
我們從小就相信,世界的真相和現(xiàn)實(shí)是由一些不可改變的規(guī)律來表達(dá)的。學(xué)習(xí)規(guī)律,你就能做出預(yù)測。發(fā)現(xiàn)新的規(guī)律,你就能預(yù)測更多的事情。如果有人想知道你是如何做出預(yù)測的,你可以向他們展示你所掌握的規(guī)律和數(shù)據(jù)。但是在A/B測試中,我們通常沒有心理框架來解釋為什么一個版本的廣告比另一個版本更好。
想想扔沙灘球。你認(rèn)為球?qū)⑾蚰闳拥姆较虺蕭佄锞€運(yùn)動,因?yàn)槲覀兊男睦砟P汀覀兯伎际挛锵嗷プ饔玫囊惶滓?guī)則——考慮了重力和動能。如果球向另一個方向運(yùn)動了,你也不會認(rèn)為模型錯了,相反,你會認(rèn)為你沒有考慮到一些因素:也許你手滑了一下。
這正是我們在A/B測試中不需要做的事情。我們不需要知道為什么一張黑白照片和一個“了解更多”按鈕會增加競選捐款。如果我們發(fā)現(xiàn)民主黨人的競選廣告經(jīng)驗(yàn)對他/她的共和黨對手不起作用——他們很可能確實(shí)不會起作用——那也沒關(guān)系,因?yàn)樵僮鲆淮蜛/B測試就好,A/B很便宜。
A/B測試只是一個例子,它在不知不覺中向我們表明:原理、規(guī)律和歸納并不像我們想象的那么重要。也許,只是也許,當(dāng)我們無法處理現(xiàn)實(shí)的細(xì)枝末節(jié)時,我們才會用到原理。
復(fù)雜性的有效性
我們剛剛看了兩個基于計(jì)算機(jī)的技術(shù)案例,它們完全不同:一個是編程技術(shù)(機(jī)器學(xué)習(xí)),另一個是全球性的空間(互聯(lián)網(wǎng)),我們在互聯(lián)網(wǎng)遇到更多的人,欣賞他們對意義和創(chuàng)造力的表達(dá)。當(dāng)然,這些技術(shù)通常是相互交織的:機(jī)器學(xué)習(xí)需要使用互聯(lián)網(wǎng)大規(guī)模收集信息,越來越多基于互聯(lián)網(wǎng)的服務(wù)同時使用、喂養(yǎng)機(jī)器學(xué)習(xí)。
這兩種技術(shù)至少有三個共同點(diǎn):巨大性、聯(lián)系性、復(fù)雜性,這三個共同點(diǎn)一直在教導(dǎo)我們世界是如何運(yùn)行的。
巨大性——即它們的規(guī)模——與我們參觀世界上最大的麻繩球故鄉(xiāng)或想象把世界上所有的土豆都堆在一起時完全不同。巨大性的重要性在于機(jī)器學(xué)習(xí)和互聯(lián)網(wǎng)能達(dá)到的細(xì)節(jié)水平。這兩種技術(shù)都依賴于細(xì)節(jié)和獨(dú)特性,而不是通過歸納或壓制“邊緣”信息和思想來擺脫細(xì)節(jié)。
聯(lián)系性意味著,這兩種技術(shù)所包含的各個部分可以相互影響,而無需顧慮物理距離造成的障礙。聯(lián)系性對這兩種技術(shù)至關(guān)重要:只能連接兩個部分、一次只能連接一對的網(wǎng)絡(luò)可不能叫做互聯(lián)網(wǎng),只能叫做舊的電話系統(tǒng)。我們新技術(shù)的聯(lián)系性是規(guī)模巨大的、多途徑的、無距離的,也是必不可少的。
機(jī)器學(xué)習(xí)和互聯(lián)網(wǎng)的巨大性和聯(lián)系性導(dǎo)致了它們的復(fù)雜性。規(guī)模巨大的碎片之間的聯(lián)系有時會導(dǎo)致一連串的事件,而這些事件的結(jié)局可能與它們開始的地方相去甚遠(yuǎn)。微小的差異可能導(dǎo)致這些系統(tǒng)出現(xiàn)意想不到的巨大轉(zhuǎn)折。
我們不是因?yàn)檫@些技術(shù)的巨大性、聯(lián)系性、復(fù)雜性而使用這些技術(shù),我們使用它們是因?yàn)樗鼈冇行АN覀兝眠@些技術(shù)的成功——而不是技術(shù)本身——向我們展示了世界比我們想象的更加復(fù)雜和混亂,這反過來鼓勵我們探索新的方法和策略,挑戰(zhàn)我們對理解和解釋的本質(zhì)和重要性的假設(shè),并最終引導(dǎo)我們對世界有一個新的認(rèn)識。
-
人工智能
+關(guān)注
關(guān)注
1794文章
47622瀏覽量
239586 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8438瀏覽量
132912
原文標(biāo)題:機(jī)器學(xué)習(xí)加深了“知識”和“理解”之間的鴻溝
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論