如今,人工智能已經(jīng)深入生活的方方面面,我們的社會(huì)更加依賴(lài)于算法做決策,而不是人。這些系統(tǒng)已經(jīng)在銀行、電子商務(wù)、醫(yī)療保健以及治安等領(lǐng)域顯現(xiàn)出了強(qiáng)大的潛力。
然而,人們?cè)絹?lái)越擔(dān)心算法的控制權(quán)過(guò)多,尤其是當(dāng)人們將決定權(quán)交給機(jī)器的時(shí)候,例如自動(dòng)駕駛汽車(chē)或法庭判決等場(chǎng)合。如果因此而阻礙人工智能的使用,那么社會(huì)和經(jīng)濟(jì)就有可能無(wú)法享受人工智能帶來(lái)的各種潛在優(yōu)勢(shì)。
Hannah Fry是倫敦大學(xué)學(xué)院高級(jí)空間分析中心的數(shù)學(xué)家,多年來(lái)她一直在研究這些系統(tǒng)。不過(guò)人們對(duì)她的更多了解來(lái)自BBC的公開(kāi)講座和紀(jì)錄片,她是一名數(shù)學(xué)和科學(xué)領(lǐng)域的知名人士。
在她最新的著作《Hello World》一書(shū)中,F(xiàn)ry女士揭開(kāi)了這種技術(shù)的神秘面紗,她通過(guò)回顧歷史向我們解釋了如何采用數(shù)據(jù)驅(qū)動(dòng)的決策,并提供了清晰的利弊分析。使用人工智能的好處在于,AI可以更快更準(zhǔn)確地執(zhí)行任務(wù),而缺點(diǎn)是如果數(shù)據(jù)有偏差,那么輸出可能有偏差。
The Economist針對(duì)社會(huì)應(yīng)當(dāng)如何利用這項(xiàng)技術(shù),對(duì)Fry女士進(jìn)行了采訪(fǎng)。在本文中,首先我們會(huì)詳細(xì)報(bào)道此次采訪(fǎng)的內(nèi)容,而后面的部分是《Hello World》一書(shū)中有關(guān)刑事司法系統(tǒng)和“隨機(jī)森林”算法的節(jié)選。
自動(dòng)化會(huì)失誤,人類(lèi)才是考慮的核心
The Economist:所有的數(shù)據(jù)都有偏差,那么我們是否應(yīng)該推遲算法系統(tǒng)的引入,直到我們確信我們已經(jīng)發(fā)現(xiàn)并解決了算法系統(tǒng)中的關(guān)鍵性問(wèn)題,還是說(shuō)我們應(yīng)該降低標(biāo)準(zhǔn):“盡最大努力”來(lái)發(fā)現(xiàn)和修正偏差,同時(shí)在發(fā)現(xiàn)漏洞的時(shí)候,可以隨時(shí)發(fā)布代碼和補(bǔ)???
Hannah Fry:大家在這個(gè)問(wèn)題上很容易產(chǎn)生一種誤解。當(dāng)看到算法會(huì)引發(fā)別的問(wèn)題時(shí),我們就想著完全拋棄這些算法,并認(rèn)為我們應(yīng)該堅(jiān)持依賴(lài)人類(lèi)的決策來(lái)解決問(wèn)題,直到更好的算法出現(xiàn)。然而,實(shí)際上人類(lèi)也存在偏見(jiàn),而且還會(huì)受到各種問(wèn)題的迷惑。
其實(shí),這完全取決于你需要的精準(zhǔn)度。例如,你可以在足球比賽中引入“視頻助理裁判”,但你不能不負(fù)責(zé)任地以相同的方式在醫(yī)療保健領(lǐng)域引入一個(gè)有問(wèn)題的系統(tǒng)??偟膩?lái)說(shuō),總體目標(biāo)必須是建立最公平、最統(tǒng)一的系統(tǒng)。這意味你必須承認(rèn)完美是不可能的,而且權(quán)衡利弊也在所難免。然而,同時(shí)也意味著我們應(yīng)該設(shè)法鼓勵(lì)利用算法做決策,盡管它們也難免會(huì)出錯(cuò)。
The Economist:刑事司法系統(tǒng)有時(shí)會(huì)吹噓“與其讓一個(gè)無(wú)辜的人入獄,不如釋放一個(gè)罪犯”的價(jià)值觀(guān)。我們是否應(yīng)該拒絕在法庭上采用算法來(lái)做出嚴(yán)肅的決定(即宣判),因?yàn)槲覀冇肋h(yuǎn)也不確定這是否是盲目的正義?
Hannah Fry:每個(gè)刑事司法系統(tǒng)都必須在保護(hù)無(wú)辜的人被誣告和保護(hù)犯罪受害者之間找到某種平衡。實(shí)現(xiàn)這種平衡并非易事,而且司法系統(tǒng)也并非完美——而且也從未嘗試做到完美。這就是為什么“合理地懷疑”和“充分的理由”之類(lèi)的詞匯是基本的法律用語(yǔ):這類(lèi)的系統(tǒng)必須接受絕對(duì)的確定性是無(wú)法實(shí)現(xiàn)的。
然而,即使在這些約束之下,法官的決定里面仍然可能有前后矛盾和運(yùn)氣的成分。人們無(wú)法保證做出公平和一致的決策。而法官與我們其他人一樣,有時(shí)也無(wú)法放下潛在的偏見(jiàn)。
如果你謹(jǐn)慎地對(duì)待這些問(wèn)題,那么我認(rèn)為我們有可能通過(guò)使用算法來(lái)支持法官的決定,從而將這類(lèi)問(wèn)題降到最少。你必須確保以一種更公平地方式使用系統(tǒng),還要確保不會(huì)意外地加劇已經(jīng)存在的偏差。
The Economist:你是否擔(dān)心最終人類(lèi)會(huì)把生活中重要的權(quán)利交給機(jī)器,就像我們已經(jīng)由于電子地圖的出現(xiàn)而喪失了方向感?
Hannah Fry:我認(rèn)為,隨著自動(dòng)化的發(fā)展,我們的確會(huì)失去一些技能。例如,現(xiàn)在我連自己的電話(huà)號(hào)碼都記不住,更不用說(shuō)我以前知道的那一長(zhǎng)串電話(huà)號(hào)碼了,而且我的書(shū)法也一落千丈。但我并不覺(jué)得自己非常擔(dān)心這方面的問(wèn)題。
歷史上我們也曾經(jīng)歷過(guò)擔(dān)心技能退化的問(wèn)題。飛行員就曾有過(guò)這樣的經(jīng)歷:自動(dòng)駕駛越好,初級(jí)飛行員手動(dòng)控制飛機(jī)的技術(shù)就越差。以前在手術(shù)室里,初級(jí)外科醫(yī)生可以通過(guò)在開(kāi)放式手術(shù)中協(xié)助咨詢(xún)顧問(wèn)的方式(他們的手會(huì)接觸患者,觸摸和感覺(jué)身體)進(jìn)行訓(xùn)練,而如今他們可以觀(guān)看咨詢(xún)顧問(wèn)坐在控制臺(tái)操作的微創(chuàng)手術(shù),而且還有內(nèi)部的攝像機(jī)在屏幕上放映。
如果有一天我們真的進(jìn)入無(wú)人駕駛汽車(chē)普及的階段,而我們卻不認(rèn)真考慮如何保持我們的駕駛技術(shù)的話(huà),那么人們?cè)跊](méi)有輔助的情況下的駕駛能力會(huì)下降,我們?nèi)匀幌M覀兡軌蛉藶榻槿耄⒃诰o急情況下采取行動(dòng)控制汽車(chē)。
為了避免這個(gè)問(wèn)題,你可以采取一系列措施,例如時(shí)不時(shí)地故意關(guān)閉機(jī)器。但我認(rèn)為,我們應(yīng)該承認(rèn)自動(dòng)化有時(shí)也會(huì)出現(xiàn)失誤,而且我們應(yīng)該確保人類(lèi)(以及他們的需求和失誤)始終應(yīng)該是我們考慮的核心。
The Economist:當(dāng)算法進(jìn)入醫(yī)學(xué)、法律和其他領(lǐng)域時(shí),算法得出的決定只能作為“建議”,人類(lèi)在這個(gè)過(guò)程中仍然有最終的決定權(quán)。然而,根據(jù)行為心理學(xué)的大多數(shù)研究表明這只是一種假象:算法對(duì)人類(lèi)有著非凡的影響。我們?cè)鯓硬拍軓默F(xiàn)實(shí)的角度克服這個(gè)問(wèn)題呢?
Hannah Fry:通常人們都很懶惰。我們喜歡采用簡(jiǎn)單的方法,我們喜歡推卸責(zé)任,我們喜歡走捷徑,如此一來(lái)我們就不必思考了。
如果你設(shè)計(jì)的算法可以告訴你答案,而你卻希望人們會(huì)再三檢查這個(gè)答案,提出質(zhì)疑,并且還知道在適當(dāng)?shù)臅r(shí)候提出別的答案,那么實(shí)際上你在自掘墳?zāi)?。人?lèi)本身就不擅長(zhǎng)做這種事情。
但是,如果你設(shè)計(jì)的算法能夠坦然地承認(rèn)它們的不確定性——公開(kāi)和坦誠(chéng)地向你的用戶(hù)說(shuō)明它們做決定的過(guò)程,以及在這個(gè)過(guò)程中經(jīng)歷的所有混亂和模糊,那么我們就知道什么時(shí)候我們應(yīng)該相信自己的直覺(jué)。
我認(rèn)為這是IBM的沃森最好的一個(gè)功能,它參加了美國(guó)的智力競(jìng)賽節(jié)目《危險(xiǎn)邊緣》(Jeopardy)!而且還獲勝了。雖然該節(jié)目要求選擇一個(gè)答案,但該算法在此過(guò)程中還考慮了替代方案,并表明了每種方案的正確概率。
這也是最新的衛(wèi)星導(dǎo)航的好處:它們并不會(huì)為你決定路線(xiàn),而是會(huì)給你三個(gè)選擇,并告訴你利弊。你可以通過(guò)這些信息做出明智的決定,而不是盲目地交出控制權(quán)。
The Economist:有什么事情是人類(lèi)能做,機(jī)器卻做不了的嗎?為了幫助人類(lèi)在算法時(shí)代依然蓬勃發(fā)展,我們的社會(huì)需要做出哪些改變?
Hannah Fry:人類(lèi)可以比機(jī)器更好地理解背景和細(xì)微的差別。我們的適應(yīng)性更強(qiáng)。如果你把我們帶到一個(gè)全新的環(huán)境下,我們知道如何表現(xiàn),這是最優(yōu)秀的人工智能也望塵莫及的。
除此之外,這是一個(gè)人類(lèi)的世界,而不是算法的世界。因此,人類(lèi)始終應(yīng)該居于新技術(shù)思想的前沿和中心。
這話(huà)看似顯而易見(jiàn),然而實(shí)際情況卻并非如此。最近的趨勢(shì)有意將新算法迅速推向世界,并通過(guò)現(xiàn)實(shí)世界中的真實(shí)用戶(hù)進(jìn)行現(xiàn)場(chǎng)實(shí)驗(yàn),而不是停下來(lái)思考這些算法是否弊大于利,或發(fā)現(xiàn)它們有問(wèn)題后推遲采用這些算法。(我說(shuō)的就是你:社交媒體。)
我認(rèn)為社會(huì)需要堅(jiān)定立場(chǎng):有些新技術(shù)(例如新藥)需要謹(jǐn)慎使用并提前考慮最壞的情況。我認(rèn)為我們構(gòu)建的算法應(yīng)該誠(chéng)實(shí)地表明它們的弱點(diǎn),并坦誠(chéng)地說(shuō)明完美往往都是不可能的。但最重要的是,我認(rèn)為我們構(gòu)建的算法應(yīng)該接受人類(lèi)的失誤,而不是視而不見(jiàn)。
面向司法的數(shù)學(xué)式
它們無(wú)法衡量辯護(hù)方和起訴方的辯論,分析證據(jù),或決定被告是否真的有悔意。所以我們不能指望算法在近期內(nèi)取代法官。然而,算法也有意想不到的用處,比如使用個(gè)人的數(shù)據(jù)來(lái)計(jì)算他們今后再次犯罪的概率。而且,由于許多法官也會(huì)根據(jù)罪犯是否會(huì)再次犯罪的概率來(lái)判決,因此這種算法非常實(shí)用。
司法系統(tǒng)使用數(shù)據(jù)和算法已有將近一個(gè)世紀(jì)的歷史了,第一次的使用可以追溯到20世紀(jì)20年代美國(guó)的一宗案子。當(dāng)時(shí),根據(jù)美國(guó)的制度,被定罪的罪犯將被判處最高刑期,然后在一段時(shí)間過(guò)后才有資格獲得假釋。數(shù)萬(wàn)名囚犯依據(jù)此律獲準(zhǔn)提前釋放。有些人重獲自由,而有些人則沒(méi)有。
但總的來(lái)說(shuō),他們的案例為自然實(shí)驗(yàn)提供了完美的環(huán)境:你能否預(yù)測(cè)罪犯會(huì)違反他們的假釋條款嗎?
芝加哥大學(xué)的加拿大社會(huì)學(xué)家Ernest W. Burgess對(duì)預(yù)測(cè)充滿(mǎn)了興趣。Burgess是量化社會(huì)現(xiàn)象的重要支持者。在他的職業(yè)生涯中,他一直在嘗試預(yù)測(cè)退休和婚姻成功產(chǎn)生的影響。1928年,他成功地建立了第一個(gè)預(yù)測(cè)工具,這個(gè)工具可以根據(jù)測(cè)量的結(jié)果(而不是直覺(jué))預(yù)測(cè)犯人再次犯罪的概率。
Burgess利用美國(guó)伊利諾伊州三所監(jiān)獄中三千名囚犯的各種數(shù)據(jù),找出了他認(rèn)為對(duì)于決定某人是否會(huì)違反他們的假釋條款“可能有著重大影響”的21個(gè)因素。其中包括犯罪的類(lèi)型、在監(jiān)獄中服刑的月份和囚犯的社會(huì)類(lèi)型——他根據(jù)二十世紀(jì)早期社會(huì)科學(xué)家所關(guān)注的話(huà)題對(duì)罪犯進(jìn)行了分類(lèi):流浪漢、酒鬼、窩囊廢、鄉(xiāng)巴佬和移民。
Burgess從這21個(gè)因素出發(fā)為每個(gè)犯人打分(0或1)。獲得高分(16-21分)的人再次犯罪的概率最低,而那些得分很低(4分以下)的人則極有可能違反他們的假釋條款。
等到最終所有囚犯都被釋放后,有些人違反了假釋條款,于是Burgess抓緊這次機(jī)會(huì)檢驗(yàn)他的預(yù)測(cè)結(jié)果。通過(guò)一個(gè)基本的分析,他發(fā)現(xiàn)自己預(yù)測(cè)非常準(zhǔn)確。在他的低風(fēng)險(xiǎn)人群中有98%通過(guò)了他們的假釋?zhuān)J(rèn)定的高危人群中有三分之二沒(méi)有通過(guò)假釋。事實(shí)證明,即使是粗略的統(tǒng)計(jì)模型也可以比專(zhuān)家做出更好的預(yù)測(cè)。
但Burgess的工作也受到了批評(píng)。
持懷疑態(tài)度的旁觀(guān)者質(zhì)疑,從一個(gè)地方得出的預(yù)測(cè)假釋成功的因素中有多少能夠適用于其他地方。(他們其中的一個(gè)觀(guān)點(diǎn)是:在預(yù)測(cè)現(xiàn)代化大城市內(nèi)犯罪分子再次犯罪的概率時(shí),如何確保“鄉(xiāng)巴佬”會(huì)有很大的幫助。)
其他學(xué)者還指出Burgess只利用了現(xiàn)有的信息,而沒(méi)有調(diào)查其中的相關(guān)性。關(guān)于對(duì)他對(duì)囚犯進(jìn)行評(píng)分的方式也存在疑問(wèn):畢竟,他的方法只不過(guò)是根據(jù)方程式算出來(lái)的。盡管如此,這種預(yù)測(cè)能力也足以讓人震撼,1935年美國(guó)伊利諾伊州的監(jiān)獄開(kāi)始借助Burgess的方法支持假釋委員會(huì)做出決定。等到了世紀(jì)之交,由Burgess的方法衍生出來(lái)的其他數(shù)學(xué)方法在全世界范圍內(nèi)得到了應(yīng)用。
再來(lái)看看現(xiàn)代,目前法庭使用的最先進(jìn)的風(fēng)險(xiǎn)評(píng)估算法遠(yuǎn)比Burgess設(shè)計(jì)的基本工具復(fù)雜得多。這些算法不僅可以協(xié)助假釋決定,而且還可以幫忙為囚犯指定干預(yù)方案,決定誰(shuí)應(yīng)該獲得保釋?zhuān)罱€開(kāi)始支持法官做出判刑決定。這些算法的基本原則與以往一樣:了解被告的情況(年齡、犯罪歷史、犯罪的嚴(yán)重性等等),并預(yù)測(cè)讓他們獲得保釋的危險(xiǎn)程度。
那么,這些算法的工作原理是什么呢?從廣義上講,表現(xiàn)最優(yōu)秀的現(xiàn)代算法采用了一種名叫隨機(jī)森林的技術(shù),其核心的概念非常簡(jiǎn)單,就是簡(jiǎn)單的決策樹(shù)。
征詢(xún)觀(guān)眾的意見(jiàn)
你可能在學(xué)生時(shí)期就聽(tīng)說(shuō)過(guò)決策樹(shù)。
數(shù)學(xué)老師很喜歡決策樹(shù),他們把決策樹(shù)當(dāng)成一種組織觀(guān)察的方式,例如拋硬幣或擲骰子。在構(gòu)建完成后,你可以把決策樹(shù)當(dāng)成一種流程圖:根據(jù)一系列的要素,逐步評(píng)估下一步該做什么,或者判斷當(dāng)前情況下的事態(tài)發(fā)展。
想象一下,你正在決定是否批準(zhǔn)某人的保釋。與假釋一樣,這個(gè)決定的根本只是一個(gè)簡(jiǎn)單的計(jì)算。有罪與否并不要緊。你只需要做出預(yù)測(cè):被告是否會(huì)被判入獄,是否會(huì)違反保釋協(xié)議的條款?
為了幫助你做出預(yù)測(cè),你可以參考一些之前的罪犯數(shù)據(jù),有些人在保釋期間逃跑,或再次犯罪,而有些人卻沒(méi)有。
你可以利用這些數(shù)據(jù),手工構(gòu)建一個(gè)簡(jiǎn)單的決策樹(shù),如下圖所示,利用每個(gè)罪犯的特征來(lái)構(gòu)建流程圖。構(gòu)建完成后,你就可以利用決策樹(shù)預(yù)測(cè)罪犯的行為方式。你只需要根據(jù)犯罪者的特征沿著相關(guān)的分支前進(jìn),直到得出預(yù)測(cè)結(jié)果。只要這些結(jié)果符合之前所有人的模式,預(yù)測(cè)就是正確的。
然而,我們?cè)趯W(xué)校制作的這種決策樹(shù)也會(huì)出現(xiàn)失誤。當(dāng)然,并非每個(gè)人都和之前的模式一模一樣。而且決策樹(shù)本身也會(huì)產(chǎn)生很多錯(cuò)誤的預(yù)測(cè)。而且不僅僅是因?yàn)槲覀兊倪@個(gè)例子非常簡(jiǎn)單,即使你擁有大量之前的案例數(shù)據(jù)集,并建立極其復(fù)雜的流程圖,偏差也再所難免,最后的結(jié)果我們也只能說(shuō)使用一棵決策樹(shù)總比隨便亂猜稍好一些。
然而,如果你構(gòu)建了不止一棵樹(shù),那么一切都有可能改變。這一次我們不會(huì)一次性用光所有數(shù)據(jù),而是采用分而治之的方法。
在所謂的集合中,首先我們根據(jù)數(shù)據(jù)的隨機(jī)子集構(gòu)建數(shù)千棵小樹(shù)。然后,當(dāng)有新的被告時(shí),你只需讓每棵樹(shù)投票決定是否應(yīng)該批準(zhǔn)保釋。樹(shù)木之間可能并不完全一致,而且每棵樹(shù)依舊可能做出不準(zhǔn)的預(yù)測(cè),但你只需要取所有答案的平均值,就可以大大提高預(yù)測(cè)的精確度。
這有點(diǎn)像在“誰(shuí)想成為百萬(wàn)富翁”的節(jié)目中征詢(xún)觀(guān)眾的意見(jiàn)。雖然房間里面都是陌生人,但是他們加在一起比最聰明的人更有可能得出準(zhǔn)確的答案。(“征詢(xún)觀(guān)眾的意見(jiàn)”的成功率為91%,相比之下,“打電話(huà)向朋友求助”的成功率僅為65%。)
許多人所犯的錯(cuò)誤可能相互抵消,所以一群人總是比一個(gè)人更聰明。
同樣的道理也適用于一大群決策樹(shù),它們組成一個(gè)隨機(jī)森林。因?yàn)檫@種算法的預(yù)測(cè)是基于它從數(shù)據(jù)中學(xué)習(xí)的模式,所以隨機(jī)森林又被稱(chēng)作機(jī)器學(xué)習(xí)算法,這種算法在人工智能領(lǐng)域的應(yīng)用非常廣泛。(值得一提的是,該算法本質(zhì)上就是你在上學(xué)時(shí)繪制的流程圖,只不過(guò)經(jīng)過(guò)了一些數(shù)學(xué)操作,這聽(tīng)起來(lái)是不是很偉大?)
事實(shí)證明,隨機(jī)森林在整個(gè)現(xiàn)實(shí)世界的應(yīng)用程序中非常有幫助性。Netflix通過(guò)隨機(jī)森林,根據(jù)你過(guò)去的喜好,預(yù)測(cè)你想要觀(guān)看的內(nèi)容; Airbnb可以檢測(cè)欺詐賬戶(hù);而醫(yī)療界用隨機(jī)森林來(lái)診斷疾病。
在評(píng)估犯罪分子時(shí),與人類(lèi)評(píng)估相比,隨機(jī)森林擁有兩大優(yōu)勢(shì)。首先,該算法可以針對(duì)相同的案例給出完全相同的答案。保證一致性的同時(shí)也不犧牲個(gè)人的司法公正。還有一個(gè)關(guān)鍵的優(yōu)勢(shì):這種算法可以得出更好的預(yù)測(cè)結(jié)果。
-
人工智能
+關(guān)注
關(guān)注
1792文章
47442瀏覽量
238994 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8897瀏覽量
137534
原文標(biāo)題:忽略這一點(diǎn),人工智能變?nèi)斯ぶ钦希?/p>
文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論