來源 | 《趣學(xué)貝葉斯統(tǒng)計(jì):橡皮鴨、樂高和星球大戰(zhàn)中的統(tǒng)計(jì)學(xué)》 作者 | [美] 威爾·庫爾特(Will Kurt) 譯者 |王凌云
本章將概述貝葉斯推理。所謂貝葉斯推理,是指我們?cè)谟^察到一些數(shù)據(jù)后,更新自己對(duì)這個(gè)世界的信念的過程。我們將通過一個(gè)場景來探討如何將日常經(jīng)驗(yàn)映射到貝葉斯推理中。
好消息是,在拿起本書之前,你就已經(jīng)是一個(gè)貝葉斯主義者了!貝葉斯統(tǒng)計(jì)其實(shí)與人們?nèi)绾巫匀坏乩脭?shù)據(jù)創(chuàng)造新的信念、如何進(jìn)行日常問題的推理密切相關(guān)。壞消息是,將這種自然的思維過程分解為嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)過程很難。
在統(tǒng)計(jì)學(xué)中,我們通過使用特定的計(jì)算和模型來更準(zhǔn)確地量化概率。不過,本章不會(huì)使用任何數(shù)學(xué)計(jì)算或模型,我們只需要熟悉基本概念,并利用直覺來確定概率。我們才會(huì)精確地計(jì)算概率。在本書的剩余部分,你將學(xué)習(xí)如何使用嚴(yán)格的數(shù)學(xué)方法對(duì)本章涉及的概念進(jìn)行形式化的建模和推理。
1 對(duì)奇怪經(jīng)歷的推理
一天晚上,你突然被窗外的一道亮光驚醒。你從床上跳起來,向外望去,發(fā)現(xiàn)天空中有一個(gè)碟形的龐然大物。你從來都不相信會(huì)遇見外星人,但現(xiàn)在你完全被外面的景象迷惑了。你發(fā)現(xiàn)自己在想:這難道是不明飛行物(unidentified flying object,UFO)嗎?!
貝葉斯推理就是這樣一種思維過程:在遇到一種情況時(shí),你會(huì)做出概率假設(shè),然后根據(jù)這些假設(shè)更新你對(duì)這個(gè)世界的信念。在UFO這個(gè)情景中,你已經(jīng)經(jīng)歷了一個(gè)完整的貝葉斯分析過程,因?yàn)槟悖?/p>
(1) 觀察到了數(shù)據(jù);
(2) 做出了一個(gè)假設(shè);
(3) 根據(jù)觀察到的數(shù)據(jù)更新了自己的信念。
這種推理往往發(fā)生得太快,以至于你沒有時(shí)間分析自己的思維過程。你在沒有任何質(zhì)疑的情況下建立了一個(gè)新的信念:之前你不相信UFO的存在,在事件發(fā)生之后你更新了自己的信念,你認(rèn)為自己看到了UFO。
本章主要關(guān)注信念的產(chǎn)生及其構(gòu)建過程,這樣你就可以更規(guī)范地研究它。此外,后面的章節(jié)還將研究如何量化這個(gè)過程。
讓我們從觀察數(shù)據(jù)開始,依次分析這個(gè)推理過程的每一個(gè)步驟。
(1)觀察數(shù)據(jù)
將信念建立在數(shù)據(jù)上,是貝葉斯推理的一個(gè)關(guān)鍵組成部分。在對(duì)場景得出任何結(jié)論之前(比如說你聲稱自己看到了UFO),你需要理解所觀察到的數(shù)據(jù)。在這個(gè)例子中,數(shù)據(jù)是:
窗外的一道亮光;
一個(gè)碟形物體在空中盤旋。
根據(jù)經(jīng)驗(yàn),你會(huì)把窗外的景象描述為“令人驚訝的場景”,用概率的術(shù)語表示,可以將它寫為:
(窗外出現(xiàn)亮光, 天空中有碟形物體)??很小
其中?表示概率,括號(hào)內(nèi)列出的是兩條數(shù)據(jù)。你可以將這個(gè)等式理解為“窗外出現(xiàn)亮光且天空中有碟形物體的概率很小”。在概率論中,當(dāng)要表示多個(gè)事件的聯(lián)合概率(combined probability)時(shí),用逗號(hào)分隔事件。請(qǐng)注意,這兩條數(shù)據(jù)并不包含任何關(guān)于UFO的具體內(nèi)容,它只由你的觀察結(jié)果組成——這一點(diǎn)在后面會(huì)很重要。
也可以考查單個(gè)事件的概率,并將其寫為:
(下雨)??很可能
這個(gè)等式的意思是,“下雨的概率比較大”。
對(duì)剛才提到的UFO場景,我們要確定的是兩個(gè)事件一起發(fā)生的概率。這與兩個(gè)事件單獨(dú)發(fā)生的概率完全不同。例如,單獨(dú)出現(xiàn)亮光很容易,一輛路過的汽車就會(huì)發(fā)出亮光,所以就出現(xiàn)亮光這個(gè)事件而言,它發(fā)生的概率要遠(yuǎn)遠(yuǎn)大于它和碟形物體同時(shí)出現(xiàn)的概率(不過碟形物體單獨(dú)出現(xiàn)也同樣讓人驚訝)。
如何確定這個(gè)概率呢?現(xiàn)在,我們使用的是直覺,也就是自我感覺到的這件事發(fā)生的可能性。第2章將介紹如何得出概率的精確數(shù)值。
(2)先驗(yàn)信念和條件概率
早晨醒來,煮杯咖啡喝,然后開車去上班。在這個(gè)過程中,你不需要做很多分析,這是因?yàn)槟銓?duì)這個(gè)世界如何運(yùn)轉(zhuǎn)有著先驗(yàn)信念(prior belief)。先驗(yàn)信念是我們根據(jù)一生的經(jīng)驗(yàn)(也就是觀察到的數(shù)據(jù))建立起來的信念集合。你相信太陽會(huì)升起,因?yàn)樽阅愠錾詠硖柮刻於紩?huì)升起(當(dāng)然,在陰雨天,你看不見太陽升起)。如果沒有先驗(yàn)信念,我們每天晚上睡覺時(shí)都會(huì)害怕明天的太陽可能不會(huì)升起。
先驗(yàn)信念表示,在看到窗外有明亮燈光的同時(shí)看到一個(gè)碟形物體,這在地球上很少見。但如果你生活在一個(gè)遙遠(yuǎn)的星球上,那里有大量的飛碟且經(jīng)常有星際訪客,那么在天空中同時(shí)看到亮光和碟形物體的概率就會(huì)大很多。
在公式中,先驗(yàn)信念寫在數(shù)據(jù)后面并用“|”與數(shù)據(jù)隔開,就像下面這樣:
(窗外出現(xiàn)亮光,天空中有碟形物體 | 地球上的經(jīng)驗(yàn))??很小
這個(gè)等式可以理解為:“根據(jù)我們?cè)诘厍蛏系慕?jīng)驗(yàn),在天空中同時(shí)看到亮光和碟形物體的概率很小。”
這個(gè)概率結(jié)果被稱為條件概率(conditional probability),因?yàn)橛?jì)算某一個(gè)事件發(fā)生的概率時(shí),以另一個(gè)事件的存在為條件。在這種情況下,我們會(huì)根據(jù)經(jīng)驗(yàn)來調(diào)整觀察到的事件的概率。
正如用?表示概率一樣,我們通常用另外的變量來表示事件和條件,這樣更簡潔。如果你不太熟悉等式,一開始可能覺得它們顯得過于簡潔。但過一段時(shí)間你就會(huì)發(fā)現(xiàn),簡潔的變量名既有助于提高可讀性,也有助于你了解等式如何推廣到更大的問題類別上。我們將把所有的數(shù)據(jù)賦給一個(gè)變量?:
?窗外出現(xiàn)亮光,天空中有碟形物體
所以從現(xiàn)在開始,當(dāng)提到這組數(shù)據(jù)集的概率時(shí),我們會(huì)直接用?來表示。
同樣,我們會(huì)用變量?來表示先驗(yàn)信念,像下面這樣:
?地球上的經(jīng)驗(yàn)
現(xiàn)在可以將上文中等式的左邊寫為。這樣寫更為簡單且意思保持不變。
以多重信念為條件
如果有一個(gè)以上的變量會(huì)顯著影響概率,那么我們可以添加一個(gè)以上的先驗(yàn)信念。假設(shè)今天是特定節(jié)日,根據(jù)經(jīng)驗(yàn),你知道在這天放煙花很常見。根據(jù)你在地球上的經(jīng)驗(yàn)和今天是特殊的日子,在天空中看到亮光的概率不是完全沒有,甚至那個(gè)碟形物體也可能與某個(gè)煙花表演有關(guān)。因此,你可以將這個(gè)等式改寫為:
(窗外出現(xiàn)亮光, 天空中有碟形物體 | 特定節(jié)日, 地球上的經(jīng)驗(yàn))??小
對(duì)比這兩種情況可以發(fā)現(xiàn),條件概率從“很小”變成了“小”。
在實(shí)踐中假設(shè)存在先驗(yàn)信念
在統(tǒng)計(jì)學(xué)中,通常不會(huì)明確地為所有的現(xiàn)有經(jīng)驗(yàn)附加條件,因?yàn)樗强梢约僭O(shè)的。出于這個(gè)原因,在本書中,我們不會(huì)在這種情況下單獨(dú)增加變量。然而在貝葉斯分析中,我們必須記住,我們對(duì)這個(gè)世界的理解總是以自己在這個(gè)世界上的經(jīng)驗(yàn)為條件的。本章的其余部分會(huì)保留“地球上的經(jīng)驗(yàn)”這個(gè)變量以提醒這一點(diǎn)。
(3)形成假設(shè)
到目前為止,我們已經(jīng)有了數(shù)據(jù)(看到了一道亮光和一個(gè)碟形物體)和先驗(yàn)信念?。為了解釋所看到的情況,我們需要形成某種假設(shè)(hypothesis),即形成一個(gè)關(guān)于世界如何運(yùn)作的模型,從而做出預(yù)測(cè)。假設(shè)可以有多種形式,我們對(duì)這個(gè)世界的所有基本信念都可以是假設(shè)。
如果相信地球自轉(zhuǎn),那么你就可以預(yù)測(cè)太陽會(huì)在某個(gè)時(shí)間升起和落下。
如果認(rèn)為你最喜歡的棒球隊(duì)是最好的,那么你就可以預(yù)測(cè)他們會(huì)比其他球隊(duì)贏得更多。
假設(shè)也可以更正式、更復(fù)雜。
科學(xué)家可能會(huì)假設(shè)某種治療方法能減緩癌癥惡化。
金融領(lǐng)域的定量分析師會(huì)構(gòu)建市場行為模型。
深度神經(jīng)網(wǎng)絡(luò)可以預(yù)測(cè)哪些圖像展示的是動(dòng)物,哪些圖像展示的是植物。
所有這些例子都是假設(shè),因?yàn)樗鼈兌及瑢?duì)這個(gè)世界的某種理解,并利用這種理解來預(yù)測(cè)世界將如何運(yùn)作。當(dāng)提到貝葉斯統(tǒng)計(jì)中的假設(shè)時(shí),通常關(guān)注的是它對(duì)我們觀察到的數(shù)據(jù)的預(yù)測(cè)能力。
當(dāng)看到數(shù)據(jù)并認(rèn)為自己看到了UFO時(shí),你就在形成一個(gè)假設(shè)。UFO的假設(shè)很可能是基于你以前看過的電影和電視節(jié)目。將第一個(gè)假設(shè)定義為:
?在我家的后院里有一個(gè)UFO!
但這個(gè)假設(shè)預(yù)測(cè)的又是什么呢?如果將問題倒過來想,我們可能會(huì)問:“如果在你家的后院里有一個(gè)UFO,那么你預(yù)期會(huì)看到什么呢?”你可能會(huì)回答:“亮光和碟形物體。”因?yàn)?img src="https://file1.elecfans.com/web2/M00/A8/FD/wKgaomUvSNyAO_NDAAABSohrb2s078.png" alt="a5a17f3e-6cd0-11ee-939d-92fbcf53809c.png" />?預(yù)測(cè)了數(shù)據(jù)?,所以當(dāng)我們?cè)诮o定的假設(shè)下觀察到數(shù)據(jù)時(shí),數(shù)據(jù)的概率就會(huì)增加。這樣的結(jié)果可以規(guī)范地表示為:
這個(gè)式子的意思是:“如果相信這是UFO并根據(jù)經(jīng)驗(yàn),在天空中看到亮光和碟形物體的概率要遠(yuǎn)遠(yuǎn)大于只看到亮光和碟形物體而無法解釋的概率(這里用兩個(gè)大于號(hào)?表示遠(yuǎn)遠(yuǎn)大于)。”這里用概率的語言證明了我們的假設(shè)可以解釋數(shù)據(jù)。
(4)在日常語言中發(fā)現(xiàn)假設(shè)
很容易看出,日常語言和概率之間有著某種關(guān)系。例如,說某事“令人驚訝”,其實(shí)就等于說,根據(jù)我們的經(jīng)驗(yàn),它發(fā)生的概率比較小;而說某件事“很合理”,其實(shí)是說,基于經(jīng)驗(yàn),它發(fā)生的概率比較大。一旦指出,這種關(guān)系似乎就變得很明顯了,但概率推理的關(guān)鍵在于仔細(xì)思考如何解釋數(shù)據(jù)、形成假設(shè)并改變你自己的信念,即使面對(duì)的是一個(gè)普通的日常場景。如果沒有假設(shè),那么你就會(huì)感到疑惑,因?yàn)槟銦o法解釋所觀察到的數(shù)據(jù)。
2 收集更多的數(shù)據(jù)以更新信念
現(xiàn)在你有了數(shù)據(jù)和假設(shè),然而由于之前你一直對(duì)UFO事件持懷疑態(tài)度,因此這個(gè)假設(shè)看起來還是很離譜。為了進(jìn)一步提高知識(shí)水平以得出更可靠的結(jié)論,你需要收集更多的數(shù)據(jù)。這是統(tǒng)計(jì)推理的下一個(gè)步驟,也是直覺思維的下一個(gè)步驟。
為了收集更多的數(shù)據(jù),需要進(jìn)行更多的觀察。具體到UFO這個(gè)場景,你需要向窗外看看還能觀察到什么。
當(dāng)去看外面的亮光時(shí),你注意到這個(gè)區(qū)域還有更多的燈光,還看到那個(gè)巨大的碟形物體用電線吊著,并留意到一個(gè)攝像人員。你聽到一聲巨響,有人喊了一聲“停”。
你很有可能會(huì)瞬間改變對(duì)這個(gè)場景中所發(fā)生事情的看法。之前,你的推斷是自己可能看到了一個(gè)UFO,現(xiàn)在有了一些新數(shù)據(jù),你意識(shí)到這看起來更像是有人在附近拍電影。
在這一思維過程中,你的大腦又一次瞬間完成了一次復(fù)雜的貝葉斯分析!為了更仔細(xì)地分析這一事件,下面來分解這一思維過程。
最初,你的假設(shè)是:
?有UFO著陸!
根據(jù)你的經(jīng)驗(yàn),這個(gè)假設(shè)單獨(dú)發(fā)生的可能性非常小:
?非常小
這是在現(xiàn)有數(shù)據(jù)下,你能想到的唯一可能的解釋。但是,當(dāng)觀察到更多的數(shù)據(jù)后,你立刻意識(shí)到還有一個(gè)可能的假設(shè)——附近有人正在拍攝電影:
?有人正在窗外拍攝電影
這個(gè)假設(shè)單獨(dú)發(fā)生的概率從直覺上來說也很小(除非你碰巧住在電影制片廠附近):
?很小
請(qǐng)注意,這里將?的概率設(shè)為“非常小”,并將??的概率設(shè)為“很小”。這與我們的直覺相符。假設(shè)在沒有任何數(shù)據(jù)的情況下有人走過來詢問:“你認(rèn)為哪一種可能性更大——是UFO夜間出現(xiàn)在你家附近,還是剛好有電影在你家附近拍攝?”你會(huì)回答拍攝電影的可能性要比出現(xiàn)UFO的可能性更大。
當(dāng)改變信念時(shí),我們需要用一種方法將新得到的數(shù)據(jù)考慮進(jìn)去。
3 對(duì)比假設(shè)
最開始,盡管不太相信,但你接受了出現(xiàn)UFO的假設(shè),因?yàn)槌酥饽阆氩怀鋈魏纹渌忉尅H欢F(xiàn)在出現(xiàn)了另一種可能的解釋——正在拍攝電影,由此產(chǎn)生了備擇假設(shè)(alternative hypothesis)。思考備擇假設(shè)的過程,就是利用你所掌握的數(shù)據(jù)對(duì)多種假設(shè)進(jìn)行比較的過程。
當(dāng)看到電線、電影攝制組和額外的燈光時(shí),你所掌握的數(shù)據(jù)就發(fā)生了變化。更新后的數(shù)據(jù)是:
更新后??亮光, 碟形物體, 電線, 攝制組, 其他燈光等
在觀察到這些額外的數(shù)據(jù)后,你改變了對(duì)所發(fā)生事情的結(jié)論。下面將這個(gè)過程分解成貝葉斯推理過程。第一種假設(shè)?給了一種解釋數(shù)據(jù)的方法,讓你不再困惑;然而隨著觀察的進(jìn)一步深入,?已經(jīng)不能很恰當(dāng)?shù)亟忉寯?shù)據(jù)了。用概率的方法表示就是:
更新后??非常小
現(xiàn)在你有了一種新的假設(shè),它可以更恰當(dāng)?shù)亟忉寯?shù)據(jù),用概率的方法表示就是:
更新后?更新后?
這里的關(guān)鍵是,要理解我們是在比較這些假設(shè)對(duì)觀測(cè)數(shù)據(jù)的解釋程度。當(dāng)說“在第二種假設(shè)中,數(shù)據(jù)的出現(xiàn)概率要遠(yuǎn)遠(yuǎn)大于第一種假設(shè)”時(shí),我們的意思是,第二種假設(shè)可以更恰當(dāng)?shù)亟忉屗^察到的數(shù)據(jù)。由此,我們就觸及了貝葉斯分析的真正核心:檢驗(yàn)信念的標(biāo)準(zhǔn)是它們解釋世界的能力。我們說一種信念要比另一種信念更準(zhǔn)確,是因?yàn)樗芨‘?dāng)?shù)亟忉屛覀兯^察到的世界。
數(shù)學(xué)上用這兩種概率的比值來表達(dá)這個(gè)想法:
當(dāng)這個(gè)比值是一個(gè)很大的數(shù)時(shí),比如1000,它意味著“?對(duì)數(shù)據(jù)的解釋要比??恰當(dāng)1000倍”。因?yàn)??對(duì)數(shù)據(jù)的解釋要比??好很多,所以我們將信念從??改變?yōu)?。這正是當(dāng)你改變對(duì)所觀察情況的看法時(shí)所發(fā)生的事情。現(xiàn)在你之所以相信自己看到的是窗外正在拍攝電影,是因?yàn)樗芙忉屇闼^察到的所有數(shù)據(jù)。
4 數(shù)據(jù)影響信念,信念不應(yīng)該影響數(shù)據(jù)
最后值得強(qiáng)調(diào)的一點(diǎn)是,所有這些示例中唯一不變的是數(shù)據(jù)。你的假設(shè)可以改變,你在這個(gè)世界上的經(jīng)驗(yàn)?也可以與別人不同,但是數(shù)據(jù)??則是所有人共享的。
思考下面這兩個(gè)公式。第一個(gè)已經(jīng)在本章中多次使用:
它可以理解為“根據(jù)給定的假設(shè)和我的經(jīng)驗(yàn)所得出的數(shù)據(jù)概率”,或者更直白地說,“我的信念對(duì)所觀察到的數(shù)據(jù)解釋得如何”。
但在日常思維中,有一種反過來的情況,那就是:
它可以理解為“根據(jù)數(shù)據(jù)和在這個(gè)世界上的經(jīng)驗(yàn),我的信念的概率”,或者“我觀察到的情況對(duì)我的信念的支持程度”。
在第一種情況下,我們會(huì)根據(jù)所收集到的數(shù)據(jù)和對(duì)世界的觀察來改變自己的信念,從而更恰當(dāng)?shù)孛枋鲞@個(gè)世界。在第二種情況下,我們收集數(shù)據(jù)來支持自己當(dāng)前的信念。貝葉斯思維就是改變你的想法,更新你對(duì)世界的理解。我們觀察到的數(shù)據(jù)都是真實(shí)的,所以我們的信念終歸需要轉(zhuǎn)變,直到與數(shù)據(jù)一致。
在生活中,你的信念也應(yīng)該是始終可變的。
當(dāng)攝制組收工時(shí),你注意到所有的面包車上都有同一個(gè)徽章圖案。你隱約聽到有人說:“嗯,這應(yīng)該騙過了所有看到這一場景的人……真是好主意。”
有了這些新數(shù)據(jù)后,你的信念可能會(huì)再次改變!
5 小結(jié)
下面來回顧一下本章所介紹的內(nèi)容。你根據(jù)現(xiàn)有的經(jīng)驗(yàn)?形成了最初的信念。而觀察到的數(shù)據(jù)?,要么與你的經(jīng)驗(yàn)一致,即??很大;要么讓你感到驚訝,即??很小。為了理解這個(gè)世界,你信賴根據(jù)觀察所形成的信念,或者說假設(shè)?。很多時(shí)候,一種新的假設(shè)可以解釋讓你感到驚訝的數(shù)據(jù),用概率的語言表示就是?。當(dāng)收集到新的數(shù)據(jù)或產(chǎn)生新的想法時(shí),你可以形成更多的假設(shè),如?、、?等。當(dāng)一種新的假設(shè)要比舊的假設(shè)更能解釋收集到的數(shù)據(jù)時(shí),即當(dāng)出現(xiàn)下面這種情況時(shí),你會(huì)改變自己的信念。
?較大數(shù)值
最后,你應(yīng)該更關(guān)注那些改變你的信念的數(shù)據(jù),而不是確保數(shù)據(jù)支持你的信念,即?的值。
有了這些基礎(chǔ),就可以往其中添加數(shù)值了。你將用數(shù)學(xué)方法模擬自己的信念,從而精確地決定你應(yīng)該如何以及何時(shí)改變自己的信念。
6 練習(xí)
試著回答以下問題,檢驗(yàn)一下你對(duì)貝葉斯推理的理解程度。
(1) 使用本章介紹的數(shù)學(xué)符號(hào),將下列表述改寫為數(shù)學(xué)表達(dá)式:
下雨的概率較小;
在陰天,下雨的概率較大;
下雨時(shí),你帶傘的概率要遠(yuǎn)遠(yuǎn)大于通常情況下帶傘的概率。
(2) 使用本章介紹的方法,將你在下述場景中觀察到的數(shù)據(jù)整理為數(shù)學(xué)表達(dá)式,然后提出假設(shè)來解釋這些數(shù)據(jù)。
你下班回到家,看到正門是開著的且側(cè)窗壞了。走進(jìn)門后,你很快發(fā)現(xiàn)自己的筆記本計(jì)算機(jī)不見了。
(3) 下述場景在第2題的基礎(chǔ)上增加了一些數(shù)據(jù)。使用本章介紹的數(shù)學(xué)符號(hào)演示這些新信息如何改變你的信念,并提出第2個(gè)假設(shè)來解釋這些數(shù)據(jù)。
鄰居家的孩子跑過來向你道歉,他不小心將石頭扔到你家的窗戶上,打碎了玻璃。同時(shí)他還說,他看見了你的筆記本計(jì)算機(jī),因?yàn)椴幌胱屗煌担运蜷_正門將它拿回了家。現(xiàn)在你的筆記本計(jì)算機(jī)在他家,很安全。
編輯:黃飛
-
貝葉斯
+關(guān)注
關(guān)注
0文章
77瀏覽量
12567
原文標(biāo)題:強(qiáng)大的貝葉斯定理,看完后忍不住驚嘆數(shù)學(xué)太重要了!
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論