在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一篇文章講清楚交叉熵和KL散度

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:PaperWeekly ? 作者:康斯坦丁 ? 2022-11-16 15:35 ? 次閱讀

看了很多講交叉熵的文章,感覺(jué)都是拾人牙慧,又不得要領(lǐng)。還是分享一下自己的理解,如果看完這篇文章你還不懂這倆概念就來(lái)掐死我吧。

1

『先翻譯翻譯,什么叫驚喜』

我們用 表示事件 發(fā)生的概率。這里我們先不討論概率的內(nèi)涵, 只需要遵循直覺(jué): 可以衡量事件 發(fā)生時(shí)會(huì)造成的驚喜(行文需要,請(qǐng)按照中性理解)程度: 概率越低的事件發(fā)生所造成的驚喜程度高;概率越高的事件發(fā)生所造成的驚喜程度低。 但是概率倒數(shù)這一運(yùn)算的性質(zhì)不是很好,所以在不改變單調(diào)性的情況下,可以將驚喜度(surprisal)定義為:

10ee981e-64f1-11ed-8abf-dac502259ad0.png

這樣定義后產(chǎn)生了另外兩個(gè)好處: 1. 確定性事件的驚喜度 = 0; 2. 如果有多個(gè)獨(dú)立事件同時(shí)發(fā)生,他們產(chǎn)生的驚喜度可以直接相加。是的,一個(gè)事件發(fā)生概率的倒數(shù)再取對(duì)數(shù)就是驚喜。

2

信息熵,不過(guò)只是驚喜的期望』

驚喜度,在大部分文章里,都叫做信息量,但這個(gè)命名只是香農(nóng)根據(jù)他研究對(duì)象的需要而做的,對(duì)于很多其它的場(chǎng)景,要生搬硬套就會(huì)變得非常不好理解了。 信息量 = 驚喜度,那么信息熵呢?看看公式不言自明:

11065166-64f1-11ed-8abf-dac502259ad0.png

或是連續(xù)形式:

111e3ccc-64f1-11ed-8abf-dac502259ad0.png

這不就是驚喜度的期望嗎? 換句話(huà)說(shuō),信息熵描述的是整個(gè)事件空間會(huì)產(chǎn)生的平均驚喜。 什么情況下,平均驚喜最低呢?確定事件。以某個(gè)離散隨機(jī)分布為例,整個(gè)分布在特定值 為 1,其它處均為 0,此時(shí)的信息熵/平均驚喜也為 0。 什么情況下產(chǎn)生的平均驚喜最高呢?自然是不確定越高平均驚喜越高。對(duì)于給定均值和方差的連續(xù)分布,正態(tài)分布(高斯分布)具有最大的信息熵(也就是平均驚喜)。所以再想想為什么大量生活中會(huì)看到的隨機(jī)事件分布都服從正態(tài)分布呢?說(shuō)明大自然有著創(chuàng)造最大驚喜的傾向,或者說(shuō),就是要讓你猜不透。這也是理解熱力學(xué)中的熵增定律的另一個(gè)角度。

3

『交叉熵,交叉的是古典和貝葉斯學(xué)派』

對(duì)于概率,比較經(jīng)典的理解是看做是重復(fù)試驗(yàn)無(wú)限次后事件頻率會(huì)逼近的值,是一個(gè)客觀存在的值;但是貝葉斯學(xué)派提出了另一種理解方式:即將概率理解為我們主觀上對(duì)事件發(fā)生的確信程度。針對(duì)同一個(gè)隨機(jī)變量空間有兩個(gè)分布,分別記作和; 是我們主觀認(rèn)為會(huì)發(fā)生的概率,下標(biāo)代表 subjective; 是客觀上會(huì)發(fā)生的概率,下標(biāo) ○ 代表 objective。 這種情況下,客觀上這個(gè)隨機(jī)事件會(huì)給我們?cè)斐审@喜的期望應(yīng)該是:

1132fa68-64f1-11ed-8abf-dac502259ad0.png

這個(gè)量 is a.k.a 交叉熵。 再翻譯一下,交叉熵是什么?可以理解為:我們帶著某個(gè)主觀認(rèn)知去接觸某個(gè)客觀隨機(jī)現(xiàn)象的時(shí)候,會(huì)產(chǎn)生的平均驚喜度。 那什么時(shí)候交叉熵(也就是我們會(huì)獲得的平均驚喜度)會(huì)大?就是當(dāng)我們主觀上認(rèn)為一個(gè)事情發(fā)生的概率很低很大),但是客觀上發(fā)生概率很高很大) 的時(shí)候,也就是主觀認(rèn)知和客觀現(xiàn)實(shí)非常不匹配的時(shí)候。機(jī)器學(xué)習(xí)當(dāng)中為啥用交叉熵來(lái)當(dāng)作損失函數(shù)應(yīng)該也就不言自明了。

4

『相對(duì)熵,K-L散度』

交叉熵可以衡量我們基于某種主觀認(rèn)識(shí)去感受客觀世界時(shí),會(huì)產(chǎn)生的平均驚喜。但是根據(jù)上面的分析,即使主觀和客觀完全匹配,這時(shí)交叉熵等于信息熵,只要事件仍然隨機(jī)而非確定,就一定會(huì)給我們?cè)斐梢欢ǔ潭鹊捏@喜。那我們要怎么度量主觀認(rèn)識(shí)和客觀之間差異呢?可以用應(yīng)該用以當(dāng)前對(duì)“世界觀”產(chǎn)生的驚喜期望和完全正確認(rèn)識(shí)事件時(shí)產(chǎn)生的驚喜期望的差值來(lái)衡量,這個(gè)就是相對(duì)熵(常稱(chēng)作 KL-散度),通常寫(xiě)作:

11443508-64f1-11ed-8abf-dac502259ad0.png

當(dāng)我們的主觀認(rèn)知完全匹配客觀現(xiàn)實(shí)的時(shí)候,KL-散度應(yīng)該等于 0,其它任何時(shí)候都會(huì)大于 0。由于存在恒為正這一性質(zhì),KL-散度經(jīng)常用于描述兩個(gè)分布是否接近,也就是作為兩個(gè)分布之間“距離”的度量;不過(guò)由于運(yùn)算不滿(mǎn)足交換律,所以又不能完全等同于“距離”來(lái)理解。 機(jī)器學(xué)習(xí)中通常用交叉熵作為損失函數(shù)的原因在與,客觀分布并不隨參數(shù)變化,所以即使是優(yōu)化 KL-散度,對(duì)參數(shù)求導(dǎo)的時(shí)候也只有交叉熵的導(dǎo)數(shù)了。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8423

    瀏覽量

    132751
  • 交叉熵
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    2378

原文標(biāo)題:一篇文章講清楚交叉熵和KL散度

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    分布式光伏的電到底該怎么用?今天給你講清楚

    光伏
    jf_55902079
    發(fā)布于 :2024年12月27日 13:04:43

    文章講清楚HDMI 2.1的

    HDMI 2.1是高清多媒體接口(HDMI)的最新版本,它帶來(lái)了系列顯著的技術(shù)升級(jí)和新功能。
    的頭像 發(fā)表于 11-28 15:56 ?588次閱讀

    晶臺(tái)DIP6 零交叉可控硅光耦KL304X,峰值擊穿電壓400V,符合ROHS、REACH和無(wú)鹵要求

    晶臺(tái)KL304X系列由個(gè)砷化鎵紅外發(fā)光二極管和個(gè)單晶硅芯片的零交叉光電雙向晶閘管組成的可控硅光電耦合器,它被設(shè)計(jì)用于與邏輯系統(tǒng)到110-380伏線(xiàn)路的設(shè)計(jì)接口,如固態(tài)繼電器、工業(yè)控
    的頭像 發(fā)表于 11-22 09:46 ?137次閱讀
    晶臺(tái)DIP6 零<b class='flag-5'>交叉</b>可控硅光耦<b class='flag-5'>KL</b>304X,峰值擊穿電壓400V,符合ROHS、REACH和無(wú)鹵要求

    有什么影響?雜從哪里來(lái)?

    說(shuō)到射頻的難點(diǎn)不得不提雜,雜也是射頻被稱(chēng)為“玄學(xué)”的來(lái)源。雜也是學(xué)習(xí)射頻必經(jīng)的個(gè)難點(diǎn)。本篇文章就來(lái)講下雜
    的頭像 發(fā)表于 11-05 09:59 ?1724次閱讀
    雜<b class='flag-5'>散</b>有什么影響?雜<b class='flag-5'>散</b>從哪里來(lái)?

    電容的“通交流、阻直流”,終于有人講清楚了!

    “通交阻直”是電容重要的特性之,即電容可以交流電導(dǎo)通,但直流電阻斷。 這是為什么呢? 從理論上來(lái)講,電荷是根本不能在電容中流動(dòng)的。 因?yàn)樵谄叫邪咫娙萆想姾螅?b class='flag-5'>一塊板帶正電,另塊板帶負(fù)電,在兩快板
    發(fā)表于 10-09 11:43

    交叉滾子導(dǎo)軌-規(guī)格型號(hào)VR系列

    VR系列交叉滾子導(dǎo)軌的工作原理:東莞兆松交叉滾子使用呈90交叉布置的成排滾柱作為兩個(gè)V型導(dǎo)軌條之間的滾動(dòng)體。滾柱在兩條導(dǎo)軌之間,沿導(dǎo)軌的兩個(gè)呈90
    的頭像 發(fā)表于 09-03 08:30 ?431次閱讀
    <b class='flag-5'>交叉</b>滾子導(dǎo)軌-規(guī)格型號(hào)VR系列

    可控硅驅(qū)動(dòng)光電耦合器KL308X 產(chǎn)品規(guī)格書(shū)

    KL308XDIP6零交叉雙向可控硅驅(qū)動(dòng)光電耦合器1.產(chǎn)品特點(diǎn)Productfeatures?峰值擊穿電壓800V?輸入與輸出間高隔離電壓(Viso=5000Vrms)?零電壓交叉
    發(fā)表于 08-20 15:29 ?0次下載

    可控硅驅(qū)動(dòng)光電耦合器KL306X 產(chǎn)品規(guī)格書(shū)

    KL306XDIP6零交叉雙向可控硅驅(qū)動(dòng)光電耦合器1.產(chǎn)品特點(diǎn)Productfeatures?峰值擊穿電壓600V?輸入與輸出間高隔離電壓(Viso=5000Vrms)?零電壓交叉
    發(fā)表于 08-20 15:27 ?0次下載

    可控硅驅(qū)動(dòng)光電耦合器KL303X 產(chǎn)品規(guī)格書(shū)

    KL303XDIP6零交叉雙向可控硅驅(qū)動(dòng)光電耦合器1.產(chǎn)品特點(diǎn)Productfeatures?峰值擊穿電壓250V?輸入與輸出間高隔離電壓(Viso=5000Vrms)?零電壓交叉
    發(fā)表于 08-20 15:22 ?0次下載

    高速光耦KL2601&KL2611 產(chǎn)品規(guī)格書(shū)

    KL2601,KL2611DIP8高速10MBit/s邏輯門(mén)光耦1.產(chǎn)品特點(diǎn)Productfeatures?高速10MBit/sHighspeed10Mbit/s?最小10kV/μs共模瞬變抗擾
    發(fā)表于 08-20 15:00 ?0次下載

    高速光耦KL220X 產(chǎn)品規(guī)格書(shū)

    KL2200,KL2201,KL2202DIP8高速低輸入電流邏輯門(mén)光耦1.產(chǎn)品特點(diǎn)Productfeatures?最小共模瞬態(tài)抗擾1kV/μs?可保證在-40至85℃溫度范圍內(nèi)運(yùn)行
    發(fā)表于 08-20 14:57 ?0次下載

    KL4N29~33 達(dá)林頓光耦 產(chǎn)品規(guī)格書(shū)

    KL4N29~33DIP6達(dá)林頓光耦1.產(chǎn)品特點(diǎn)Productfeatures?KL4NXX系列:KL4N29、KL4N30、KL4N31、
    發(fā)表于 08-20 14:51 ?0次下載

    阿里云設(shè)備的物模型數(shù)據(jù)里面始終沒(méi)有值是為什么?

    如上圖,不知道講清楚沒(méi)有。 IG502自定義TOPIC 上發(fā)到阿里云沒(méi)問(wèn)題。采用阿里云物模型的格式來(lái)上發(fā)就不行。請(qǐng)大佬指教!
    發(fā)表于 07-24 07:49

    M8連接器對(duì)使用環(huán)境有什么要求,文章講清楚!

    M8連接器對(duì)使用環(huán)境有什么要求?德索精密工業(yè),專(zhuān)業(yè)生產(chǎn)M8連接器十八年,歡迎前來(lái)采購(gòu)M8相關(guān)產(chǎn)品。任何產(chǎn)品在使用中,或多或少對(duì)使用環(huán)境都有定的要求,由于統(tǒng)物體在不同環(huán)境中的技術(shù)機(jī)能也會(huì)發(fā)生改變
    的頭像 發(fā)表于 03-18 16:39 ?391次閱讀
    M8連接器對(duì)使用環(huán)境有什么要求,<b class='flag-5'>一</b><b class='flag-5'>篇</b>文章<b class='flag-5'>講清楚</b>!

    干貨!收藏!講清楚數(shù)據(jù)治理到底是什么?

    數(shù)據(jù)治理的兩個(gè)目標(biāo):個(gè)是提質(zhì)量,個(gè)是控安全。通過(guò)業(yè)務(wù)流程優(yōu)化,規(guī)范數(shù)據(jù)從產(chǎn)生、處理、使用到銷(xiāo)毀的整個(gè)生命周期,使得數(shù)據(jù)在各階段、各流程環(huán)節(jié)安全可控,合規(guī)使用。 數(shù)據(jù)治理治的是“數(shù)據(jù)”嗎? 數(shù)據(jù)
    的頭像 發(fā)表于 02-01 10:40 ?487次閱讀
    干貨!收藏!<b class='flag-5'>一</b>文<b class='flag-5'>講清楚</b>數(shù)據(jù)治理到底是什么?
    主站蜘蛛池模板: 三级视频欧美| 色综合久久久久久久久五月性色| 欧美性区| 91在线操| 欧美福利一区| 制服丝袜中文字幕第一页| 亚洲最大成人网色| 五月婷六月婷婷| 三级不卡| 九色综合伊人久久富二代| 韩国三级久久精品| 11111日本网站| 天天插天天搞| 成人窝窝午夜看片| 2021天天操| 成人a网| 成人欧美精品久久久久影院| 国模私拍视频在线| 国产精品成人在线播放| 夜夜爽爽| 国产女同在线观看| 国产黄色小视频网站| 禁漫羞羞a漫入口| 免费看18污黄| 亚洲人成电影在线观看网| 日本黄色网页| 国产香港三级理论在线| 亚洲qingse中文字幕久久 | 色播视频在线观看免费| 欧美精品videosex性欧美| 国产伦理一区二区三区| 天天看片天天爽| 日本xxxxx69hd日本| 久久久久激情免费观看| 色婷婷六月| 好男人午夜www视频在线观看| 午夜影院在线看| 49pao强力在线高清基地| 性欧美欧美| aaaa黄色片| 日本a级片视频|