在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

七個克服機器學習障礙的因果推理工具

人工智能和機器人研究院 ? 來源:未知 ? 作者:胡薇 ? 2018-07-13 09:23 ? 次閱讀

近日,Judea Pearl 發表技術報告,指出當前機器學習的三個主要障礙,并提出了強人工智能的完整結構應該包含三個層級,而當前的機器學習尚處于底層,最后他列舉了七個用于克服這些障礙的因果推理工具。

機器學習的巨大成功帶來了 AI 應用的爆炸式增長以及對具備人類級別智能的自動化系統不斷增長的期望。然而,這些期望在很多應用領域中都遇到了基本的障礙。其中一個障礙就是適應性或魯棒性。機器學習研究者注意到當前的系統缺乏識別或響應未經特定編程或訓練的新環境的能力。人們在「遷移學習」、「域適應」和「終身學習」[Chen and Liu 2016] 這些方向進行大量理論和實驗研究就是為了克服這個障礙。

另一個障礙是可解釋性,即「機器學習模型仍然主要是黑箱的形式,無法解釋其預測或推薦背后的原因,因此降低了用戶的信任,阻礙了系統診斷和修復。」[Marcus 2018]

第三個障礙和對因果關系的理解相關。理解因果關系這一人類認知能力的標志是達到人類級別智能的必要(非充分)條件。這個要素應該使計算機系統對環境進行簡潔的編碼和模塊化的表征,對表征進行質詢,通過想象對表征進行變化,并最終回答類似「如果……會如何?」這樣的問題。例如,干預性的問題:「如果我讓……發生了會如何?」,以及回溯性或解釋性的問題:「如果我采取不同的做法會如何?」或「如果某件事情沒有發生會如何?」

Pearl 假設以上三個障礙需要用結合了因果建模工具的機器來解決,特別是因果圖示和它們的相關邏輯。圖模型和結構模型的進展使得反事實推理在計算上可行,因此使得因果推理成為強人工智能中的有效組件。

在下一部分中,作者將描述限制和支配因果推理的三個層級。最后一部分總結了如何使用因果推理的現代工具避免傳統機器學習的障礙。

三層因果層級

因果模型揭示的一個有用觀點是按照問題類型對因果信息進行分類,每個類別能夠回答特定的問題。該分類形成了一個三層的層級結構,只有在獲取第 j 層(j ≥ i)信息時,第 i 層(i = 1, 2, 3)的問題才能夠被解答。

圖 1 展示了該三層層級結構,以及每一層可回答的典型問題。這三層的名字分別是 1. 關聯(Association)、2. 干預(Intervention)、3. 反事實(Counterfactual)。這些名字是為了凸顯每一層的作用。作者將第一層叫做「關聯」是因為它僅僅調用統計關系,由裸數據來定義。例如,觀察一位購買牙膏的顧客使得他/她購買牙線的可能性增大;此類關聯可以使用條件期望直接從觀測數據中推斷得到。這一層的問題不需要因果信息,因此它們可以被放置在該三層層級架構的最底層。第二層「干預」層次比「關聯」高,因為它不只涉及觀察,還會改變觀察到的信息。這一層的典型問題是:如果我們把價格提高一倍會怎樣?此類問題無法僅根據銷售數據來回答,因為它們涉及顧客行為針對新價格所作出的改變。這些選擇可能與之前的提價情況中顧客所作出的選擇大相徑庭。(除非我們精確復制價格提高一倍時的已有市場條件。)最后,頂層是「反事實」,「反事實」一詞可以追溯到哲學家 David Hume 和 John Stewart Mill,在過去二十年中「反事實」被賦予了和計算機有關的語義。這一層的典型問題是「如果我采取不同的做法會怎樣」,因此需要回溯推理(retrospective reasoning)。

圖 1:因果層級。只有可獲取第 i 層及以上層級的信息時,第 i 層的問題才可以被解答。

因果推理的 7 個工具(或只有使用因果模型才能做到的事情)

考慮以下 5 個問題:

給定的療法在治療某種疾病上的有效性?

是新的稅收優惠導致了銷量上升嗎?

每年的醫療費用上升是由于肥胖癥人數的增多嗎?

招聘記錄可以證明雇主的性別歧視罪嗎?

我應該放棄我的工作嗎?

這些問題的一般特征是它們關心的都是原因和效應的關系,可以通過諸如「治療」、「導致」、「由于」、「證明」和「我應該」等詞識別出這類關系。這些詞在日常語言中很常見,并且我們的社會一直都需要這些問題的答案。然而,直到最近也沒有足夠好的科學方法對這些問題進行表達,更不用說回答這些問題了。和幾何學、機械學、光學或概率論的規律不同,原因和效應的規律曾被認為不適合應用數學方法進行分析。

這種誤解有多嚴重呢?實際上僅幾十年前科學家還不能為明顯的事實「mud does not cause rain」寫下一個數學方程。即使是今天,也只有頂尖的科學社區能寫出這樣的方程并形式地區分「mud causes rain」和「rain causes mud」。

過去三十年事情已發生巨大變化。一種強大而透明的數學語言已被開發用于處理因果關系,伴隨著一套把因果分析轉化為數學博弈的工具。這些工具允許我們表達因果問題,用圖和代數形式正式編纂我們現有的知識,然后利用我們的數據來估計答案。進而,這警告我們當現有知識或可獲得的數據不足以回答我們的問題時,暗示額外的知識或數據源以使問題變的可回答。

作者把這種轉化稱為「因果革命」(Pearl and Mackenzie, 2018, forthcoming),而導致因果革命的數理框架稱之為「結構性因果模型」(SCM)。

SCM 由三部分構成:

1. 圖模型

2. 結構化方程

3. 反事實和介入式邏輯

圖模型作為表征知識的語言,反事實邏輯幫助表達問題,結構化方程以清晰的語義將前兩者關聯起來。

圖 2 描述了 SCM 作為推斷引擎時的運行流程。該引擎接受三種輸入:假設(Assumptions)、查詢(Queries)和數據(Data),并生成三種輸出:被估量(Estimand)、估計值(Estimate)和擬合指數(fit indices)。被估量(E_s)是一個數學公式,該公式基于假設,提供從任意假設數據中回答查詢的方法(可獲取假設數據的情況下)。在接收到數據后,該引擎使用被估量來生成問題的實際估計值 E_s hat,以及問題置信度的統計估計值(以反映數據集的有限規模,以及可能的衡量誤差或缺失數據)。最后,該引擎生成一個「擬合指數」列表,可衡量數據與模型傳遞的假設的兼容性。

圖 2:SCM「推斷引擎」結合數據和因果模型(或假設),生成查詢的答案。

接下來介紹 SCM 框架的 7 項最重要的特性,并討論每項特性對自動化推理做出的獨特貢獻。

1. 編碼因果假設—透明性和可試性

圖模型可以用緊湊的格式編碼因果假設,同時保留透明性和可試性。其透明性使我們可以了解編碼的假設是否可信(科學意義上),以及是否有必要添加其它假設。可試性使我們(作為人類或機器)決定編碼的假設是否與可用的數據相容,如果不相容,分辨出需要修改的假設。利用 d-分離(d-separate)的圖形標準有助于以上過程的執行,d-分離構成了原因和概率之間的關聯。通過 d-分離可以知道,對模型中任意給定的路徑模式,哪些依賴關系的模式才是數據中應該存在的(Pearl,1988)。

2. do-calculus 和混雜控制

混雜是從數據中提取因果推理的主要障礙,通過利用一種稱為「back-door」的圖形標準可以完全地「解混雜」。特別地,為混雜控制選擇一個合適的協變量集合的任務已被簡化為一種簡單的「roadblocks」問題,并可用簡單的算法求解。(Pearl,1993)

為了應對「back-door」標準不適用的情況,人們開發了一種符號引擎,稱為 do-calculus,只要條件適宜,它可以預測策略干預的效應。每當預測不能由具體的假設確定的時候,會以失敗退出(Pearl, 1995; Tian and Pearl, 2002; Shpitser and Pearl, 2008)。

3. 反事實算法

反事實分析處理的是特定個體的行為,以確定清晰的特征集合。例如,假定 Joe 的薪水為 Y=y,他上過 X=x 年的大學,那么 Joe 接受多一年教育的話,他的薪水將會是多少?

在圖形表示中使用反事實推理是將因果推理應用于編碼科學知識的非常有代表性的研究。每一個結構化方程都決定了每一個反事實語句的真值。因此,我們可以解析地確定關于語句真實性的概率是不是可以從實驗或觀察研究(或實驗加觀察)中進行估計(Balke and Pearl, 1994; Pearl, 2000, Chapter 7)。

人們在因果論述中特別感興趣的是關注「效應的原因」的反事實問題(和「原因的效應」相對)。(Pearl,2015)

4. 調解分析和直接、間接效應的評估

調解分析關心的是將變化從原因傳遞到效應的機制。對中間機制的檢測是生成解釋的基礎,且必須應用反事實邏輯幫助進行檢測。反事實的圖形表征使我們能定義直接和間接效應,并確定這些效應可從數據或實驗中評估的條件(Robins and Greenland, 1992; Pearl, 2001; VanderWeele, 2015)

5. 外部效度和樣本選擇偏差

每項實驗研究的有效性都需要考慮實驗和現實設置的差異。不能期待在某個環境中訓練的模型可以在環境改變的時候保持高性能,除非變化是局域的、可識別的。上面討論的 do-calculus 提供了完整的方法論用于克服這種偏差來源。它可以用于重新調整學習策略、規避環境變化,以及控制由非代表性樣本帶來的偏差(Bareinboim and Pearl, 2016)。

6. 數據丟失

數據丟失的問題困擾著實驗科學的所有領域。回答者不會在調查問卷上填寫所有的條目,傳感器無法捕捉環境中的所有變化,以及病人經常不知為何從臨床研究中突然退出。對于這個問題,大量的文獻致力于統計分析的黑箱模型范式。使用缺失過程的因果模型,我們可以形式化從不完整數據中恢復因果和概率的關系的條件,并且只要條件被滿足,就可以生成對所需關系的一致性估計(Mohan and Pearl, 2017)。

7. 挖掘因果關系

上述的 d-分離標準使我們能檢測和列舉給定因果模型的可測試推斷。這為利用不精確的假設、和數據相容的模型集合進行推理提供了可能,并可以對模型集合進行緊湊的表征。人們已在特定的情景中做過系統化的研究,可以顯著地精簡緊湊模型的集合,從而可以直接從該集合中評估因果問詢。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31028

    瀏覽量

    269382
  • 機器學習
    +關注

    關注

    66

    文章

    8423

    瀏覽量

    132751

原文標題:傳統機器學習尚處于因果層級的底層,達成完備AI的7個工具

文章出處:【微信號:gh_ecbcc3b6eabf,微信公眾號:人工智能和機器人研究院】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    傳統機器學習方法和應用指導

    用于開發生物學數據的機器學習方法。盡管深度學習(一般指神經網絡算法)是一強大的工具,目前也非常流行,但它的應用領域仍然有限。與深度
    的頭像 發表于 12-30 09:16 ?232次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    ADI電源管理工具推薦

    ADI 提供了一整套電源管理工具,幫助您一次性正確設計電源解決方案。ADI 的電源管理工具支持從零件推薦到性能估算、實用的電源樹設計、電路仿真和系統級優化的整個設計過程。探索這些免費且強大的工具
    的頭像 發表于 12-23 09:46 ?306次閱讀

    cmp項目管理工具的優缺點

    、風險管理和溝通管理等。 綜合項目管理平臺CMP的優缺點 優點 項目集成 :CMP項目管理工具將各種項目管理工具和功能整合在一平臺上,提供一統一的界面和數據源,便于項目經理監控和管
    的頭像 發表于 12-17 09:42 ?200次閱讀

    使用機器學習和NVIDIA Jetson邊緣AI和機器人平臺打造機器人導盲犬

    ,是 Ornek 迄今為止創造的七個機器人之一。在她所創造的機器人中,有一名為 BB4All 的學校援助機器人,可以通過實時通知和健康監測
    的頭像 發表于 11-08 10:05 ?413次閱讀

    具身智能與機器學習的關系

    (如機器人、虛擬代理等)通過與物理世界或虛擬環境的交互來獲得、發展和應用智能的能力。這種智能不僅包括認知和推理能力,還包括感知、運動控制和環境適應能力。具身智能強調智能體的身體和環境在智能發展中的重要性。 2. 機器
    的頭像 發表于 10-27 10:33 ?400次閱讀

    單片機方案開發-分享七個常用的外圍電路設計

    在電子產品電路開發設計中,外圍電路設計是連接主控芯片與外部世界的關鍵橋梁,它直接影響著整個產品的性能、穩定性及功耗。今天,今天英銳恩科技的技術小編跟大家分享七個常用的外圍電路設計,助電子工程師們
    發表于 09-24 15:59

    放大器OPA548的七個針腳與電源和負載是怎么接線的?

    請問:放大器OPA548的七個針腳與電源和負載是怎么接線的?
    發表于 09-23 08:19

    NE5534導入到Pspice只有七個腳,且按照生成的.lib文件對應的管腳連接的電路仿真出錯怎么解決?

    NE5534導入到Pspice只有七個腳 且按照生成的.lib文件對應的管腳連接的電路仿真出錯 求解NE5534的準確pspice模型
    發表于 08-15 08:10

    LLM大模型推理加速的關鍵技術

    LLM(大型語言模型)大模型推理加速是當前人工智能領域的一研究熱點,旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型推理加速關鍵技術的詳細探討,內容將涵蓋模型壓縮、解碼方法優化、底層優化、分布式并行
    的頭像 發表于 07-24 11:38 ?913次閱讀

    單片機控制電磁閥

    一共七個開關 七個電磁閥 每個開關控制一電磁閥 電源關閉狀態下 一號開關閉合 二號開關常開 三號開關常開 四號開關閉合 五號開關閉合 六號開關常開 號開關常開 寫一
    發表于 07-23 12:25

    深度學習編譯工具鏈中的核心——圖優化

    等,需要調整優化網絡中使用的算子或算子組合,這就是深度學習編譯工具鏈中的核心——圖優化。圖優化是指對深度學習模型的計算圖進行分析和優化的過程,通過替換子圖(算子)為在推理平臺上性能更佳
    的頭像 發表于 05-16 14:24 ?999次閱讀
    深度<b class='flag-5'>學習</b>編譯<b class='flag-5'>工具</b>鏈中的核心——圖優化

    機器故障排除需要考慮的七個要素

    了解可編程邏輯控制器(PLC)和計算機,對于機器控制以及傳感器和不同驅動器的運營非常重要。了解用于訪問程序的不同軟件類型和用于顯示數字和文本信息的不同數據類型。
    的頭像 發表于 03-13 10:45 ?695次閱讀
    <b class='flag-5'>機器</b>故障排除需要考慮的<b class='flag-5'>七個</b>要素

    分布式控制系統的七個功能和應用

    分布式控制系統的七個功能和應用? 分布式控制系統是一種由多個獨立的控制單元組成的系統,每個控制單元負責系統中的一部分功能。它具有分散的、自治的特性,可以提高系統的可靠性、靈活性和可擴展性。分布式控制
    的頭像 發表于 02-01 10:51 ?1436次閱讀

    微控制器的七個串行接口

    我們將簡要介紹七個串行接口:SIO、UART、SSP(SPI)、I2C、CAN、USB和EtherMAC。雖然每個接口都有幾個不同的操作模式,但我們只介紹一典型的模式。
    的頭像 發表于 01-11 09:30 ?3098次閱讀
    微控制器的<b class='flag-5'>七個</b>串行接口

    Torch TensorRT是一優化PyTorch模型推理性能的工具

    那么,什么是Torch TensorRT呢?Torch是我們大家聚在一起的原因,它是一端到端的機器學習框架。而TensorRT則是NVIDIA的高性能深度學習
    的頭像 發表于 01-09 16:41 ?1782次閱讀
    Torch TensorRT是一<b class='flag-5'>個</b>優化PyTorch模型<b class='flag-5'>推理</b>性能的<b class='flag-5'>工具</b>
    主站蜘蛛池模板: 大色综合色综合网站| 免费观看黄色网页| 一级欧美日韩| 一久久| 五月桃花网婷婷亚洲综合| 色聚网久久综合| 欧美激情亚洲色图| 久久久伊香蕉网站| 国产视频一区二区在线观看| 97大香伊在人人线色| 深夜视频在线免费| 56pao强力打造| 一本到卡二卡三卡福利| 第四色亚洲| 色噜噜网站| 国产在线精彩视频二区| 一本大道香蕉大vr在线吗视频| 日本一本视频| dyav午夜片| 亚洲成色999久久网站| 欧美人与动性行为网站免费| 成人精品久久| 久久99热精品免费观看k影院| 最猛91大神ben与女教师| 中文字幕11页| 日本不卡高清免费v日本| 国产色秀视频在线观看| 手机在线视频你懂的| 欧美亚洲啪啪| 在线播放亚洲视频| 欧美性xxxxbbbb| 在线免费国产| avtom影院永久地址人人影院| 乡村乱人伦短小说| 涩涩涩丁香色婷五月网视色| 久久久久久久久综合| 午夜视频在线观看免费高清| 2021久久精品国产99国产精品| 美女张开腿露出尿口让男人桶| 色狠狠综合| 在线免费看片a|