在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

探索“What-If”場景通常意味著編寫一次性的自定義代碼來分析特定模型

Tensorflowers ? 來源:未知 ? 作者:李倩 ? 2018-10-11 11:31 ? 次閱讀

構建有效的機器學習 (ML) 系統需要提出許多問題。僅僅訓練一個模型,然后放任不管,是遠遠不夠的。而優秀的開發者就像偵探一樣,總是不斷探索,試圖更好地理解自己的模型:數據點的變化對模型的預測結果有何影響?對于不同的群體,例如在歷史上被邊緣化的人群,模型的表現是否有所不同?用于測試模型的數據集的多樣化程度如何?要回答這些類型的問題并不容易。探索 “What-If” 場景通常意味著編寫一次性的自定義代碼來分析特定模型。此過程不僅效率低下,而且非編程人員很難參與塑造和改進 ML 模型的過程。Google AI PAIR 計劃的一個重點就是讓廣大用戶能夠更輕松地檢查、評估和調試 ML 系統。

我們發布了What-If 工具(https://pair-code.github.io/what-if-tool/),這是開源TensorBoard網絡應用的一個新功能,可以讓用戶在無需編寫代碼的情況下分析 ML 模型。在給定 TensorFlow 模型和數據集指針的前提下,What-If 工具可為模型結果探索提供交互式可視界面。

What-If 工具:展示了一組面部圖片(共 250 張),以及微笑檢測模型得出的結果

What-If 工具擁有各種功能,包括使用Facets自動可視化數據集、手動編輯數據集示例并查看相關更改的影響,以及自動生成局部依賴圖(顯示模型的預測結果如何隨任何單個功能的更改而變化)。下面詳細探索其中兩項功能。

探索數據點上的 What-If 場景

反事實

只需點擊一下按鈕,即可將某個數據點與模型預測不同結果的最相似點進行比較。我們將這些點稱為 “反事實”,它們可以清楚顯示出模型的決策邊界。或者,您也可以手動編輯一個數據點,然后探索模型預測的變化情況。在下方的屏幕截圖中,我們將該工具用于二進制分類模型。此模型根據UCI 人口普查數據集的公開人口普查數據來預測某個人的收入是否超過 5 萬美元。這是 ML 研究人員常用的基準預測任務,特別適用于分析算法公平性的情況,我們很快會談及這個話題。在這個案例中,對于選定的數據點,模型預測此人收入超過 5 萬美元的置信度為 73%。該工具自動找出數據集中與此最相似的人(模型預測其收入少于 5 萬美元),并將二者進行并排比較。在此案例中,只需對年齡和職業作出微小的改變,模型的預測就會出現大幅變化。

反事實對比

表現和算法公平性分析

您也可以探索不同分類閾值的影響,并考慮不同數值公平性標準等限制條件。下方的屏幕截圖展示了微笑檢測模型的結果,該模型使用開源CelebA 數據集(由帶注解的名人面部圖像組成)進行訓練。在下圖中,我們根據頭發是否為棕色,將數據集中的面部圖像分成兩組,并為其中每組繪制一條ROC 曲線和預測結果的混淆矩陣,同時提供滑塊,設定模型必須在達到一定的置信度,才會判定是否為微笑的面部圖像。在此案例中,該工具自動為兩組設置了置信度閾值,以優化模型,從而實現機會均等。

比較兩組數據在微笑檢測模型上的表現,并將其分類閾值設置為滿足 “機會均等” 限制條件

演示

為了說明 What-If 工具的功能,我們發布了一組使用預訓練模型的演示:

檢測錯誤分類:這是一種多分類模型,通過對植物花朵的四次測量來預測植物種類。該工具有助于顯示模型的決策邊界和導致錯誤分類的原因。該模型使用UCI 鳶尾花數據集進行訓練。

評估二進制分類模型的公平性:這是上文提及的微笑檢測圖像分類模型。該工具有助于評估不同子組的算法公平性。在訓練模型的過程中,為了展示該工具如何幫助揭示模型中的此類偏見,我們特意沒有提供來自特定人群子集的任何示例。評估公平性需要謹慎考慮整體環境,但這是很有用的量化起點。

研究不同子組的模型表現:這是根據人口普查信息預測對象年齡的回歸模型。該工具有助于展示模型在不同子組的相對表現,以及不同特點如何分別影響預測結果。該模型使用UCI 人口普查數據集進行訓練。

What-If 的實際應用

我們與 Google 內部團隊一起測試了 What-If 工具的表現,從中看到這個工具的直接價值。有一個團隊很快發現,他們的模型錯誤地忽略了數據集的一個整體特點,進而修復了之前并未發現的代碼錯誤。另一個團隊使用該工具將其示例按表現最佳到最差進行直觀排列,進而發現表現不佳的模型示例類型有何模式。我們希望 Google 內部和外部的人士都能使用此工具,以更好地理解 ML 模型,并開始評估其公平性。此外,由于此代碼是開源的,我們歡迎大家為該工具的發展添磚加瓦。

致謝

What-If 是眾人合作的成果,其成功離不開 Mahima Pushkarna 設計的用戶體驗,Jimbo Wilson 對 Facets 作出的更新,還有許多其他人提供的意見。我們想感謝測試此工具并提供寶貴反饋的 Google 團隊,還要感謝 TensorBoard 團隊的一切幫助。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8419

    瀏覽量

    132674
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24710

原文標題:What-If 工具:無需寫代碼,即可測試機器學習模型

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    揭秘為什么Cloud TPU編寫自定義估算器模型

    在本文中,我會逐步介紹編寫自定義估算器以便在 Cloud TPU 上運行的全過程。
    的頭像 發表于 09-20 09:46 ?5016次閱讀

    使用什么API編寫具有已知UUID兩者的自定義服務特性?

    和CyByLyIASStValueValueValuy()API。在我的例子中有自定義服務和個特性(4字節)問題1。應該使用什么API編寫
    發表于 10-19 16:01

    zynq自定義ip中的時鐘頻率是多少?

    嗨,我正在使用zynq zc702,我設計了幾個自定義ip,它們用verilog模塊編寫,并且將駐留在PL部分,現在我的設計工作正常,ps和pl通信意味著即用自定義ip的arm完成..
    發表于 03-04 13:02

    我可以編寫自定義代碼控制沒有Motor Pilot的電機嗎?

    我得到了 MCSDK 示例,但我怎樣才能更進步?我可以編寫自定義代碼控制沒有 Motor Pilot 的電機嗎?[STEVAL-SPIN
    發表于 12-22 07:31

    找到個文檔描述不同的錯誤代碼對CAN FD模塊意味著什么?

    我試圖找到個文檔描述不同的錯誤代碼對 CAN FD 模塊意味著什么。有沒有人知道從哪里搜索的鏈接或想法?我的 CAN FD 外設在某個時候以錯誤狀態 516 告終,我無法找到它的含
    發表于 02-03 06:44

    STATCOM自定義建模及動穩態調壓分析

    STATCOM自定義建模及動穩態調壓分析:建立了statcom基于功率注入法的穩態模型和基于受控電流源的動態模型,并利用電力系統分析軟件提供
    發表于 03-18 16:09 ?18次下載

    SOPC中自定義外設和自定義指令性能分析

    SOPC中自定義外設和自定義指令性能分析 NiosII是個建立在FPGA上的嵌入式軟核處理器,靈活性很強。作為體現NiosII靈活性精髓的兩個最主要方面,自
    發表于 03-29 15:12 ?1610次閱讀
    SOPC中<b class='flag-5'>自定義</b>外設和<b class='flag-5'>自定義</b>指令性能<b class='flag-5'>分析</b>

    DOS下自定義時間重啟

    DOS環境下,C語言編寫自定義時間重啟。
    發表于 03-16 09:40 ?6次下載

    RTWconfigurationguide基于模型設計—自定義

    基于模型設計—自定義目標系統配置指南,RTW自動代碼生成相關資料。
    發表于 05-17 16:41 ?3次下載

    AVR編寫1602自定義字符

    AVR編寫自定義字符不錯的練習題目
    發表于 03-20 14:21 ?1次下載

    iOS自定義轉場動畫例程與需要注意的問題

    controller (出現的那個) 個動畫控制器 自定義轉場和在自定義之前樣。對于push和pop,意味著調用UINavigatio
    發表于 09-26 16:41 ?0次下載
    iOS<b class='flag-5'>自定義</b>轉場動畫例程與需要注意的問題

    淺析Zephyr應用的代碼結構中的自定義驅動

    項目納入到應用代碼目錄管理 Zephyr應用的代碼結構--自定義開發板: 將自定義board納入到應用代碼目錄管理 除了上面兩個
    的頭像 發表于 08-18 09:08 ?4799次閱讀

    自定義視圖組件教程案例

    自定義組件 1.自定義組件-particles(粒子效果) 2.自定義組件- pulse(脈沖button效果) 3.自定義組件-progress(progress效果) 4.
    發表于 04-08 10:48 ?14次下載

    大型語言模型(LLM)的自定義訓練:包含代碼示例的詳細指南

    近年來,像 GPT-4 這樣的大型語言模型 (LLM) 因其在自然語言理解和生成方面的驚人能力而受到廣泛關注。但是,要根據特定任務或領域定制LLM,定制培訓是必要的。本文提供了有關自定義訓練 LLM 的詳細分步指南,其中包含
    發表于 06-12 09:35 ?2768次閱讀

    自定義算子開發

    個完整的自定義算子應用過程包括注冊算子、算子實現、含自定義算子模型轉換和運行含自定義op模型
    的頭像 發表于 04-07 16:11 ?2812次閱讀
    <b class='flag-5'>自定義</b>算子開發
    主站蜘蛛池模板: 老司机精品免费视频| 性夜影院爽黄a爽免费看网站| 色天使久久| 天天操天天操天天操天天操| 欧美xxxxx喷潮| 欧美成年性色mmm| 国产综合在线观看视频| 97视频hd| 九九99视频在线观看视频观看| 四虎影院观看视频在线观看| 又粗又长又爽又长黄免费视频| 久草免费色站| 午夜在线观看网站| 精品伊人久久大线蕉地址| 久久999| 成人欧美一区二区三区| 久久午夜宅男免费网站| 日本午夜视频| 下农村女人一级毛片| 乱码一区二区三区完整视频| 办公室桌震娇喘视频大全在线| 一级美女片| 性欧美另类| 亚洲一区在线播放| avtt亚洲一区中文字幕| 午夜欧美日韩| 欧美日剧在线免费| 日本一区二区三区四区不卡 | 国产女乱淫真高清免费视频| 欧美日韩国产一区二区| 靓装爱神12丝袜在线播放| cum4k在线| 最近观看免费高清视频| 成人看片免费无限观看视频| 午夜视频在线观看网站| 国产又粗又大又爽又免费| 亚洲一级免费视频| 亚洲欧美日韩色图| 亚洲网色| 欧美性狂猛xxxxxbbbbb| 啊用力太猛了啊好深视频免费|