在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Google AI推出“what-if”工具,測試機器學習模型不用寫代碼!

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-09-24 08:54 ? 次閱讀

Google AI推出“what-if ”工具,用戶完全不需要編寫代碼就能分析機器學習模型。該工具提供交互式可視化界面,用戶可以探索并比較模型結果,可以快速地發現模型中的錯誤。

構建高效的機器學習系統,需要提出并解決許多問題。僅僅訓練模型然后就放著不管是遠遠不夠的。優秀的機器學習從業者要像偵探一樣,時刻注意探索如何更好地理解構建的模型:數據點的變化將對模型的預測結果造成什么影響?同一個模型對不同的群體會有哪些不同的表現?用來測試模型的數據集的多樣化程度如何等等。

要回答這些問題并不容易。要回答這些“假設”問題,通常要編寫自定義的一次性代碼來分析特定模型。這個過程不僅效率低下,而且除了程序員,其他人很難參與改進機器學習模型的過程。

Google AI PAIR計劃的一個重點就是讓更廣泛的人群能夠更方便地對機器學習系統進行檢查、評估和調試。

今天,我們正式發布What-If工具,該工具是開源的TensorBoard Web應用程序的一項新功能,它允許用戶在不編寫代碼的情況下分析機器學習模型。What-If工具給出了TensorFlow模型和數據集的指針,提供了一個交互式可視化界面,用于探索模型結果。

What-If工具顯示一組250張面部圖片及其檢測微笑模型的結果

What-If工具功能強大,可以使用Facets自動顯示數據集,從數據集手動編輯示例并查看更改的效果,還能自動生成部分依賴圖(partial dependence plots),顯示模型的預測結果隨任何單個功能的更改而變化的情況。

探索數據點上的What-if情景

下面詳細介紹What-If工具的兩個功能。

只需一鍵,自動對比數據點與模型預測最相似點

用戶只需單擊一個按鈕,就可以將數據點與模型預測不同結果的最相似點進行比較。我們稱這些點為“Counterfactuals”,可以顯示出預測模型的決策邊界。用戶也可以手動編輯數據點,并探索模型預測的變化。

在下面的截圖中,該工具用于二進制分類模型,該模型根據美國人口普查數據集的公共人口普查數據,預測一個人的年收入是否超過5萬美元。這是機器學習研究人員使用的基準預測任務,尤其是在分析算法的公平性時。

在這種情況下,對于選定的數據點,模型預測該人年收入超過5萬美元的信度為73%。該工具自動定位數據集中最相似的人,模型預測其年收入低于5萬美元,然后將選定數據點和與之最相似、但預測結果相反的數據點進行并排比較。如下圖所示,二者只有在年齡和職業上存在微小的差異,但模型的預測結果已經完全相反了。

對Counterfactuals的比較。二人只有在年齡和職業上存在微小的差異,但模型的預測結果已經完全相反

模型性能和算法公平性分析

用戶還可以探索不同分類閾值的影響,同時考慮不同數值公平性標準等約束條件。下圖所示為微笑探測器模型的結果,該模型在開源CelebA數據集上訓練,數據集是已標記的名人面部圖像。

下圖所示數據集中的面部圖像按照頭發是否為棕色分開,兩個圖像中的每一組都建立一條ROC曲線和一個預測結果的混淆矩陣,再設置一個置信度滑塊,設定模型必須在超過某一置信度時才能判定目標的面部是微笑的。本例中,What-If工具自動設置兩組的置信度閾值,以優化模型,實現機會均等。

使用What-if工具對微笑檢測模型兩部分數據的預測表現的比較,其中預測模型分類閾值設置滿足“機會公平”

檢測錯誤分類、評估模型公平性、調查模型不同數據集

為了說明What-if工具的功能,我們使用預先訓練的模型發布了一組Demo:

檢測錯誤分類:多類分類模型,模型根據對植物的花的四次觀測來預測植物的種類。What-if工具有助于顯示模型的決策邊界,弄清導致錯誤分類的原因。

評估二元分類模型的公平性:上面提到的用于微笑表情檢測的圖像分類模型。What-if工具有助于評估不同子圖像組的算法公平性。在該模型的訓練中,有意沒有提供來自特定人群的示例,目的是為了顯現What-if工具如何能夠揭示模型中的這種偏差。對模型預測公平性的評估需要仔細考慮整體背景,不過What-if工具是一個有用的量化起點。

調查模型在不同子群體中的表現:回歸模型可以用于根據人口普查信息預測受試者的年齡。What-if工具能顯示出模型在不同子群體中的相對表現,以及不同特征如何單獨影響預測結果。該模型使用美國人口普查數據集進行訓練。

What-If工具的實地應用

我們將What-If工具在Google內部團隊中進行了測試,該工具在測試中顯現出了直接價值。有團隊很快發現他們的模型錯誤地忽略了數據集的整個特征,修復了以前未發現的代碼錯誤。 還有團隊使用該工具將模型示例按性能高到低排列出來,并發現表現不佳的模型示例的運行模式。

我們期待Google內外的人們都來使用What-If工具,以更好地理解機器學習模型,并開始評估預測模型的公平性。 我們的代碼是開源的,歡迎對該工具繼續添磚加瓦。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Google
    +關注

    關注

    5

    文章

    1765

    瀏覽量

    57547
  • 代碼
    +關注

    關注

    30

    文章

    4789

    瀏覽量

    68639
  • 機器學習
    +關注

    關注

    66

    文章

    8419

    瀏覽量

    132675

原文標題:測試機器學習模型不用寫代碼!谷歌“what-if”工具輕松搞定

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI學習AI概論:(Part-A)與AI智慧交流

    任務一:電腦+AI(讓電腦擁有學習能力)目標:安裝Python和TensorFlow。安裝Keras、Numpy、OpenCV。安裝ResNet50人工智慧模組(模型)。 運行測試程序
    發表于 10-30 14:04

    AI概論: <TensorFlow + Excel>可操作教案(Part-C:AI(機器)是如何學習呢?)

    任務十四:從您孰悉的出發任務十五:認識AI術語-- 權重(Weight)任務十六:簡單的權重運算-- 兩兩相乘&求和任務十七:訓練(機器學習)-- AI開始任務十八:創作您的
    發表于 12-02 14:12

    部署基于嵌入的機器學習模型

    1、如何在生產中部署基于嵌入的機器學習模型  由于最近大量的研究,機器學習模型的性能在過去幾年里
    發表于 11-02 15:09

    如何通過cube-ai擴展將機器學習模型部署到STM32H743ZIT6?

    我正在嘗試通過 cube-ai 擴展將機器學習模型部署到 STM32H743ZIT6。該模型采用 .tflite 格式。當我嘗試分析
    發表于 12-30 08:57

    Google Kubernetes機器學習工具包Kubeflow發布0.1版

    Google自家推出的Kubernetes機器學習工具包Kubeflow終于發布了0.1版。 Googl
    發表于 05-17 08:17 ?1806次閱讀

    谷歌開源了一款工具名為What-If,無需編寫代碼就能分析一款機器學習模型

    What-If工具有多種功能,包括用Facets自動對你的數據集進行可視化、從數據集中手動編輯樣本的能力以及觀察這些變化帶來的影響、并且自動生成partial dependence plots,展示模型的預測是如何隨著單一特征的
    的頭像 發表于 09-24 08:57 ?3244次閱讀

    谷歌新推無程式碼機器學習模型分析工具

    機器學習模型訓練完成后,需要經過反覆的探索調校,What-If Tool不需撰寫任何程式碼,就能探索機器
    的頭像 發表于 09-14 14:47 ?2513次閱讀

    探索“What-If”場景通常意味著編寫一次性的自定義代碼來分析特定模型

    What-If 工具擁有各種功能,包括使用 Facets 自動可視化數據集、手動編輯數據集示例并查看相關更改的影響,以及自動生成局部依賴圖(顯示模型的預測結果如何隨任何單個功能的更改而變化)。下面詳細探索其中兩項功能。
    的頭像 發表于 10-11 11:31 ?3927次閱讀

    代碼也能玩轉人工智能 Uber宣布開源Ludwig

    Uber 宣布開源 Ludwig,一個基于 TensorFlow 的工具箱,該工具箱特點是不用代碼就能夠訓練和
    的頭像 發表于 02-26 08:47 ?2984次閱讀

    谷歌AI服務闡明了機器學習模型如何做出決策

    Google LLC已在其云平臺上推出了一項新的“可解釋AI”服務,旨在使機器學習模型做出決策的
    發表于 11-30 11:06 ?987次閱讀

    Google重磅發布開源庫TFQ,快速建立量子機器學習模型

    近日,Google 與滑鐵盧大學、大眾汽車等聯合發布 TensorFlow Quantum(TFQ),一個可快速建立量子機器學習模型原型的開源庫。
    的頭像 發表于 03-12 16:31 ?2781次閱讀
    <b class='flag-5'>Google</b>重磅發布開源庫TFQ,快速建立量子<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>模型</b>

    使用 NVIDIA TAO 工具套件和預訓練模型加快 AI 開發

    可以訪問預訓練模型的完整源代碼模型權重。 該工具套件能夠高效訓練視覺和對話式 AI 模型。由于
    的頭像 發表于 12-15 19:40 ?1028次閱讀

    如何評估機器學習模型的性能?機器學習的算法選擇

    如何評估機器學習模型的性能?典型的回答可能是:首先,將訓練數據饋送給學習算法以學習一個模型。第二
    發表于 04-04 14:15 ?1033次閱讀

    AI模型與傳統機器學習的區別

    AI模型與傳統機器學習在多個方面存在顯著的區別。以下是對這些區別的介紹: 一、模型規模與復雜度 AI
    的頭像 發表于 10-23 15:01 ?641次閱讀

    AI模型與深度學習的關系

    AI模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習AI
    的頭像 發表于 10-23 15:25 ?768次閱讀
    主站蜘蛛池模板: 怡红院网址| 欧美a网站| 狂野欧美性猛交xxxx免费| 欧美人与zoxxxx视频| 91啦视频在线| 色香欲亚洲天天综合网| 乱码一区二区三区完整视频| 中文字幕在线天堂| 午夜老司机福利| 日本写真高清视频免费网站网| 日韩怡红院| 美女被羞羞产奶视频网站| 欧美亚洲另类在线观看| 欧美五月| 青青草99热久久| 中文字幕一精品亚洲无线一区| 在线免费视频国产| 色婷婷基地| 精品视频免费看| 成人观看天堂在线影片| 天天搞夜夜爽| 插插操操| 嗯!啊!使劲用力在线观看| 亚洲精品你懂的| 人人看人人做人人爱精品| 天堂资源wwww在线看| 欧美一区二区精品| 国产精品一区二区三区四区| 闲人综合| 福利在线播放| 日本aaaaa| 熊出没之环球大冒险旧版免费观看 | 国内自拍网红在综合图区| hs视频在线观看| 久操视频网站| 日本不卡在线一区二区三区视频| 性殴美高清视频| 激情91| 欧美女同在线观看| 亚洲日本欧美日韩高观看| 五月天亚洲|