在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

XGBoost號稱“比賽奪冠的必備大殺器”,橫掃機器學習競賽罕逢敵手

DPVg_AI_era ? 來源:lq ? 2019-04-30 09:01 ? 次閱讀

XGBoost號稱“比賽奪冠的必備大殺器”,橫掃機器學習競賽罕逢敵手,堪稱機器學習算法中的新女王!

在涉及非結構化數據(圖像、文本等)的預測問題中,人工神經網絡顯著優于所有其他算法或框架。但當涉及到中小型結構/表格數據時,基于決策樹的算法現在被認為是最佳方法。而基于決策樹算法中最驚艷的,非XGBoost莫屬了。

打過Kaggle、天池、DataCastle、Kesci等國內外數據競賽平臺之后,一定對XGBoost的威力印象深刻。XGBoost號稱“比賽奪冠的必備大殺器”,橫掃機器學習競賽罕逢敵手。最近甚至有一位大數據/機器學習主管被XGBoost在項目中的表現驚艷到,盛贊其為“機器學習算法中的新女王”!

XGBoost最初由陳天奇開發。陳天奇是華盛頓大學計算機系博士生,研究方向為大規模機器學習。他曾獲得KDD CUP 2012 Track 1第一名,并開發了SVDFeature,XGBoost,cxxnet等著名機器學習工具,是Distributed (Deep) Machine Learning Common的發起人之一。

XGBoost實現了高效、跨平臺、分布式gradient boosting (GBDT, GBRT or GBM) 算法的一個庫,可以下載安裝并應用于C++Python,R,Julia,Java,Scala,Hadoop等。目前Github上超過15700星、6500個fork。

項目主頁:

https://XGBoost.ai/

XGBoost是什么

XGBoost全稱:eXtreme Gradient Boosting,是一種基于決策樹的集成機器學習算法,使用梯度上升框架,適用于分類和回歸問題。優點是速度快、效果好、能處理大規模數據、支持多種語言、支持自定義損失函數等,不足之處是因為僅僅推出了不足5年時間,需要進一步的實踐檢驗。

XGBoost選用了CART樹,數學公式表達XGBoost模型如下:

K是樹的數量,F表示所有可能的CART樹,f表示一棵具體的CART樹。這個模型由K棵CART樹組成。

模型的目標函數,如下所示:

XGBoost具有以下幾個特點:

靈活性:支持回歸、分類、排名和用戶定義函數

跨平臺:適用于Windows、Linux、macOS,以及多個云平臺

多語言:支持C++, Python, R, Java, Scala, Julia等

效果好:贏得許多數據科學和機器學習挑戰。用于多家公司的生產

云端分布式:支持多臺計算機上的分布式訓練,包括AWS、GCE、Azure和Yarn集群。可以與Flink、Spark和其他云數據流系統集成

下圖顯示了基于樹的算法的發展歷程:

決策樹:由一個決策圖和可能的結果(包括資源成本和風險)組成, 用來創建到達目標的規劃。

Bagging:是一種集合元算法,通過多數投票機制將來自多決策樹的預測結合起來,也就是將弱分離器 f_i(x) 組合起來形成強分類器 F(x) 的一種方法

隨機森林:基于Bagging算法。隨機選擇一個包含多種特性的子集來構建一個森林,或者決策樹的集合

Boosting:通過最小化先前模型的誤差,同時增加高性能模型的影響,順序構建模型

梯度上升:對于似然函數,要求最大值,叫做梯度上升

XGBoost:極端梯度上升,XGBoost是一個優化的分布式梯度上升庫,旨在實現高效,靈活和跨平臺

為什么XGBoost能橫掃機器學習競賽平臺?

下圖是XGBoost與其它gradient boosting和bagged decision trees實現的效果比較,可以看出它比R, Python,Spark,H2O的基準配置都快。

XGBoost和Gradient Boosting Machines(GBMs)都是集合樹方法,使用梯度下降架構來提升弱學習者(通常是CART)。而XGBoost通過系統優化和算法增強改進了基礎GBM框架,在系統優化和機器學習原理方面都進行了深入的拓展。

系統優化:

并行計算:

由于用于構建base learners的循環的可互換性,XGBoost可以使用并行計算實現來處理順序樹構建過程。

外部循環枚舉樹的葉節點,第二個內部循環來計算特征,這個對算力要求更高一些。這種循環嵌套限制了并行化,因為只要內部循環沒有完成,外部循環就無法啟動。

因此,為了改善運行時,就可以讓兩個循環在內部交換循環的順序。此開關通過抵消計算中的所有并行化開銷來提高算法性能。

Tree Pruning:

GBM框架內樹分裂的停止標準本質上是貪婪的,取決于分裂點的負損失標準。XGBoost首先使用'max_depth'參數而不是標準,然后開始向后修剪樹。這種“深度優先”方法顯著的提高了計算性能。

硬件優化:

該算法旨在有效利用硬件資源。這是通過在每個線程中分配內部緩沖區來存儲梯度統計信息來實現緩存感知來實現的。諸如“核外”計算等進一步增強功能可優化可用磁盤空間,同時處理不適合內存的大數據幀。

算法增強:

正則化:

它通過LASSO(L1)和Ridge(L2)正則化來懲罰更復雜的模型,以防止過擬合。

稀疏意識:

XGBoost根據訓練損失自動“學習”最佳缺失值并更有效地處理數據中不同類型的稀疏模式。

加權分位數草圖:

XGBoost采用分布式加權分位數草圖算法,有效地找到加權數據集中的最優分裂點。

交叉驗證:

該算法每次迭代時都帶有內置的交叉驗證方法,無需顯式編程此搜索,并可以指定單次運行所需的增強迭代的確切數量。

為了測試XGBoost到底有多快,可以通過Scikit-learn的'Make_Classification'數據包,創建一個包含20個特征(2個信息和2個冗余)的100萬個數據點的隨機樣本。

下圖為邏輯回歸,隨機森林,標準梯度提升和XGBoost效率對比:

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4777

    瀏覽量

    100954
  • 機器學習
    +關注

    關注

    66

    文章

    8428

    瀏覽量

    132841
  • 大數據
    +關注

    關注

    64

    文章

    8900

    瀏覽量

    137580

原文標題:陳天奇做的XGBoost為什么能橫掃機器學習競賽平臺?

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    傳統機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統機器
    的頭像 發表于 12-30 09:16 ?300次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優勢,逐漸成為企業構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發表于 12-25 11:54 ?134次閱讀

    【「嵌入式系統設計與實現」閱讀體驗】+ 學習一個STM32的案例

    《嵌入式系統設計與實現——第六屆全國大學生嵌入式芯片與系統設計競賽芯片應用賽道優秀作品剖析》一書的基本情況。今天來學習一個具體的案例。 這本書中意法半導體的案例是最多的,尤其是第二部分,占比極高,這也
    發表于 12-06 22:22

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統具有人的學習能力以便實現人工智能。因為沒有學習能力的系統很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發表于 11-16 01:07 ?460次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習機器
    的頭像 發表于 11-15 09:19 ?536次閱讀

    入門?畢設?競賽?項目練手?STM32/嵌入式/物聯網學習,有這幾款開發板就夠了!

    、項目練手、創新競賽、技能認證等。01STM32入門+項目進階學習適用場合高校教學、學生畢設、個人學習、項目練手、創新競賽、技術認證可學習
    的頭像 發表于 10-10 16:31 ?362次閱讀
    入門?畢設?<b class='flag-5'>競賽</b>?項目練手?STM32/嵌入式/物聯網<b class='flag-5'>學習</b>,有這幾款開發板就夠了!

    AMD贊助多支FIRST機器競賽團隊

    AMD 在 2024 賽季贊助了多支 FIRST 機器競賽團隊。FIRST 機器競賽旨在教導高中生如何構建能夠執行特定任務的機器人,同時
    的頭像 發表于 09-18 09:45 ?471次閱讀

    20.2-電磁桿在磁軌道的測試 零基礎入門智能車競賽 STM32電磁小車

    20.2-電磁桿在磁軌道的測試 零基礎入門智能車競賽 智能車競賽 電磁桿原理圖 電磁循跡小車 智能車電磁組 STM32電磁小車 電磁循跡小車 電磁循跡算法 智能車環島 智能車比賽規則 智能車
    的頭像 發表于 08-20 10:52 ?687次閱讀
    20.2-電磁桿在磁軌道的測試 零基礎入門智能車<b class='flag-5'>競賽</b> STM32電磁小車

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發表于 07-02 11:25 ?1215次閱讀

    深度學習與傳統機器學習的對比

    在人工智能的浪潮中,機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步,為眾多領域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發表于 07-01 11:40 ?1469次閱讀

    2020-2022-2024年TI杯全國大學生電子設計競賽官方推薦芯片對比分析比較

    2020-2022-2024年TI杯全國大學生電子設計競賽官方推薦芯片對比分析比較 一年一度的TI杯全國大學生設計競賽又正式拉開帷幕,器件清單一出來又忍不住對2024、2022年和2020年共3年
    發表于 06-25 10:25

    格靈深瞳斬獲首屆花樣滑冰動作識別競賽奪冠

    近日,第一屆花樣滑冰動作識別挑戰賽公布了本次競賽的結果,格靈深瞳憑借領先的算法能力斬獲了冠軍,并包攬了本次挑戰賽的前兩名。
    的頭像 發表于 05-13 14:04 ?435次閱讀
    格靈深瞳斬獲首屆花樣滑冰動作識別<b class='flag-5'>競賽</b><b class='flag-5'>奪冠</b>

    蘇州金龍榮獲首屆無人掃地機器人演示比賽“競技領跑獎”

    4月30日,2024年蘇州市首屆無人掃地機器人演示比賽在高新區思益街展開比拼。五家企業參賽在道路上實地比拼無人掃地機器人技術,通過清掃垃圾、識別路障等環節展現城市清潔的“未來場景”。經過角逐,蘇州
    的頭像 發表于 05-07 09:10 ?276次閱讀
    蘇州金龍榮獲首屆無人掃地<b class='flag-5'>機器</b>人演示<b class='flag-5'>比賽</b>“競技領跑獎”

    人工智能和機器學習的頂級開發板有哪些?

    機器學習(ML)和人工智能(AI)不再局限于高端服務或云平臺。得益于集成電路(IC)和軟件技術的新發展,在微型控制和微型計算機上實現機器
    的頭像 發表于 02-29 18:59 ?867次閱讀
    人工智能和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的頂級開發板有哪些?

    【技術科普】主流的深度學習模型有哪些?AI開發工程師必備

    深度學習在科學計算中獲得了廣泛的普及,其算法被廣泛用于解決復雜問題的行業。所有深度學習算法都使用不同類型的神經網絡來執行特定任務。 什么是深度學習 深度學習
    的頭像 發表于 01-30 15:26 ?656次閱讀
    【技術科普】主流的深度<b class='flag-5'>學習</b>模型有哪些?AI開發工程師<b class='flag-5'>必備</b>!
    主站蜘蛛池模板: 狠狠躁夜夜躁人人爽天天miya | 久久精品国产清自在天天线 | 久久久久国产 | 中国一级特黄剌激爽毛片 | 美国一级大黄香蕉片 | 色综合一区二区三区 | 色天天综合网 | 国产欧美日韩综合精品无毒 | 大色视频 | 久久婷婷综合五月一区二区 | 国产无限资源 | 午夜看片在线 | 在线免费视频网站 | 欧美日韩不卡码一区二区三区 | 大又大又粗又爽女人毛片 | 一级毛片不卡 | 四虎最新永久在线精品免费 | 黄视频日本 | 女人张开腿 让男人桶个爽 免费观看 | 操他射他影院 | 1024手机在线看片 | 国模视频在线 | 国内视频一区 | 1024你懂的在线播放欧日韩 | 国产成人午夜片在线观看 | tube亚洲高清老少配 | 成年视频在线观看 | 免费色网址| 九九热在线视频观看 | v视界影院最新网站 | 久久草在线播放 | 亚洲伊人久久大香线蕉结合 | 免费看大美女大黄大色 | 成人爽a毛片在线视频网站 成人窝窝午夜看片 | 奇米精品 | 丁香六月综合激情 | 一级特黄特黄xxx视频 | 欧美网站免费 | 看全色黄大色大片免费 | 精品国产理论在线观看不卡 | 三级成人网 |