如何通過XGBoost解釋機(jī)器學(xué)習(xí)

本文為大家介紹用XGBoost解釋機(jī)器學(xué)習(xí)。

這是一個故事，關(guān)于錯誤地解釋機(jī)器學(xué)習(xí)模型的危險以及正確解釋所帶來的價值。如果你發(fā)現(xiàn)梯度提升或隨機(jī)森林之類的集成樹模型具有很穩(wěn)定的準(zhǔn)確率，但還是需要對其進(jìn)行解釋，那我希望你能從這篇文章有所收獲。

假定我們的任務(wù)是預(yù)測某人的銀行財務(wù)狀況。模型越準(zhǔn)確，銀行就越賺錢，但由于該預(yù)測要用于貸款申請，所以我們必須要提供預(yù)測背后的原因解釋。在嘗試了幾種類型的模型之后，我們發(fā)現(xiàn)XGBoost實現(xiàn)的梯度提升樹能提供最佳的準(zhǔn)確率。不幸的是，很難解釋為何XGBoost做出某個決策，所以我們只有兩種選擇：要么退回到線性模型，要么搞清楚如何解釋XGBoost模型。沒有數(shù)據(jù)科學(xué)家愿意在準(zhǔn)確率上讓步，于是我們決定挑戰(zhàn)自己，去解釋復(fù)雜的XGBoost模型（本例中，是6棵深達(dá)1247層的樹）。

經(jīng)典的全局特征重要性度量

首先一個顯而易見的選擇是使用XGBoost中Python 接口提供的plot_importance（）方法。它給出一個簡單明了的柱狀圖，表示數(shù)據(jù)集中每個特征的重要性（復(fù)現(xiàn)結(jié)果的代碼在Jupyter notebook中）。

圖：該模型在經(jīng)典的成人普查數(shù)據(jù)集上被訓(xùn)練用于預(yù)測人們是否會報告超過5萬美元的收入（使用logistic loss），上圖是執(zhí)行xgboost.plot_importance（model）的結(jié)果

仔細(xì)看一下XGBoost返回的特征重要性，我們發(fā)現(xiàn)年齡在所有特征中占統(tǒng)治地位，成為收入最重要的預(yù)測指標(biāo)。我們可以止步于此，向領(lǐng)導(dǎo)報告年齡這個直觀且讓人滿意的指標(biāo)是最重要的特征，緊隨其后的是每周工作時長和受教育程度這些特征。但是，作為一名好的數(shù)據(jù)科學(xué)家，我們查詢了一下文檔，發(fā)現(xiàn)在XGBoost中衡量特征重要性有3個選項：

1. Weight。某個特征被用于在所有樹中拆分?jǐn)?shù)據(jù)的次數(shù)

2. Cover。同上，首先得到某個特征被用于在所有樹中拆分?jǐn)?shù)據(jù)的次數(shù)，然后要利用經(jīng)過這些拆分點的訓(xùn)練數(shù)據(jù)數(shù)量賦予權(quán)重

3. Gain。使用某個特征進(jìn)行拆分時，獲得的平均訓(xùn)練損失減少量

這些是在任何基于樹的建模包中都能找到的重要性度量。Weight是默認(rèn)選項，因此我們也試試另外兩種方法，看看有何不同：

圖：運行xgboost.plot_importance，并使用參數(shù) importance_type=’cover’和’gain’的結(jié)果

結(jié)果令人詫異，對于XGBoost提供的3個選項，特征重要性的排序都大不相同。對于cover方法，資本收益似乎是收入最重要的預(yù)測指標(biāo)，而對于gain方法，關(guān)系狀態(tài)特征獨占鰲頭。不知道哪種方法最好的情況下，依靠這些度量來報告特征重要性，這很讓人不爽。

什么因素決定了特征重要性度量的好壞？

如何比較兩種特征歸因（feature attribution）方法并不明顯。我們可以在諸如數(shù)據(jù)清洗，偏差檢測等任務(wù)上測量每種方法的最終用戶性能。但這些任務(wù)僅僅是特征歸因方法質(zhì)量的間接度量。這里，定義兩個我們認(rèn)為任何好的特征歸因方法都應(yīng)遵循的屬性：

1. 一致性（Consistency）。當(dāng)我們更改模型以使其更多依賴于某個特征時，該特征的重要性不應(yīng)該降低。

2. 準(zhǔn)確性（Accuracy）。所有特征重要性的和應(yīng)該等于模型的總體重要性。例如，如果重要性由R^2值來衡量，則每個特征的歸因值加起來應(yīng)該等于整個模型的R^2。

如果一致性不滿足，那我們就無法比較任意兩個模型的特征重要性，因為此時分配到更高的歸因并不意味著模型對此特征有更多依賴。

如果準(zhǔn)確性不滿足，那我們就不知道每個特征的歸因是如何合并起來以代表整個模型的輸出。我們不能簡單的對歸因進(jìn)行歸一化，因為這可能會破壞該方法的一致性。

當(dāng)前的歸因方法是否一致且準(zhǔn)確？

回到之前銀行數(shù)據(jù)科學(xué)家的工作。我們意識到一致性和準(zhǔn)確性很重要。實際上，如果一個方法不具備一致性，我們就無法保證擁有最高歸因的特征是最重要的特征。因此，我們決定使用兩個與銀行任務(wù)無關(guān)的樹模型來檢查各個方法的一致性：

圖：在兩個特征上的簡單樹模型。咳嗽顯然在模型B中比模型A中更重要。

模型的輸出是根據(jù)某人的癥狀而給出的風(fēng)險評分。模型A僅僅是一個用于發(fā)燒和咳嗽兩個特征的簡單“and”函數(shù)。模型B也一樣，只不過只要有咳嗽癥狀，就加10分。為了檢查一致性，我們需要定義“重要性”。此處，我們用兩種方式定義重要性：

1）作為當(dāng)我們移除一組特征時，模型預(yù)期準(zhǔn)確率的變化。

2）作為當(dāng)我們移除一組特征時，模型預(yù)期輸出的變化。

第一個定義度量了特征對模型的全局影響。而第二個定義度量了特征對單次預(yù)測的個性化影響。在上面簡單的樹模型中，當(dāng)發(fā)燒和咳嗽同時發(fā)生時對于兩種定義，咳嗽特征在模型B中明顯都更重要。

銀行例子中的Weight，cover和gain方法都是全局特征歸因方法。當(dāng)在銀行部署模型時，我們還需要針對每個客戶的個性化說明。為了檢查一致性，我們在簡單的樹模型上運行6種不同的特征歸因方法：

1. Tree SHAP。我們提出的一種新的個性化度量方法。

2. Saabas。一種個性化的啟發(fā)式特征歸因方法。

3. Mean（ |Tree SHAP| ）。基于個性化Tree SHAP平均幅度的一種全局歸因方法。

4. Gain，上述XGBoost使用的相同方法，等同于scikit-learn樹模型中使用的Gini重要性度量。

5. 拆分次數(shù)（Split Count）。代表XGBoost中緊密相關(guān)的’weight’和’cover’方法，但使用’weight’方法來計算。

6. 排列（Permutation）。當(dāng)在測試集中隨機(jī)排列某個特征時，導(dǎo)致模型準(zhǔn)確率的下降。

圖：使用6種不同方法對模型A和B做特征歸因。截止發(fā)文時間，這些方法代表了文獻(xiàn)中所有關(guān)于樹模型的特征歸因方法。

從圖上可知，除了permutation方法外，其余方法都是不一致的。因為它們在模型B中比在模型A中給咳嗽分配的重要性更少。不一致的方法無法被信任，它無法正確地給最有影響力的特征分配更多的重要性。細(xì)心的讀者會發(fā)現(xiàn)，之前我們在同一模型上使用經(jīng)典的歸因方法產(chǎn)生矛盾時，這種不一致已經(jīng)顯現(xiàn)。對于準(zhǔn)確性屬性呢？事實證明，Tree SHAP，Sabaas和 Gain 都如先前定義的那樣準(zhǔn)確，而permutation和split count卻不然。

令人驚訝的是，諸如gain（Gini重要性）之類廣泛使用的方法居然會導(dǎo)致如此明顯的不一致。為了更好地理解為何會發(fā)生這種情況，我們來仔細(xì)看看模型A和B中的gain是如何計算的。簡單起見，我們假設(shè)每個葉子節(jié)點中落有25%的數(shù)據(jù)集，并且每個模型的數(shù)據(jù)集都具有與模型輸出完全匹配的標(biāo)簽。

如果我們用均方誤差MSE作為損失函數(shù)，則在模型A中進(jìn)行任何拆分之前，MSE是1200。這是來自恒定平均預(yù)測20的誤差。在模型A中用發(fā)燒特征拆分后，MSE降到了800，因此gain方法將此400的下降歸因于發(fā)燒特征。然后用咳嗽特征再次拆分，會得到MSE為0，gain方法會把這次800的下降歸因于咳嗽特征。同理，在模型B中，800歸因于發(fā)燒，625歸因于咳嗽。

圖：模型A和模型B的gain（又稱基尼重要性）得分計算。

通常，我們期望靠近樹根的特征比葉子節(jié)點附近的特征更重要（因為樹就是貪婪地被構(gòu)造的）。然而gain方法偏向于將更多的重要性歸因于較低的拆分。這種偏見導(dǎo)致了不一致性，即咳嗽應(yīng)該更重要時（在樹根處拆分），給它歸因的重要性實際卻在下降。個性化的Saabas方法（被treeinterpreter包所使用）在我們從上到下遍歷樹時計算預(yù)測的差異，它也同樣受偏見影響，即偏向較低的拆分。隨著樹加深，這種偏見只會加劇。相比之下，Tree SHAP方法在數(shù)學(xué)上等價于對特征所有可能的排序上的預(yù)測差異求均值，而不僅僅是按照它們在樹中的位置順序。

只有Tree SHAP既一致又準(zhǔn)確這并不是巧合。假設(shè)我們想要一種既一致又準(zhǔn)確的方法，事實證明只有一種分配特征重要性的方法。詳細(xì)介紹在我們最近的NIPS論文中，簡單來講，從博弈論中關(guān)于利潤公平分配的證明引出了機(jī)器學(xué)習(xí)中特征歸因方法的唯一結(jié)果。在勞埃德·沙普利（Lloyd Shapley）于1950年代推導(dǎo)出它們之后，這些唯一的值被稱為沙普利值（Shapley values）。我們在這里使用的SHAP值是把與Shapley值相關(guān)的幾種個性化模型解釋方法統(tǒng)一而來的。Tree SHAP是一種快速算法，可以精確地在多項式時間內(nèi)為樹計算SHAP值，而不是在傳統(tǒng)的指數(shù)運行時間內(nèi)（請參閱arXiv）。

充滿信心地解釋我們的模型

扎實的理論依據(jù)和快速實用的算法相結(jié)合，使SHAP值成為可靠地解釋樹模型（例如XGBoost的梯度提升機(jī)）的強(qiáng)大工具。有了這個新方法，讓我們回到解釋銀行XGBoost模型的任務(wù)：

圖：全局Mean（ |Tree SHAP| ）方法應(yīng)用到收入預(yù)測模型上。x軸是當(dāng)某個特征從模型中’隱藏’時模型輸出的平均幅度變化（對于此模型，輸出具有l(wèi)og-odds單位）。詳細(xì)信息，請參見論文。但是“隱藏”是指將變量集成到模型之外。由于隱藏特征的影響會根據(jù)其他隱藏特征而變化，因此使用Shapley值可迫使一致性和準(zhǔn)確性。

圖上可看出，關(guān)系特征實際上是最重要的，其次是年齡特征。由于SHAP值保證了一致性，因此我們無需擔(dān)心之前在使用gain或split count方法時發(fā)現(xiàn)的種種矛盾。不過，由于我們現(xiàn)在有為每個人提供的個性化說明，我們還可以做的更多，而不只是制作條形圖。我們可以在數(shù)據(jù)集中給每個客戶繪制特征重要性。shap Python包使此操作變得容易。我們首先調(diào)用shap.TreeExplainer（model）.shap_values（X）來解釋每個預(yù)測，然后調(diào)用shap.summary_plot（shap_values，X）來繪制以下解釋：

圖：每個客戶在每一行上都有一個點。點的x坐標(biāo)是該特征對客戶模型預(yù)測的影響，而點的顏色表示該特征的值。不在行上的點堆積起來顯示密度（此示例中有32，561個客戶）。由于XGBoost模型具有l(wèi)ogistic loss，因此x軸具有l(wèi)og-odds單位（Tree SHAP解釋了模型的邊距輸出變化）。

這些特征按mean（| Tree SHAP |）排序，因此我們再次看到關(guān)系這個特征被視為年收入超過5萬美元的最強(qiáng)預(yù)測因子。通過繪制特征對每個樣本的影響，我們還可以看到重要的異常值影響。例如，雖然資本收益并不是全局范圍內(nèi)最重要的特征，但對于部分客戶而言，它卻是最重要的特征。按特征值著色為我們顯示了一些模式，例如，年紀(jì)較淺會降低賺取超過 5萬美元的機(jī)會，而受高等教育程度越高，賺取超過5萬美元的機(jī)會越大。

我們可以停下來將此圖展示給老板，但這里咱們來更深入地研究其中一些特征。我們可以通過繪制年齡SHAP值（log odds的變化）與年齡特征值的關(guān)系來實現(xiàn)：

圖：y軸是年齡特征改變多少每年賺取5萬美元以上的log odds。x軸是客戶的年齡。每個點代表數(shù)據(jù)集中的一個客戶。

在這里，我們看到了年齡對對收入潛力的明顯影響。請注意，與傳統(tǒng)的部分依賴圖（其顯示當(dāng)更改特征值時的平均模型輸出）不同，這些SHAP依賴圖顯示了相互影響。即使數(shù)據(jù)集中的許多人是20歲，但年齡對他們的預(yù)測的影響程度卻有所不同，正如圖中20歲時點的垂直分散所示。這意味著其他特征正在影響年齡的重要性。為了了解可能是什么特征在影響，我們用受教育的年限給點涂上顏色，并看到高水平的教育會降低20歲時的年齡影響，而在30歲時會提高影響：

圖：y軸是年齡特征改變多少每年賺取5萬美元以上的log odds。x軸是客戶的年齡。Education-Num是客戶已接受的教育年限。

如果我們對每周的工作小時數(shù)做另一個依賴圖，我們會發(fā)現(xiàn)，多投入時間工作的好處在每周約50個小時時達(dá)到瓶頸，而如果你已婚，則額外工作不太可能代表更高收入：

圖：每周工作時間與工作時間數(shù)對收入潛力的影響。

解釋你自己的模型

這篇文章整個分析過程旨在模擬你在設(shè)計和部署自己的模型時可能要經(jīng)歷的過程。shap包很容易通過pip進(jìn)行安裝，我們希望它可以幫助你放心地探索模型。它不僅包含本文涉及的內(nèi)容，還包括SHAP交互值，模型不可知的SHAP值估算，以及其他可視化。還有很多notebooks來展示在各種有趣的數(shù)據(jù)集上的各種功能。例如，你可以在一個notebook中根據(jù)體檢報告數(shù)據(jù)來分析你將來最可能的死亡原因，這個notebook解釋了一個XGBoost死亡率模型。對于Python以外的其他語言，Tree SHAP也已直接合并到核心XGBoost和LightGBM軟件包中。
編輯：hfy

閱讀全文

機(jī)器學(xué)習(xí)(130423) 機(jī)器學(xué)習(xí)(130423)
隨機(jī)森林(4231) 隨機(jī)森林(4231)
XGBoost(2168) XGBoost(2168)

機(jī)器學(xué)習(xí)模型可解釋性的結(jié)果分析

模型的可解釋性是機(jī)器學(xué)習(xí)領(lǐng)域的一個重要分支，隨著 AI 應(yīng)用范圍的不斷擴(kuò)大，人們越來越不滿足于模型的黑盒特性，與此同時，金融、自動駕駛等領(lǐng)域的法律法規(guī)也對模型的可解釋性提出了更高的要求，在可解釋

2023-09-28 10:17:15

437

25個機(jī)器學(xué)習(xí)面試題，你都會嗎？

？為什么？（提示：空間復(fù)雜度）25. 為了構(gòu)建一個機(jī)器學(xué)習(xí)模型，你準(zhǔn)備了 100 個數(shù)據(jù)點和 5 種特征。為了減少偏差，你又引入了 5 個特征變量，并且又收集了 100 個數(shù)據(jù)點。請解釋這種方法是否正確。（提示：機(jī)器學(xué)習(xí)會遇到的（維度）災(zāi)難，你聽說過嗎？）`

2018-09-29 09:39:54

機(jī)器學(xué)習(xí)與軟件平臺的融合

本文將探討機(jī)器學(xué)習(xí)與軟件平臺的融合。

2021-01-28 06:36:35

機(jī)器學(xué)習(xí)的創(chuàng)新/開發(fā)和應(yīng)用能力

機(jī)器學(xué)習(xí)的未來在工業(yè)領(lǐng)域采用機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)和大數(shù)據(jù)工業(yè)人工智能生態(tài)系統(tǒng)

2020-12-16 07:47:35

機(jī)器學(xué)習(xí)的基礎(chǔ)內(nèi)容

系列文章目錄提示：這里可以添加系列文章的所有文章的目錄，目錄需要自己手動添加例如：第一章 Python 機(jī)器學(xué)習(xí)入門之pandas的使用提示：寫完文章后，目錄可以自動生成，如何生成可參考右邊的幫助

2022-02-09 06:47:38

機(jī)器學(xué)習(xí)的未來

機(jī)器學(xué)習(xí)的未來在工業(yè)領(lǐng)域采用機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)和大數(shù)據(jù)

2021-01-27 06:02:18

機(jī)器學(xué)習(xí)簡介與經(jīng)典機(jī)器學(xué)習(xí)算法人才培養(yǎng)

上課時間安排：2022年05月27日 — 2022年05月30日No.1 第一天一、機(jī)器學(xué)習(xí)簡介與經(jīng)典機(jī)器學(xué)習(xí)算法介紹什么是機(jī)器學(xué)習(xí)？機(jī)器學(xué)習(xí)框架與基本組成機(jī)器學(xué)習(xí)的訓(xùn)練步驟機(jī)器學(xué)習(xí)問題的分類

2022-04-28 18:56:07

機(jī)器學(xué)習(xí)能通過類似「指紋辨識」的方式識別出代碼的編寫者

機(jī)器學(xué)習(xí)技術(shù)，開發(fā)出一套可以通過解析原始代碼和經(jīng)過編譯的二進(jìn)制代碼，來找出原作者的系統(tǒng)。該系統(tǒng)的開發(fā)者向 Wired 解釋，只要先提供作者撰寫的代碼給該系統(tǒng)作為學(xué)習(xí)范例，即便只是部分片段，它就能解析該

2018-08-14 09:48:32

機(jī)器學(xué)習(xí)能診斷病情，還能預(yù)測患者出院后的情況？

通過XGBoost數(shù)據(jù)包實現(xiàn)。由于愛算法的良好的執(zhí)行速度和魯棒性，一直是機(jī)器學(xué)習(xí)競賽中流行使用的算法。使用XGBoots另一個動機(jī)是微調(diào)超參數(shù)以提升模型性能的能力。在訓(xùn)練數(shù)據(jù)中，使用十折交叉驗證

2018-05-07 15:29:44

機(jī)器人技術(shù)和機(jī)器學(xué)習(xí)

機(jī)器人技術(shù)和機(jī)器學(xué)習(xí)正成為嵌入式系統(tǒng)硬件和軟件供應(yīng)商的下一個重大事件。嵌入式系統(tǒng)可以通過網(wǎng)絡(luò)連接和物聯(lián)網(wǎng)（IoT）來傳遞信息、共享資源。無論是智能，低能耗，邊緣設(shè)備，中間網(wǎng)關(guān)還是計算節(jié)點，都需要

2021-12-20 06:03:10

機(jī)器人工程師學(xué)習(xí)計劃

如何定義機(jī)器人？機(jī)器人工程師學(xué)習(xí)計劃分享

2021-12-20 06:11:57

通過Excel表格來學(xué)習(xí)機(jī)器學(xué)習(xí)算法

五步解析機(jī)器學(xué)習(xí)難點—梯度下降【轉(zhuǎn)】

2019-09-27 11:12:18

通過OpenCV(4.2.0) 運行NXP eIQ機(jī)器學(xué)習(xí)時報錯？

當(dāng)我嘗試通過 OpenCV(4.2.0) 運行 NXP eIQ 機(jī)器學(xué)習(xí)時出現(xiàn)以下錯誤在拋出 [947.599867] 審計實例后調(diào)用終止：type=1701 audit (16

2023-06-05 08:14:26

Labview機(jī)器學(xué)習(xí)

請問Labview機(jī)器學(xué)習(xí)工具箱里有SVM，BP等工具，如果自己用SVR做了一個回歸，可以用Labview實現(xiàn)嗎？這方面的小白，跟各位老師請教一下

2019-10-28 11:11:09

Linux查看內(nèi)存命令及解釋

我們通過Linux查看內(nèi)存free命令查看機(jī)器空閑內(nèi)存時，會發(fā)現(xiàn)free的值很小。下面我們就來了解學(xué)習(xí)下Linux查看內(nèi)存的命令和對這些命令的解釋，這樣大家更能夠深刻理解我們的Linux查看內(nèi)存命令

2019-07-24 06:18:24

MATLAB圖像處理及機(jī)器學(xué)習(xí) 入門交流

深度學(xué)習(xí)交流大群： 372526178 （課件資料共享，加群備注楊春嬌邀請）MATLAB與機(jī)器學(xué)習(xí)大群: 626611806 （加群備注楊春嬌邀請）

2018-09-12 10:44:56

Microchip的機(jī)器學(xué)習(xí)開發(fā)工具有哪些

Microchip的機(jī)器學(xué)習(xí)開發(fā)工具

2020-11-25 07:58:55

PyInstaller打包xgboost算法包等可能出現(xiàn)問題是什么

PyInstaller 打包 xgboost算法包等可能出現(xiàn)問題

2020-07-16 14:35:43

Python機(jī)器學(xué)習(xí)常用庫

歡迎的編程語言！人工智能是當(dāng)前最熱門話題之一，機(jī)器學(xué)習(xí)技術(shù)是人工智能實現(xiàn)必備技能，Python編程語言含有最有用的機(jī)器學(xué)習(xí)工具和庫，以下是Python開發(fā)工程師必知的十大機(jī)器學(xué)習(xí)庫！一

2018-03-26 16:29:41

[轉(zhuǎn)]物聯(lián)網(wǎng)和機(jī)器學(xué)習(xí)究竟有哪些真實應(yīng)用價值？

的所有炒作帶來的難以消除的噪聲，我們可能并沒有認(rèn)清它們的真實價值。在本文中，作者將解釋機(jī)器學(xué)習(xí)目前在物聯(lián)網(wǎng)領(lǐng)域的應(yīng)用情況和相關(guān)使用案例。上圖為Gartner2016新興技術(shù)成熟度曲線，機(jī)器學(xué)習(xí)處于技術(shù)

2017-04-19 11:01:42

【下載】《機(jī)器學(xué)習(xí)》+《機(jī)器學(xué)習(xí)實戰(zhàn)》

`1.機(jī)器學(xué)習(xí)簡介：機(jī)器學(xué)習(xí)是計算機(jī)科學(xué)與人工智能的重要分支領(lǐng)域. 本書作為該領(lǐng)域的入門教材，在內(nèi)容上盡可能涵蓋機(jī)器學(xué)習(xí)基礎(chǔ)知識的各方面。為了使盡可能多的讀者通過本書對機(jī)器學(xué)習(xí)有所了解, 作者試圖

2017-06-01 15:49:24

人工智能和機(jī)器學(xué)習(xí)的前世今生

如何傳授給計算機(jī)的過程。任何機(jī)器使用算法以智能方式執(zhí)行任務(wù)，這就是展現(xiàn)的人工智能。機(jī)器學(xué)習(xí)是人工智能的一個子集。它是關(guān)于機(jī)器從一組數(shù)據(jù)中學(xué)習(xí)的能力。通過信息處理的這種學(xué)習(xí)增強(qiáng)了算法，從而提供更好的評估

2018-08-27 10:16:55

什么是機(jī)器學(xué)習(xí)? 機(jī)器學(xué)習(xí)基礎(chǔ)入門

是將提供的兩個數(shù)字相乘。圖2。有了機(jī)器學(xué)習(xí)，我們就有了數(shù)據(jù)(輸入)和答案(輸出) ，并且需要計算機(jī)通過確定輸入和輸出如何以對整個數(shù)據(jù)集為真的方式相互關(guān)聯(lián)來推導(dǎo)出一種排序算法假設(shè)我使用一個簡單的示例來定義

2022-06-21 11:06:37

介紹機(jī)器學(xué)習(xí)的基礎(chǔ)內(nèi)容

2021-08-13 07:39:46

使用 Python 開始機(jī)器學(xué)習(xí)

在這篇文章中我們會講Python的重要特征和它適用于機(jī)器學(xué)習(xí)的原因，介紹一些重要的機(jī)器學(xué)習(xí)包，以及其他你可以獲取更詳細(xì)資源的地方。為什么用Python做機(jī)器學(xué)習(xí)Python很適合用于機(jī)器學(xué)習(xí)。首先

2018-12-11 18:37:19

可解釋的機(jī)器學(xué)習(xí)——打開機(jī)器學(xué)習(xí)黑匣子

【資源下載】《可解釋的機(jī)器學(xué)習(xí)》，打開機(jī)器學(xué)習(xí)黑匣子

2020-05-20 14:16:57

基于xgboost的風(fēng)力發(fā)電機(jī)葉片結(jié)冰分類預(yù)測精選資料下載

xgboost中文叫做極致梯度提升模型，官方文檔鏈接：https://xgboost.readthedocs.io/en/latest/tutorials/model.html2018年9月6日筆記

2021-07-12 06:44:28

基于xgboost的風(fēng)力發(fā)電機(jī)葉片結(jié)冰分類預(yù)測精選資料分享

xgboost中文叫做極致梯度提升模型，官方文檔鏈接：https://xgboost.readthedocs.io/en/latest/tutorials/model.html2018年9月6日筆記

2021-07-12 06:58:59

基于深度學(xué)習(xí)技術(shù)的智能機(jī)器人

機(jī)器代替人類勞動，而機(jī)器都是從基本工具逐步發(fā)展而來的。所以，在說明人工智能技術(shù)之前，我們先了解一下自動化技術(shù)是怎么發(fā)展而來的。1、什么是自動化技術(shù)？換一種解釋，自動化技術(shù)就是機(jī)器通過接收某一種信號

2018-05-31 09:36:03

如何學(xué)習(xí)機(jī)器學(xué)習(xí)

【吳恩達(dá)機(jī)器學(xué)習(xí)】學(xué)習(xí)筆記13（Normal Equation& 與梯度下降比較）

2020-04-26 11:05:59

如何使用Arm CMSIS-DSP實現(xiàn)經(jīng)典機(jī)器學(xué)習(xí)庫

和循環(huán)，而那很難解釋它們是如何達(dá)到它們的結(jié)論。 機(jī)器學(xué)習(xí)領(lǐng)域包括神經(jīng)網(wǎng)絡(luò)以外的技術(shù)。其他技術(shù)可能以不同的名稱使用，例如統(tǒng)計機(jī)器 學(xué)習(xí)。在本指南中，我們使用經(jīng)典機(jī)器學(xué)習(xí)這個名稱來指代這些方法

2023-08-02 07:12:59

如何在STM板上使用機(jī)器學(xué)習(xí)算法對通過工業(yè)傳感器獲取的氣體傳感器數(shù)據(jù)進(jìn)行分類？

我想在 STM 板上使用機(jī)器學(xué)習(xí)算法對通過工業(yè)傳感器獲取的氣體傳感器數(shù)據(jù)進(jìn)行分類。知道哪種 STM32 變體最適合此應(yīng)用嗎？

2023-01-10 07:10:16

如果只是應(yīng)用機(jī)器學(xué)習(xí)，而不是研究，需要哪些知識

如果只是應(yīng)用機(jī)器學(xué)習(xí)，而不是研究，需要哪些知識？還用深入學(xué)習(xí)數(shù)字么

2019-08-30 14:51:02

常用python機(jī)器學(xué)習(xí)庫盤點

，詞性的解析，分類，語義解釋，概率分析還有評估。2.scikit-learnPython社區(qū)里面機(jī)器學(xué)習(xí)模塊sklearn，內(nèi)置了很多算法,幾乎實現(xiàn)了所有基本機(jī)器學(xué)習(xí)的算法。Python機(jī)器學(xué)習(xí)庫主要

2018-05-10 15:20:21

怎樣實現(xiàn)平臺配置并解釋了為什么軟件重要

傻瓜式嵌入式機(jī)器學(xué)習(xí)設(shè)計-ARM特別版，展示了往任何設(shè)備添加機(jī)器學(xué)習(xí)不僅是可能的而且非常簡單。本書重點關(guān)注關(guān)鍵實現(xiàn)點并解釋為什么在計劃的早期這些點非常重要。這本書解釋了怎樣實現(xiàn)平臺配置并解釋了為什么軟件重要。最后，闡述了生態(tài)系統(tǒng)在機(jī)器學(xué)習(xí)中的重要性，且給出了在網(wǎng)絡(luò)邊緣使用機(jī)器學(xué)習(xí)的有趣例子。

2021-12-20 08:00:19

最值得學(xué)習(xí)的機(jī)器學(xué)習(xí)編程語言

如果你對人工智能和機(jī)器學(xué)習(xí)感興趣，而且正在積極地規(guī)劃著自己的程序員職業(yè)生涯，那么你肯定面臨著一個問題：你應(yīng)該學(xué)習(xí)哪些編程語言，才能真正了解并掌握 AI 和機(jī)器學(xué)習(xí)？可供選擇的語言很多，你需要通過戰(zhàn)略

2021-03-02 06:22:38

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)_99.17.4 XGBoost

GBBoost機(jī)器學(xué)習(xí)

深海狂鯊發(fā)布于 2022-10-29 11:44:58

什么是機(jī)器學(xué)習(xí)_十張圖帶你解析機(jī)器學(xué)習(xí)的基本概念

在解釋機(jī)器學(xué)習(xí)的基本概念的時候，我發(fā)現(xiàn)自己總是回到有限的幾幅圖中。以下是我認(rèn)為最有啟發(fā)性的條目列表。

2018-06-30 05:26:00

3292

機(jī)器學(xué)習(xí)學(xué)習(xí)迎來瓶頸期,未來3~5年都會人才緊缺

所以如果你有足夠的機(jī)器學(xué)習(xí)知識，并對特定領(lǐng)域有良好的理解，在職場供求中你肯定可以站在優(yōu)勢的那一邊。以我的另一個回答為例「阿薩姆：反欺詐（Fraud Detection）中所用到的機(jī)器學(xué)習(xí)模型有哪些？」，特定領(lǐng)域的知識幫助我們更好的解釋機(jī)器學(xué)習(xí)模型的結(jié)果，得到老板和客戶的認(rèn)可，這才是算法落了地。

2017-10-18 15:15:51

2617

通過學(xué)習(xí)PPT地址和xgboost導(dǎo)讀和實戰(zhàn)地址來對xgboost原理和應(yīng)用分析

關(guān)于xgboost的原理網(wǎng)絡(luò)上的資源很少，大多數(shù)還停留在應(yīng)用層面，本文通過學(xué)習(xí)陳天奇博士的PPT和xgboost導(dǎo)讀和實戰(zhàn)地址，希望對xgboost原理進(jìn)行深入理解。

2018-01-02 10:18:21

6186

讓機(jī)器人通過一段只有一個人的視頻來模仿學(xué)習(xí)

人類和動物在學(xué)習(xí)新行為時，大部分只需要觀察一次就能學(xué)會，然而想讓機(jī)器人學(xué)習(xí)就沒那么容易了。隨著計算機(jī)視覺的發(fā)展，目前的技術(shù)能讓機(jī)器人依靠人體姿勢檢測系統(tǒng)，模仿人類的動作進(jìn)行學(xué)習(xí)。不過每次都需要人類“做示范”未免有些麻煩，本篇論文的研究人員們想出了新方法：讓機(jī)器人通過一段只有一個人的視頻來模仿學(xué)習(xí)。

2018-02-07 14:25:15

5802

一文讀懂機(jī)器學(xué)習(xí)的線性代數(shù)（10案例）

它是機(jī)器學(xué)習(xí)的重要基礎(chǔ)，從描述算法操作的符號到代碼中算法的實現(xiàn)，都屬于該學(xué)科的研究范圍。雖然線性代數(shù)是機(jī)器學(xué)習(xí)領(lǐng)域不可或缺的一部分，但二者的緊密關(guān)系往往無法解釋，或只能用抽象概念（如向量空間或特定矩陣運算）解釋。

2018-05-05 09:59:00

3369

什么是機(jī)器學(xué)習(xí)？機(jī)器學(xué)習(xí)能解決什么問題？（案例分析）

隨著大數(shù)據(jù)時代的到來，機(jī)器學(xué)習(xí)成為解決問題的一種重要且關(guān)鍵的工具。不管是工業(yè)界還是學(xué)術(shù)界，機(jī)器學(xué)習(xí)都是一個炙手可熱的方向，但是學(xué)術(shù)界和工業(yè)界對機(jī)器學(xué)習(xí)的研究各有側(cè)重，學(xué)術(shù)界側(cè)重于對機(jī)器學(xué)習(xí)

2018-05-18 13:13:00

15976

【通俗易懂】10幅圖解釋機(jī)器學(xué)習(xí)中的基本概念

以下的幾幅圖是我認(rèn)為在解釋機(jī)器學(xué)習(xí)基本概念時最有啟發(fā)性的條目列表。 1. Test and training error: 為什么低訓(xùn)練誤差并不總是一件好的事情呢：以模型復(fù)雜度為變量的測試及訓(xùn)練錯誤

2018-09-06 20:55:01

150

機(jī)器學(xué)習(xí)是什么？10幅圖帶你詳細(xì)的了解機(jī)器學(xué)習(xí)

本文的幾幅圖是我認(rèn)為在解釋機(jī)器學(xué)習(xí)基本概念時最有啟發(fā)性的條目列表。

2018-09-09 09:03:50

4579

Xilinx如何通過機(jī)器學(xué)習(xí)加速實時高清視頻的應(yīng)用

演示Xilinx如何通過機(jī)器學(xué)習(xí)加速實時高清視頻應(yīng)用的開發(fā)和部署。

2018-11-23 06:19:00

2361

機(jī)器學(xué)習(xí)教程之機(jī)器學(xué)習(xí)的十三個經(jīng)典課件資料免費下載

本文檔的主要內(nèi)容詳細(xì)介紹的是機(jī)器學(xué)習(xí)教程之機(jī)器學(xué)習(xí)的十三個經(jīng)典課件資料免費下載主要內(nèi)容包括了：1，引言 2，基于符號和邏輯表示的概念學(xué)習(xí) 3，決策樹 4，人工神經(jīng)網(wǎng)絡(luò) 5，統(tǒng)計和估計理論的基礎(chǔ)概念

2018-11-22 17:36:01

機(jī)器學(xué)習(xí)系統(tǒng)設(shè)計PDF版電子書免費下載

“機(jī)器學(xué)習(xí)本身很復(fù)雜，且在具體的數(shù)據(jù)分析實踐中涉及大量復(fù)雜的數(shù)學(xué)知識。而本書盡量避開編程與機(jī)器學(xué)習(xí)算法實現(xiàn)的復(fù)雜性，讓機(jī)器學(xué)習(xí)代碼盡量簡單。它的目的不是閘明機(jī)器學(xué)習(xí)是什么“，而是解釋‘如何’編寫算法，并幫助你思考‘什么是最好的編程方式。

2019-01-29 14:36:04

通過持續(xù)元學(xué)習(xí)解決傳統(tǒng)機(jī)器學(xué)習(xí)方式的致命不足

傳統(tǒng)機(jī)器學(xué)習(xí)正在凸顯它的不足。為了解決此問題，伯克利大學(xué)人工智能實驗室教授繼2017年提出元學(xué)習(xí)后，又提出在線元學(xué)習(xí)。不僅可以解決傳統(tǒng)學(xué)習(xí)的不足，同時也彌補了元學(xué)習(xí)缺乏持續(xù)學(xué)習(xí)的缺陷。

2019-03-04 14:20:02

1908

IBM通過機(jī)器學(xué)習(xí)診斷阿爾茨海默癥

3月12日消息，據(jù)美國IT網(wǎng)站ZDNet報道，IBM已將機(jī)器學(xué)習(xí)(ML)引入診斷領(lǐng)域，希望有一天這些技術(shù)可以對早發(fā)性阿爾茨海默癥進(jìn)行穩(wěn)定而有效的診斷。

2019-04-07 15:18:00

2256

面試中出現(xiàn)有關(guān)Xgboost總結(jié)

介紹 Xgboost是GB算法的高效實現(xiàn)，xgboost中的基學(xué)習(xí)器除了可以是CART（gbtree）也可以是線性分類器（gblinear）

2019-03-20 16:48:50

4271

XGBoost號稱“比賽奪冠的必備大殺器”，橫掃機(jī)器學(xué)習(xí)競賽罕逢敵手

XGBoost全稱：eXtreme Gradient Boosting，是一種基于決策樹的集成機(jī)器學(xué)習(xí)算法，使用梯度上升框架，適用于分類和回歸問題。優(yōu)點是速度快、效果好、能處理大規(guī)模數(shù)據(jù)、支持多種語言、支持自定義損失函數(shù)等，不足之處是因為僅僅推出了不足5年時間，需要進(jìn)一步的實踐檢驗。

2019-04-30 09:01:30

3765

通過Python就能讀懂機(jī)器學(xué)習(xí)

具體來說有四個方面的介紹，包括機(jī)器學(xué)習(xí)的定義、機(jī)器學(xué)習(xí)的起源，以及進(jìn)化反向、機(jī)器學(xué)習(xí)的分類和類別、最常用的機(jī)器學(xué)習(xí)算法，如何實現(xiàn)。

2019-05-14 14:31:02

2345

機(jī)器學(xué)習(xí)讓計算機(jī)更智能

近日，在“Google Solve with AI”活動上，Google 資深研究員、Google AI 負(fù)責(zé)人Jeff Dean發(fā)表演講時指出，機(jī)器學(xué)習(xí)是解釋AI最好的一個方法。

2019-07-11 16:46:27

2714

XGBoost原理概述 XGBoost和GBDT的區(qū)別

相比于經(jīng)典的GBDT，xgboost做了一些改進(jìn)，從而在效果和性能上有明顯的提升。

2019-07-16 18:54:45

77512

Explainable AI旨在提高機(jī)器學(xué)習(xí)模型的可解釋性

Google Cloud AI戰(zhàn)略總監(jiān)Tracy Frey在今天的博客中解釋說，Explainable AI旨在提高機(jī)器學(xué)習(xí)模型的可解釋性。她說，這項新服務(wù)的工作原理是量化每個數(shù)據(jù)因素對模型產(chǎn)生的結(jié)果的貢獻(xiàn)，幫助用戶了解其做出決定的原因。

2020-03-24 15:14:21

2655

利用SHAP實現(xiàn)機(jī)器學(xué)習(xí)模型的輸出預(yù)測

我最喜歡的庫之一是SHAP，它是解釋機(jī)器學(xué)習(xí)模型生成的輸出不可或缺的工具。 SHAP是幾種不同的當(dāng)前解釋模型的頂點，并且通過為每個特征分配重要性值來表示用于解釋模型預(yù)測的統(tǒng)一框架。反過來，可以繪制這些重要性值，并用于產(chǎn)生任何人都可以輕易解釋的漂亮可視化。

2020-05-04 18:09:00

7248

詳談機(jī)器學(xué)習(xí)的決策樹模型

決策樹模型是白盒模型的一種，其預(yù)測結(jié)果可以由人來解釋。我們把機(jī)器學(xué)習(xí)模型的這一特性稱為可解釋性，但并不是所有的機(jī)器學(xué)習(xí)模型都具有可解釋性。

2020-07-06 09:49:06

3073

人工智能和機(jī)器學(xué)習(xí)技術(shù)如何解釋數(shù)據(jù)？

當(dāng)今的業(yè)務(wù)由數(shù)據(jù)和數(shù)據(jù)驅(qū)動的理解所支配。您如何理解數(shù)據(jù)以及如何將數(shù)據(jù)解釋為業(yè)務(wù)決策直接影響您的業(yè)務(wù)轉(zhuǎn)換和增長。為了更精確地理解數(shù)據(jù)，如今我們擁有人工智能（AI）和機(jī)器學(xué)習(xí)（ML）技術(shù)。毫無疑問，這些模仿人類推理的技術(shù)可以積極地改變企業(yè)及其戰(zhàn)略。

2020-09-04 12:01:53

2414

如何解決機(jī)器學(xué)習(xí)技術(shù)所帶來的挑戰(zhàn)?

即使是簡單的機(jī)器學(xué)習(xí)項目，很多企業(yè)都在開始自己的旅程，只有解釋機(jī)器學(xué)習(xí)的積極意義，企業(yè)才有更多的動力采用。

2020-09-16 14:39:30

1724

如何理解人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)三者的區(qū)別

深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、人工智能——這些流行詞皆代表了分析學(xué)的未來。在這篇文章中，我們將通過一些真實世界的案例來解釋什么是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。在以后的文章中，我們將探索垂直用例。這樣做的目的不是要把

2020-11-03 15:36:26

2481

通過GPU加速機(jī)器學(xué)習(xí)

早期的機(jī)器學(xué)習(xí)以搜索為基礎(chǔ)，主要依靠進(jìn)行過一定優(yōu)化的暴力方法。但是隨著機(jī)器學(xué)習(xí)逐漸成熟，它開始專注于加速技術(shù)已經(jīng)很成熟的統(tǒng)計方法和優(yōu)化問題。同時深度學(xué)習(xí)的問世更是帶來原本可能無法實現(xiàn)的優(yōu)化方法。本文

2022-02-10 17:00:00

1845

挖掘軟磁鐵基非晶合金的性能“基因”—XGBoost算法大顯神通

來自北京科技大學(xué)新金屬材料國家重點實驗室和北京材料基因工程高精尖創(chuàng)新中心的呂昭平教授和劉雄軍教授團(tuán)隊提出了一種利用可解釋性的XGBoost機(jī)器學(xué)習(xí)算法輔助設(shè)計高熱穩(wěn)定性和高飽和磁感應(yīng)強(qiáng)度軟磁鐵基非晶合金的方法

2021-03-01 13:55:29

1360

基于機(jī)器學(xué)習(xí)算法的水文趨勢預(yù)測方法

針對傳統(tǒng)的利用神經(jīng)網(wǎng)絡(luò)等工具進(jìn)行水文趨勢預(yù)測得出結(jié)果不具備解釋性等不足，文中提出一種基于機(jī)器學(xué)習(xí)算法的水文趨勢預(yù)測方法，該方法旨在利用 XGBOOST機(jī)器學(xué)習(xí)算法建立參照期與水文預(yù)見期之間各水文特征

2021-04-26 15:39:30

基于遺傳算法和隨機(jī)森林的XGBoost改進(jìn)方法

回歸預(yù)測是機(jī)器學(xué)習(xí)中重要的研究方向之一，有著廣闊的應(yīng)用領(lǐng)域。為了進(jìn)一步提升回歸預(yù)測的精度，提出了基于遺傳算法與隨機(jī)森林的 Gboost改進(jìn)方法（ GA Xgboost_RF）。首先利用遺傳算法

2021-04-26 15:44:44

基于Xgboost算法的高錳鋼表面粗糙度預(yù)測

基于Xgboost算法的高錳鋼表面粗糙度預(yù)測

2021-06-19 15:09:41

關(guān)于單片機(jī)內(nèi)存解釋的整理(學(xué)習(xí)筆記篇)

關(guān)于單片機(jī)內(nèi)存解釋的整理(學(xué)習(xí)筆記篇)

2021-11-20 11:51:06

《計算機(jī)研究與發(fā)展》—機(jī)器學(xué)習(xí)的可解釋性

伴隨著模型復(fù)雜度的增加，機(jī)器學(xué)習(xí)算法的可解釋性越差，至今，機(jī)器學(xué)習(xí)的可解釋性依舊是個難題.通過算法訓(xùn)練出的模型被看作成黑盒子，嚴(yán)重阻礙了機(jī)器學(xué)習(xí)在某些特定領(lǐng)域的使用，譬如醫(yī)學(xué)、金融等領(lǐng)域.目前針對機(jī)器學(xué)習(xí)的可解釋性綜

2022-01-25 08:35:36

790

關(guān)于機(jī)器學(xué)習(xí)模型的六大可解釋性技術(shù)

本文介紹目前常見的幾種可以提高機(jī)器學(xué)習(xí)模型的可解釋性的技術(shù)。

2022-02-26 17:20:19

1831

機(jī)器學(xué)習(xí)模型的可解釋性算法詳解

本文介紹目前常見的幾種可以提高機(jī)器學(xué)習(xí)模型的可解釋性的技術(shù)，包括它們的相對優(yōu)點和缺點。

2022-02-16 16:21:31

3986

人工智能的透明度和可解釋性義務(wù)

　　SHAP 聚類提供了機(jī)器學(xué)習(xí)模型的局部、全局和組級決策的解釋。這里提供的擴(kuò)展允許對解釋進(jìn)行進(jìn)一步分析。這允許從業(yè)者為基于機(jī)器學(xué)習(xí)的決策構(gòu)建一個敘述和解釋，以滿足業(yè)務(wù)、監(jiān)管和客戶需求。

2022-04-07 09:12:23

2275

使用可解釋機(jī)器學(xué)習(xí)構(gòu)建多樣化投資組合

　　對形狀值進(jìn)行聚類的想法基于 EU Horizon 項目FIN-TECH中最成功的 AI 用例，發(fā)布為可解釋機(jī)器學(xué)習(xí)在信用風(fēng)險管理中的應(yīng)用。它

2022-04-07 09:20:48

1296

可解釋機(jī)器學(xué)習(xí)

可解釋機(jī)器學(xué)習(xí)

2022-06-17 14:41:05

在幾個AWS實例上運行的XGBoost和LightGBM的性能比較

XGBoost（eXtreme Gradient Boosting）是一個在Gradient Boosting Decision Tree（GBDT）框架下的開源機(jī)器學(xué)習(xí)庫（https://github.com/dmlc/xgboost）。

2022-10-24 10:24:22

1009

機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)中的實際應(yīng)用

　　機(jī)器學(xué)習(xí)被證明對幾乎每個行業(yè)都是有益的，包括網(wǎng)絡(luò)行業(yè)。機(jī)器學(xué)習(xí)可以幫助解決棘手的舊網(wǎng)絡(luò)障礙，并刺激新的網(wǎng)絡(luò)應(yīng)用程序，使網(wǎng)絡(luò)非常方便。讓我們通過幾個用例詳細(xì)討論基本工作流，以更好地了解網(wǎng)絡(luò)域中的應(yīng)用機(jī)器學(xué)習(xí)技術(shù)。

2022-11-18 17:21:36

544

機(jī)器學(xué)習(xí)技術(shù)的理論背景

近年來，所謂的深度學(xué)習(xí)范式徹底改變了機(jī)器學(xué)習(xí)領(lǐng)域。深度學(xué)習(xí)通過解決以前傳統(tǒng)模式識別方法無法解決的挑戰(zhàn)，對機(jī)器學(xué)習(xí)社區(qū)產(chǎn)生了巨大影響（LeCun et al. 2015）。深度學(xué)習(xí)的引入極大地提高了

2022-12-02 14:53:35

1005

機(jī)器學(xué)習(xí)模型的可解釋性算法匯總

目前很多機(jī)器學(xué)習(xí)模型可以做出非常好的預(yù)測，但是它們并不能很好地解釋他們是如何進(jìn)行預(yù)測的，很多數(shù)據(jù)科學(xué)家都很難知曉為什么該算法會得到這樣的預(yù)測結(jié)果。這是非常致命的，因為如果我們無法知道某個算法是如何進(jìn)行預(yù)測，那么我們將很難將其前一道其它的問題中，很難進(jìn)行算法的debug。

2023-02-03 11:34:06

1038

可以提高機(jī)器學(xué)習(xí)模型的可解釋性技術(shù)

本文介紹目前常見的幾種可以提高機(jī)器學(xué)習(xí)模型的可解釋性的技術(shù)，包括它們的相對優(yōu)點和缺點。

2023-02-08 14:08:52

861

KUKA使用SUBMIT解釋器

SUBMIT 解釋器與機(jī)器人解釋器和 I/O 管理器共享系統(tǒng)功率，其中，機(jī)器人解釋器和 I/O 管理器具有更高的優(yōu)先級。因此，SUBMIT 解釋器不會定期在機(jī)器人控制系統(tǒng)的 12 ms 插值周期內(nèi)連續(xù)運行。

2023-03-08 11:22:18

2539

新手必看的機(jī)器學(xué)習(xí)的方法合集

機(jī)器學(xué)習(xí)的本質(zhì)，其實就是模仿人類大腦進(jìn)行學(xué)習(xí)的過程，通過讓機(jī)器模仿這種學(xué)習(xí)過程實現(xiàn)所謂的“智能”。

2023-03-29 11:06:03

898

通過機(jī)器學(xué)習(xí)發(fā)現(xiàn)規(guī)則

希望機(jī)器學(xué)習(xí)將取代基于規(guī)則的系統(tǒng)是沒有根據(jù)的。后者通常比復(fù)雜的機(jī)器學(xué)習(xí)模型更高效、更便宜。由于企業(yè)總是對效率視而不見，基于規(guī)則的系統(tǒng)將繼續(xù)存在。

2023-05-04 11:13:54

431

機(jī)器學(xué)習(xí)理論：k近鄰算法

KNN(k-Nearest Neighbors)思想簡單，應(yīng)用的數(shù)學(xué)知識幾乎為0，所以作為機(jī)器學(xué)習(xí)的入門非常實用、可以解釋機(jī)器學(xué)習(xí)算法使用過程中的很多細(xì)節(jié)問題。能夠更加完整地刻畫機(jī)器學(xué)習(xí)應(yīng)用的流程。

2023-06-06 11:15:02

392

XGBoost超參數(shù)調(diào)優(yōu)指南

對于XGBoost來說，默認(rèn)的超參數(shù)是可以正常運行的，但是如果你想獲得最佳的效果，那么就需要自行調(diào)整一些超參數(shù)來匹配你的數(shù)據(jù)，以下參數(shù)對于XGBoost非常重要

2023-06-15 18:15:26

572

詳細(xì)解釋XGBoost中十個最常用超參數(shù)

對于XGBoost來說，默認(rèn)的超參數(shù)是可以正常運行的，但是如果你想獲得最佳的效果，那么就需要自行調(diào)整一些超參數(shù)來匹配你的數(shù)據(jù)

2023-06-19 17:31:28

844

高效理解機(jī)器學(xué)習(xí)

來源：DeepNoMind對于初學(xué)者來說，機(jī)器學(xué)習(xí)相當(dāng)復(fù)雜，可能很容易迷失在細(xì)節(jié)的海洋里。本文通過將機(jī)器學(xué)習(xí)算法分為三個類別，梳理出一條相對清晰的路線，幫助初學(xué)者理解機(jī)器學(xué)習(xí)算法的基本原理，從而更高

2023-05-08 10:24:39

322

XGBoost中無需手動編碼的分類特征

XGBoost 中無需手動編碼的分類特征

2023-07-05 16:30:37

231

機(jī)器學(xué)習(xí)可以分為哪幾類？機(jī)器學(xué)習(xí)技術(shù)有哪些？

機(jī)器學(xué)習(xí)可以分為哪幾類？機(jī)器學(xué)習(xí)技術(shù)有哪些 機(jī)器學(xué)習(xí)（Machine Learning，ML）是一種通過自動化自我學(xué)習(xí)所增強(qiáng)的能力，從數(shù)據(jù)中獲取知識的方法。可以說，機(jī)器學(xué)習(xí)是在人工智能的支持下

2023-08-17 16:11:36

4060

機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的區(qū)別

的區(qū)別。 1. 機(jī)器學(xué)習(xí) 機(jī)器學(xué)習(xí)是指通過數(shù)據(jù)使機(jī)器能夠自動地學(xué)習(xí)和改進(jìn)性能的算法。機(jī)器學(xué)習(xí)是人工智能的一個重要分支，它通過一系列的訓(xùn)練樣本，讓機(jī)器從數(shù)據(jù)中學(xué)習(xí)規(guī)律，從而得出預(yù)測或決策。機(jī)器學(xué)習(xí)算法可以分為有監(jiān)督學(xué)習(xí)

2023-08-17 16:11:40

2734

機(jī)器學(xué)習(xí)算法匯總機(jī)器學(xué)習(xí)算法分類機(jī)器學(xué)習(xí)算法模型

機(jī)器學(xué)習(xí)算法匯總 機(jī)器學(xué)習(xí)算法分類 機(jī)器學(xué)習(xí)算法模型 機(jī)器學(xué)習(xí)是人工智能的分支之一，它通過分析和識別數(shù)據(jù)模式，學(xué)習(xí)從中提取規(guī)律，并用于未來的決策和預(yù)測。在機(jī)器學(xué)習(xí)中，算法是最基本的組成部分之一。算法

2023-08-17 16:11:48

632

機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是什么機(jī)器學(xué)習(xí)算法優(yōu)缺點

機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是什么?機(jī)器學(xué)習(xí)算法優(yōu)缺點? 機(jī)器學(xué)習(xí)算法總結(jié) 機(jī)器學(xué)習(xí)算法是一種能夠從數(shù)據(jù)中自動學(xué)習(xí)的算法。它能夠從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)特征，進(jìn)而對未知數(shù)據(jù)進(jìn)行分類、回歸、聚類等任務(wù)。通過

2023-08-17 16:11:50

939

機(jī)器學(xué)習(xí)算法入門機(jī)器學(xué)習(xí)算法介紹機(jī)器學(xué)習(xí)算法對比

機(jī)器學(xué)習(xí)算法入門 機(jī)器學(xué)習(xí)算法介紹 機(jī)器學(xué)習(xí)算法對比 機(jī)器學(xué)習(xí)算法入門、介紹和對比隨著機(jī)器學(xué)習(xí)的普及，越來越多的人想要了解和學(xué)習(xí)機(jī)器學(xué)習(xí)算法。在這篇文章中，我們將會簡單介紹機(jī)器學(xué)習(xí)算法的基本概念

2023-08-17 16:27:15

569

機(jī)器學(xué)習(xí)是什么意思？機(jī)器學(xué)習(xí)屬于什么分支？機(jī)器學(xué)習(xí)有什么用處？

機(jī)器學(xué)習(xí)是什么意思？機(jī)器學(xué)習(xí)屬于什么分支？機(jī)器學(xué)習(xí)是什么有什么用處？ 機(jī)器學(xué)習(xí)是指讓計算機(jī)通過經(jīng)驗來不斷優(yōu)化和改進(jìn)自身的算法和模型的過程。因此，機(jī)器學(xué)習(xí)可以被理解為是一種從數(shù)據(jù)中自動獲取規(guī)律和知識

2023-08-17 16:30:04

1148

機(jī)器學(xué)習(xí)theta是什么？機(jī)器學(xué)習(xí)tpe是什么？

解一下theta。在機(jī)器學(xué)習(xí)中，theta通常表示模型的參數(shù)。在回歸問題中，theta可能表示線性回歸的斜率和截距；在分類問題中，theta可能表示多項式模型的各項系數(shù)。這些參數(shù)通常是通過訓(xùn)練數(shù)據(jù)自動學(xué)習(xí)得到的，而不是手工設(shè)置的。在機(jī)器學(xué)習(xí)中，優(yōu)化theta是一

2023-08-17 16:30:08

1023

機(jī)器學(xué)習(xí)有哪些算法？機(jī)器學(xué)習(xí)分類算法有哪些？機(jī)器學(xué)習(xí)預(yù)判有哪些算法？

機(jī)器學(xué)習(xí)有哪些算法？機(jī)器學(xué)習(xí)分類算法有哪些？機(jī)器學(xué)習(xí)預(yù)判有哪些算法？ 機(jī)器學(xué)習(xí)是一種人工智能技術(shù)，通過對數(shù)據(jù)的分析和學(xué)習(xí)，為計算機(jī)提供智能決策。機(jī)器學(xué)習(xí)算法是實現(xiàn)機(jī)器學(xué)習(xí)的基礎(chǔ)。常見的機(jī)器學(xué)習(xí)算法

2023-08-17 16:30:11

1245

NNI：自動幫你做機(jī)器學(xué)習(xí)調(diào)參的神器

NNI 自動機(jī)器學(xué)習(xí)調(diào)參，是微軟開源的又一個神器，它能幫助你找到最好的神經(jīng)網(wǎng)絡(luò)架構(gòu)或超參數(shù)，支持各種訓(xùn)練環(huán)境。它常用的使用場景如下：想要在自己的代碼、模型中試驗不同的機(jī)器學(xué)習(xí)算法

2023-10-30 10:28:02

1662

XGBoost 2.0介紹

XGBoost是處理不同類型表格數(shù)據(jù)的最著名的算法，LightGBM 和Catboost也是為了修改他的缺陷而發(fā)布的。近日XGBoost發(fā)布了新的2.0版，本文除了介紹讓XGBoost的完整歷史以外

2023-11-03 10:12:27

220

詳解XGBoost 2.0重大更新！

另外還有一點是基于樹的模型可以輕松地可視化和解釋，這進(jìn)一步增加了吸引力，特別是在理解表格數(shù)據(jù)結(jié)構(gòu)時。通過利用這些固有的優(yōu)勢，基于樹的方法——尤其是像XGBoost這樣的高級方法——非常適合處理數(shù)據(jù)科學(xué)中的各種挑戰(zhàn)，特別是在處理表格數(shù)據(jù)時。

2023-11-14 16:22:38

226

已全部加載完成

搜索歷史

如何通過XGBoost解釋機(jī)器學(xué)習(xí)

評論