在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習的6個關鍵概念

汽車玩家 ? 來源:今日頭條 ? 作者:聞數(shù)起舞 ? 2020-04-14 17:12 ? 次閱讀

機器學習是一種將傳統(tǒng)數(shù)學與現(xiàn)代強大的計算處理相結合的技術,以學習數(shù)據(jù)集中固有的模式。 在機器學習中,目標是產(chǎn)生一種可以使用這些模式執(zhí)行某些指定任務的算法

在監(jiān)督式機器學習的情況下,目標可能是開發(fā)一個模型,該模型可以識別一組輸入所屬的類別或類別,或預測連續(xù)值,例如房屋價格。

在本文中,我將介紹機器學習中的一些關鍵概念。 如果您是機器學習的新手,這將使您對本領域中使用的一些術語和技術有一個很好的了解。

1.特征

在機器學習中,我們上面討論的輸入稱為特征。 要素是分配給數(shù)據(jù)點的一組屬性。

以下示例數(shù)據(jù)集是著名的數(shù)據(jù)集,通常用于機器學習實踐問題(稱為"波士頓住房價格")。 它由一組與房屋相關的功能(在下圖中以紅色突出顯示)組成,例如年齡,平均房間數(shù)和物業(yè)稅值以及相應的房價。

為了使機器學習模型成功完成其任務,至少其中一些功能與房屋價格之間需要存在統(tǒng)計關系。

機器學習的6個關鍵概念

> Boston housing prices dataset — features are highlighted red

2.特征選擇與工程

優(yōu)化機器學習模型的重要一步是優(yōu)化。 我們開發(fā)的模型需要以最佳狀態(tài)執(zhí)行,而要確保做到這一點的一種方法是使用最佳功能來訓練模型。

包括每個特征并不總是有用的。 有些特征可能與我們嘗試預測的變量沒有有意義的統(tǒng)計關系,而另一些特征可能彼此緊密相關。 這兩種情況都將噪聲引入訓練階段,這可能會降低模型性能。 特征選擇是選擇最佳特征以包含在訓練階段中的過程。

同樣,原始形式的特征可能無法提供足夠的有意義的數(shù)據(jù)來訓練性能模型。 另外,某些特征根本不能以其原始形式使用,一個很好的例子就是基于日期/時間的功能。 機器學習模型不能使用日期或時間戳作為特征,我們需要首先從日期中導出有意義的特征,才能包含此信息。 我們可以使用整數(shù)形式的日期部分(例如月,日或星期數(shù)),或計算兩個日期之間的差,以提供算法可以理解的模式。 這就是所謂的特征工程。

3.標簽

有監(jiān)督的機器學習需要一些被稱為標記數(shù)據(jù)的東西。 這意味著每組要素都具有相應標簽的數(shù)據(jù)。 這些標簽可以是類別或類型(例如貓或狗),也可以是連續(xù)值,例如在波士頓房屋價格數(shù)據(jù)集中以標簽為價格的情況。

在開發(fā)機器學習模型時,功能通常稱為X,標簽稱為y。

機器學習的6個關鍵概念

> Boston housing prices dataset — labels are highlighted red

4.訓練

監(jiān)督式機器學習需要標記數(shù)據(jù),因為算法使用這些示例特征值及其對應的標記來"學習"模式,如果成功,則將使模型能夠準確地預測新的未標記數(shù)據(jù)上的標記。

在機器學習過程中,學習的這一階段稱為訓練階段。 在此階段結束時,您將擁有一個可用于預測新的未標記數(shù)據(jù)的標簽或值的模型。 訓練階段通常稱為擬合模型。

5.調(diào)參

在本文前面介紹功能選擇時,我曾討論過一個優(yōu)化過程。 此過程的另一部分稱為調(diào)參,涉及優(yōu)化算法參數(shù)以找到適合您特定數(shù)據(jù)集的最佳組合。

所有機器學習模型都包含具有多種選項的參數(shù)。 例如,隨機森林模型具有許多可調(diào)參數(shù)。 一個示例是n_estimators,它確定森林中樹木的數(shù)量。 通常,樹的數(shù)量越多,結果越好,但是在特定點(并且這取決于數(shù)據(jù)集),隨著您添加更多的樹,改進會降低。 為您的數(shù)據(jù)集找到最佳樹數(shù)是一種調(diào)整隨機森林算法參數(shù)的方法。

每種算法都有許多可調(diào)參數(shù),并且每個參數(shù)都有大量潛在的選項。 幸運的是,有自動方法可以找到這些參數(shù)的最佳組合,這就是所謂的超參數(shù)優(yōu)化。

6.驗證

建立模型后,我們需要確定其執(zhí)行給定任務的能力。 在我們的示例數(shù)據(jù)中,我們將要了解模型可以多么準確地預測房屋價格。 在機器學習中,建立最佳性能指標很重要,這將根據(jù)我們要解決的問題而有所不同。

通常,在開始機器學習項目時,我們將首先將要使用的數(shù)據(jù)集分為兩部分。 我們一個用來訓練模型,另一個用于測試階段。

機器學習中的測試通常稱為驗證。 我們使用模型對保留的測試數(shù)據(jù)集進行預測,并測量所選的性能指標,以確定模型能夠很好地執(zhí)行給定任務。

本文概述了討論機器學習時最常用的一些術語和概念。 如果您剛剛開始學習,它應該可以幫助您了解機器學習教程中使用的一些術語。 如果您想深入學習使用python創(chuàng)建您的第一個模型,可以在這里閱讀我的教程"如何創(chuàng)建您的第一個機器學習模型"。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8424

    瀏覽量

    132761
收藏 人收藏

    評論

    相關推薦

    傳統(tǒng)機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習關鍵概念術語。在本文中,我們會介紹傳統(tǒng)機器學習的基礎知識和多
    的頭像 發(fā)表于 12-30 09:16 ?248次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    自然語言處理與機器學習的關系 自然語言處理的基本概念及步驟

    Learning,簡稱ML)是人工智能的一核心領域,它使計算機能夠從數(shù)據(jù)中學習并做出預測或決策。自然語言處理與機器學習之間有著密切的關系,因為
    的頭像 發(fā)表于 12-05 15:21 ?526次閱讀

    NPU與機器學習算法的關系

    緊密。 NPU的起源與特點 NPU的概念最早由谷歌在其TPU(Tensor Processing Unit)項目中提出,旨在為TensorFlow框架提供專用的硬件加速。NPU的設計目標是提高機器學習算法的運行效率,特別是在處理
    的頭像 發(fā)表于 11-15 09:19 ?507次閱讀

    eda在機器學習中的應用

    值和噪聲數(shù)據(jù)。通過繪制箱線圖、直方圖和散點圖,我們可以直觀地看到數(shù)據(jù)中的異常值和分布情況。例如,如果一數(shù)據(jù)集中的某個特征值遠高于其他值,這可能是一異常值,需要進一步調(diào)查。 2. 特征選擇 特征選擇 是機器
    的頭像 發(fā)表于 11-13 10:42 ?326次閱讀

    具身智能與機器學習的關系

    具身智能(Embodied Intelligence)和機器學習(Machine Learning)是人工智能領域的兩重要概念,它們之間存在著密切的關系。 1. 具身智能的定義 具身
    的頭像 發(fā)表于 10-27 10:33 ?407次閱讀

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一重要環(huán)節(jié),目標是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預測任務,可以
    發(fā)表于 08-14 18:00

    預訓練和遷移學習的區(qū)別和聯(lián)系

    預訓練和遷移學習是深度學習機器學習領域中的兩重要概念,它們在提高模型性能、減少訓練時間和降低
    的頭像 發(fā)表于 07-11 10:12 ?1107次閱讀

    如何理解機器學習中的訓練集、驗證集和測試集

    理解機器學習中的訓練集、驗證集和測試集,是掌握機器學習核心概念和流程的重要一步。這三者不僅構成了模型學習
    的頭像 發(fā)表于 07-10 15:45 ?4309次閱讀

    機器學習中的數(shù)據(jù)預處理與特征工程

    機器學習的整個流程中,數(shù)據(jù)預處理與特征工程是兩至關重要的步驟。它們直接決定了模型的輸入質(zhì)量,進而影響模型的訓練效果和泛化能力。本文將從數(shù)據(jù)預處理和特征工程的基本概念出發(fā),詳細探討這
    的頭像 發(fā)表于 07-09 15:57 ?472次閱讀

    遷移學習的基本概念和實現(xiàn)方法

    遷移學習(Transfer Learning)是機器學習領域中的一重要概念,其核心思想是利用在一
    的頭像 發(fā)表于 07-04 17:30 ?1776次閱讀

    人工神經(jīng)網(wǎng)絡與傳統(tǒng)機器學習模型的區(qū)別

    在人工智能領域,機器學習和神經(jīng)網(wǎng)絡是兩核心概念,它們各自擁有獨特的特性和應用場景。雖然它們都旨在使計算機系統(tǒng)能夠自動從數(shù)據(jù)中學習和提升,但
    的頭像 發(fā)表于 07-04 14:08 ?1390次閱讀

    人工智能、機器學習和深度學習是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機器學習(Machine Learning, ML)和深度學習(Deep Learning, DL)已成為
    的頭像 發(fā)表于 07-03 18:22 ?1327次閱讀

    機器學習在數(shù)據(jù)分析中的應用

    隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)量的爆炸性增長對數(shù)據(jù)分析提出了更高的要求。機器學習作為一種強大的工具,通過訓練模型從數(shù)據(jù)中學習規(guī)律,為企業(yè)和組織提供了更高效、更準確的數(shù)據(jù)分析能力。本文將深入探討機器
    的頭像 發(fā)表于 07-02 11:22 ?652次閱讀

    機器學習入門:基本概念介紹

    機器學習(GraphMachineLearning,簡稱GraphML)是機器學習的一分支,專注于利用圖形結構的數(shù)據(jù)。在圖形結構中,數(shù)據(jù)
    的頭像 發(fā)表于 05-16 08:27 ?521次閱讀
    圖<b class='flag-5'>機器</b><b class='flag-5'>學習</b>入門:基本<b class='flag-5'>概念</b>介紹

    機器學習怎么進入人工智能

    ,人工智能已成為一熱門領域,涉及到多個行業(yè)和領域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關鍵是使用機器學習算法,這是
    的頭像 發(fā)表于 04-04 08:41 ?344次閱讀
    主站蜘蛛池模板: 激情综合五月网| 性欧美日本| 色3344| www.五月婷婷.com| 欧美一级第一免费高清| 久久精品国产精品亚洲毛片 | 天天射天天拍| 在线观看日本免费视频大片一区| 成人三级毛片| 色玖玖| 色中色综合| 色综合天天综合网国产成人网| 正在播放国产巨作| 99热久久久久久久免费观看| 黄网站色视频免费看无下截| 国产天美| 国产免费一区二区三区香蕉精| 奇米影视7777久久精品| 手机在线观看一级午夜片| 欧美午夜一区| 国产精品美女www爽爽爽视频| yezhulu在线永久网址yellow | 黄色大秀| 久久免费观看国产精品| 午夜dy888理论在线播放| 成人国产激情福利久久精品| 国产黄色一级网站| 欧美性幼| kkkbo色综合| 视频在线欧美| 久久久五月天| 午夜在线观看免费| 狠狠操精品视频| 一区二区不卡免费视频| 中文字幕色网站| 日韩美毛片| 国产性较精品视频免费| 天天操天天看| 爱逼色| 天堂资源站| 国内亚州视频在线观看|