在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

DPVg_AI_era ? 來源:未知 ? 作者:易水寒 ? 2018-05-27 09:59 ? 次閱讀

無監(jiān)督學習是機器學習技術中的一類,用于發(fā)現數據中的模式。本文介紹用Python進行無監(jiān)督學習的幾種聚類算法,包括K-Means聚類、分層聚類、t-SNE聚類、DBSCAN聚類等。

無監(jiān)督算法的數據沒有標注,這意味著只提供輸入變量(X),沒有相應的輸出變量。在無監(jiān)督學習中,算法自己去發(fā)現數據中有意義的結構。

Facebook首席AI科學家Yan Lecun解釋說,無監(jiān)督學習——即教機器自己學習,不需要明確地告訴它們所做的每一件事情是對還是錯,是“真正的”AI的關鍵。

監(jiān)督學習 VS 無監(jiān)督學習

在監(jiān)督學習中,系統(tǒng)試圖從之前給出的例子中學習。反之,在無監(jiān)督學習中,系統(tǒng)試圖從給出的例子中直接找到模式。因此,如果數據集有標記,那么它是有監(jiān)督問題,如果數據集無標記,那么它是一個無監(jiān)督問題。

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

如上圖,左邊是監(jiān)督學習的例子; 我們使用回歸技術來尋找特征之間的最佳擬合線。而在無監(jiān)督學習中,輸入是基于特征分離的,預測則取決于它屬于哪個聚類(cluster)。

重要術語

特征(Feature):用于進行預測的輸入變量。

預測(Predictions):當提供一個輸入示例時,模型的輸出。

示例(Example):數據集的一行。一個示例包含一個或多個特征,可能有標簽

標簽(Label):特征的結果。

為無監(jiān)督學習做準備

在本文中,我們使用Iris數據集(鳶尾花卉數據集)來進行我們的第一次預測。該數據集包含150條記錄的一組數據,有5個屬性——花瓣長度,花瓣寬度,萼片長度,萼片寬度和類別。三個類別分別是Iris Setosa(山鳶尾),Iris Virginica(維吉尼亞鳶尾)和Iris Versicolor(變色鳶尾)。對于我們的無監(jiān)督算法,我們給出鳶尾花的這四個特征,并預測它屬于哪一類。我們在Python中使用sklearn Library來加載Iris數據集,并使用matplotlib來進行數據可視化。以下是代碼片段。

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

紫羅蘭色:山鳶尾,綠色:維吉尼亞鳶尾,黃色:變色鳶尾

聚類(Clustering)

在聚類中,數據被分成幾個組。簡單地說,其目的是將具有相似特征的組分開,并將它們組成聚類。

可視化示例:

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

在上圖中,左邊的圖像是未完成分類的原始數據,右邊的圖像是聚類的(根據數據的特征對數據進行分類)。當給出要預測的輸入時,就會根據它的特征在它所屬的聚類中進行檢查,并做出預測。

Python中的K-Means聚類

K-Means是一種迭代聚類算法,它的目的是在每次迭代中找到局部最大值。首先,選擇所需數量的聚類。由于我們已經知道涉及3個類,因此我們通過將參數“n_clusters”傳遞到K-Means模型中,將數據分組為3個類。

現在,隨機將三個點(輸入)分成三個聚類。基于每個點之間的質心距離,下一個給定的輸入被分為所需的聚類。然后,重新計算所有聚類的質心。

聚類的每個質心是特征值的集合,定義生成的組。檢查質心特征權重可以定性地解釋每個聚類代表什么類型的組。

我們從sklearn庫導入K-Means模型,擬合特征并進行預測。

Python中的K Means實現:

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

分層聚類

顧名思義,分層聚類是一種構建聚類層次結構的算法。該算法從分配給它們自己的一個cluster的所有數據開始,然后將最近的兩個cluster加入同一個cluster。最后,當只剩下一個cluster時,算法結束。

分層聚類的完成可以使用樹狀圖來表示。下面是一個分層聚類的例子。 數據集可以在這里找到:https://raw.githubusercontent.com/vihar/unsupervised-learning-with-python/master/seeds-less-rows.csv

Python中的分層聚類實現:

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

K Means聚類與分層聚類的區(qū)別

分層聚類不能很好地處理大數據,但K Means聚類可以。因為K Means的時間復雜度是線性的,即O(n),而分層聚類的時間復雜度是二次的,即O(n2)。

在K Means聚類中,當我們從聚類的任意選擇開始時,多次運行算法產生的結果可能會有所不同。不過結果可以在分層聚類中重現。

當聚類的形狀是超球形時(如2D中的圓形,3D中的球形),K Means聚類更好。

K-Means聚類不允許嘈雜的數據,而在分層聚類中,可以直接使用嘈雜的數據集進行聚類。

t-SNE聚類

t-SNE聚類是用于可視化的無監(jiān)督學習方法之一。t-SNE表示t分布的隨機近鄰嵌入。它將高維空間映射到可以可視化的2或3維空間。具體而言,它通過二維點或三維點對每個高維對象進行建模,使得相似的對象由附近的點建模,而不相似的對象很大概率由遠離的點建模。

Python中的t-SNE聚類實現,數據集是Iris數據集:

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

這里Iris數據集具有四個特征(4d),它被變換并以二維圖形表示。類似地,t-SNE模型可以應用于具有n個特征的數據集。

DBSCAN聚類

DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪聲的基于密度的聚類方法)是一種流行的聚類算法,用作預測分析中 K-means的替代。它不要求輸入聚類的數值才能運行。但作為交換,你必須調整其他兩個參數。

scikit-learn實現提供了eps和min_samples參數的默認值,但這些參數通常需要調整。eps參數是在同一鄰域中考慮的兩個數據點之間的最大距離。min_samples參數是被認為是聚類的鄰域中的數據點的最小量。

Python中的DBSCAN聚類:

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

Python無監(jiān)督學習的幾種聚類算法包括K-Means聚類,分層聚類等詳細概述

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 聚類算法
    +關注

    關注

    2

    文章

    118

    瀏覽量

    12242
  • 機器學習
    +關注

    關注

    66

    文章

    8478

    瀏覽量

    133818
  • python
    +關注

    關注

    56

    文章

    4822

    瀏覽量

    85816
  • 無監(jiān)督學習

    關注

    1

    文章

    16

    瀏覽量

    2800

原文標題:【干貨】Python無監(jiān)督學習的4大聚類算法

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 1人收藏

    評論

    相關推薦

    深非監(jiān)督學習-Hierarchical clustering 層次python的實現

    【深度學習基礎-17】非監(jiān)督學習-Hierarchical clustering 層次-python實現
    發(fā)表于 04-28 10:07

    Web文檔k-means算法的改進

    Web文檔k-means算法的改進 介紹了Web文檔中普遍使用的、基于分割的
    發(fā)表于 09-19 09:17 ?1124次閱讀
    Web文檔<b class='flag-5'>聚</b><b class='flag-5'>類</b>中<b class='flag-5'>k-means</b><b class='flag-5'>算法</b>的改進

    K-means+算法研究綜述

    介紹了K-means 算法的目標函數、算法流程,并列舉了一個實例,指出了數據子集的數目K、初
    發(fā)表于 05-07 14:09 ?27次下載
    <b class='flag-5'>K-means</b>+<b class='flag-5'>聚</b><b class='flag-5'>類</b><b class='flag-5'>算法</b>研究綜述

    基于離散量改進k-means初始中心選擇的算法

    傳統(tǒng)kmeans算法由于初始中心的選擇是隨機的,因此會使結果不穩(wěn)定。針對這個問題,提出一種基于離散量改進
    發(fā)表于 11-20 10:03 ?2次下載

    基于密度的K-means算法數目中應用

    針對傳統(tǒng)的K-means算法無法預先明確數目,對初始中心選取敏感且易受離群孤點影響導致
    發(fā)表于 11-25 11:35 ?0次下載

    K均值算法的MATLAB實現

    K-means算法是最簡單的一種算法算法的目的是使各個樣本與所在
    發(fā)表于 12-01 14:07 ?2.1w次閱讀
    <b class='flag-5'>K</b>均值<b class='flag-5'>聚</b><b class='flag-5'>類</b><b class='flag-5'>算法</b>的MATLAB實現

    基于布谷鳥搜索的K-means算法

    針對原始K-means算法受初始中心影響過大以及容易陷入局部最優(yōu)的不足,提出一種基于改進
    發(fā)表于 12-13 17:24 ?3次下載

    大數據處理的優(yōu)化抽樣K-means算法

    針對大數據環(huán)境下K-means算法精度不足和收斂速度慢的問題,提出一種基于優(yōu)化抽樣
    發(fā)表于 12-22 15:47 ?4次下載
    大數據處理的優(yōu)化抽樣<b class='flag-5'>聚</b><b class='flag-5'>類</b><b class='flag-5'>K-means</b><b class='flag-5'>算法</b>

    k means算法實例

    與分類不同,分類是示例式學習,要求分類前明確各個類別,并斷言每個元素映射到一個類別,而是觀察式學習,在
    發(fā)表于 02-12 16:42 ?1.6w次閱讀
    <b class='flag-5'>k</b> <b class='flag-5'>means</b><b class='flag-5'>聚</b><b class='flag-5'>類</b><b class='flag-5'>算法</b>實例

    K-Means算法的簡單介紹

    K-Means是十大經典數據挖掘算法之一。K-Means和KNN(K鄰近)看上去都是K打頭,但卻是不同種類的
    發(fā)表于 07-05 14:18 ?5042次閱讀

    如何使用多維網格空間進行改進K-means算法資料概述

    K-means算法是被廣泛使用的一種算法,傳統(tǒng)的-means
    發(fā)表于 12-13 17:56 ?1次下載
    如何使用多維網格空間進行改進<b class='flag-5'>K-means</b><b class='flag-5'>聚</b><b class='flag-5'>類</b><b class='flag-5'>算法</b>資料<b class='flag-5'>概述</b>

    如何使用K-Means算法改進的特征加權算法詳細資料概述

    聚類分析是將研究對象分為相對同質的群組的統(tǒng)計分析技術,聚類分析的核心就是發(fā)現有用的對象簇。K-means算法由于具有出色的速度和良好的可擴展性,一直備受廣大學者的關注。然而,傳統(tǒng)的
    發(fā)表于 12-20 10:28 ?10次下載

    如何在python中安裝和使用頂級算法?

    或聚類分析是監(jiān)督學習問題。它通常被用作數據分析技術,用于發(fā)現數據中的有趣模式,例如基于其行為的客戶群。有許多
    的頭像 發(fā)表于 03-12 18:23 ?2368次閱讀

    K-MEANS算法概述及工作原理

    K-means 是一種算法,且對于數據科學家而言,是簡單且熱門的監(jiān)督式機器
    的頭像 發(fā)表于 06-06 11:53 ?4434次閱讀

    K-means算法指南

    技術領域中,K-means可能是最常見和經常使用的技術之一。K-means使用迭代細化方法,基于用戶定義的集群數量(由變量K表示)和數
    的頭像 發(fā)表于 10-28 14:25 ?1738次閱讀

    電子發(fā)燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品
    主站蜘蛛池模板: 婷婷色网| 色综合一区二区三区 | 国产黄色三级三级三级 | 欧美亚洲综合另类成人 | 色香蕉在线观看 | 就是操就是干 | 国产亚洲精品久久久久久久软件 | 久久99国产亚洲高清观看首页 | www在线视频观看 | 午夜一级毛片不卡 | 啪啪福利视频 | 最新版资源在线天堂 | 激情五月亚洲色图 | 亚洲国产精品自在现线让你爽 | 精品美女在线观看 | 国产三级日产三级韩国三级 | 亚欧色视频在线观看免费 | 色爱综合区五月小说 | 无毒在线 | 国产高清一区二区三区四区 | 国产网站在线播放 | 人操人碰 | 日本亚洲高清乱码中文在线观看 | 永久免费影视在线观看 | 好大好硬好长好爽a网站 | 午夜日批 | 四虎四虎| 天天干夜夜爽 | tube69xxxxhd日本| 你懂的网址在线 | 亚洲婷婷综合色高清在线 | 亚洲精品91大神在线观看 | 免费视频久久看 | 亚洲国产第一区二区香蕉 | 天堂电影免费在线资源 | 三级黄色片免费观看 | 日韩欧美一卡二区 | 国内一级特黄女人精品片 | 国产亚洲人成网站观看 | 久久草在线免费 | 色婷婷久久免费网站 |