大文本數(shù)據(jù)集的間接譜聚類
大小:0.59 MB 人氣: 2018-02-24 需要積分:1
推薦 + 挑錯(cuò) + 收藏(0) + 用戶評論(0)
標(biāo)簽:數(shù)據(jù)集(24470)
針對譜聚類存在計(jì)算瓶頸的問題,提出了一種快速的集成算法,稱為間接譜聚類。它首先運(yùn)用K-Means算法對數(shù)據(jù)集進(jìn)行過分聚類,然后把每個(gè)過分簇看成一個(gè)基本對象,最后在過分簇的級(jí)別上利用標(biāo)準(zhǔn)譜聚類來完成總體的聚類。將該思想應(yīng)用于大文本數(shù)據(jù)集的聚類問題后,過分簇中心之間的相似性度度量方法可以采用常用的余弦距離法。在20-Newgroups大本數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果表明:間接譜聚類算法在聚類準(zhǔn)確性上比K-Means算法平均高出14. 72%;比規(guī)范割譜聚類僅低0.88%,但算法所需的計(jì)算時(shí)間平均不到規(guī)范割譜聚類的1/16,且隨著數(shù)據(jù)集的增大當(dāng)規(guī)范割譜聚類遭遇計(jì)算瓶頸時(shí),提出的算法卻能快速地給出次優(yōu)解。
?
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
大文本數(shù)據(jù)集的間接譜聚類下載
相關(guān)電子資料下載
- 人臉識(shí)別模型訓(xùn)練失敗原因有哪些 135
- 反向傳播神經(jīng)網(wǎng)絡(luò)分為多少層 162
- 神經(jīng)網(wǎng)絡(luò)預(yù)測誤差大小怎么看 130
- PyTorch如何訓(xùn)練自己的數(shù)據(jù)集 89
- MES、ERP、PLM等工業(yè)系統(tǒng)的數(shù)據(jù)集成方案 143
- 機(jī)器學(xué)習(xí)的經(jīng)典算法與應(yīng)用 1093
- 定制化、精細(xì)化、場景化AI訓(xùn)練數(shù)據(jù)趨于基礎(chǔ)數(shù)據(jù)服務(wù)市場主流 75
- 經(jīng)證實(shí),深度技術(shù)人才的素質(zhì)能夠預(yù)測以人工智能為中心的公司未來的創(chuàng)新潛力 236
- 鹽城市大數(shù)據(jù)集團(tuán)攜手百望云 以MaaS推進(jìn)數(shù)字經(jīng)濟(jì)躍遷 108
- 東軟與福建省大數(shù)據(jù)集團(tuán)聯(lián)合打造“數(shù)據(jù)要素×醫(yī)療健康”服務(wù)新模式 263