基于Nodeset的最大頻繁項集挖掘算法
大小:1.65 MB 人氣: 2018-03-20 需要積分:1
標(biāo)簽:挖掘算法(7655)
遞歸遍歷、條件FP-Tree構(gòu)建與超集檢測是多數(shù)基于FP-Tree最大頻繁項集挖掘算法的主要性能瓶頸。為此,提出一種基于Nodeset的最大頻繁項集挖掘算法-MFIN算法。該算法采用Nodeset數(shù)據(jù)結(jié)構(gòu)對POC-Tree的節(jié)點編碼,將集合枚舉樹作為搜索空間,避免遞歸遍歷和條件FP-Tree構(gòu)建的時間開銷。設(shè)計提前停止方法提高求解Nodeset交集的效率,采用父等價剪枝技術(shù)和前瞻剪枝技術(shù)縮小搜索空間。對基于MFI-Tree的投影策略進(jìn)行改進(jìn),提升超集檢測的速度。實驗結(jié)果表明,MFIN算法在mushroom,pumsb,webdocs數(shù)據(jù)集上的運行時間及執(zhí)行效率等總體性能明顯優(yōu)于基于FP-Tree的FP-Max算法。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%