資料介紹
文本分類是文本數據挖掘中一個非常重要的技術,已經被廣泛地應用于信息管理、搜
索引擎、推薦系統等多個領域。現有的文本分類方法,大多是基于向量空間模型的算法。這些算法很難適用于大規模的文本數據集。為此,我們提出了一種基于遺傳算法和信息熵的文本分類規則抽取方法。在該方法中,信息熵技術用來輔助遺傳算法初始種群的生成。遺傳算法和信息熵的有效集成,極大地提高了該混合方法的分類效率。實驗結果表明,本文方法適用于大規模文本數據集;該方法提取規則的分類正確率較高,分類速度較快。
關鍵詞:文本分類;遺傳算法;信息熵;文本挖掘
Extraction Method of Text Classification Rule Based on Genetic Algorithm and Information
Entropy ZHOU Guoping 1, 2, PENG Xiangmei 1, HUANG Guobing 1
(1. Xinyu College, Xinyu, 338031, China;
2. Department of computer science, Nanchang College, Xinyu, 338031, China)
Abstract:Text classification is a very important technique in the field of text mining, and it has been widely applied to the information management, search engine, recommendation systems, and some other fields. Most classification methods are based on vector models, these approaches are highly complicated on computation, and cannot be used on the occasion of classifying a large number of samples. For this reason, a hybrid approach combining genetic algorithm with information entropy is presented for text classification rule extraction. In this hybrid approach, the information entropy technique is applied to assist the generation of initial populations for genetic algorithm. The classification performance of the proposed approach has been improved largely by integrating genetic algorithm with information entropy effectively. The proposed approach can be applied to classify a large number of samples. Experimental results show that both the accuracy and the speed of categorization are high.
Keywords:Text classification; genetic algorithm; information entropy; text mining
- 基于注意力機制的新聞文本分類模型 30次下載
- 基于LSTM的表示學習-文本分類模型 18次下載
- 基于主題分布優化的模糊文本分類方法 5次下載
- 一種面向維吾爾語的停用詞抽取方法 3次下載
- 基于不同神經網絡的文本分類方法研究對比 48次下載
- 融合文本分類和摘要的多任務學習摘要模型 11次下載
- 一種基于BERT模型的社交電商文本分類算法 8次下載
- 集成WL-CNN和SL-Bi-LSTM的旅游問句文本分類算法 5次下載
- 結合BERT模型的中文文本分類算法 6次下載
- 基于深度神經網絡的文本分類分析 37次下載
- 如何使用Spark計算框架進行分布式文本分類方法的研究 3次下載
- 融合詞語類別特征和語義的短文本分類方法 0次下載
- 基于apiori算法改進的knn文本分類方法 9次下載
- 用于文本分類和文本聚類的特征抽取方法的研究
- 基于文章標題信息的漢語自動文本分類
- 卷積神經網絡在文本分類領域的應用 358次閱讀
- 人工智能中文本分類的基本原理和關鍵技術 947次閱讀
- Instruct-UIE:信息抽取統一大模型 1469次閱讀
- 基于統一語義匹配的通用信息抽取框架USM 960次閱讀
- 文本分類中處理樣本不均衡和提升模型魯棒性的trick 905次閱讀
- 使用樸素貝葉斯和GPU進行更快的文本分類 1153次閱讀
- 如何統一各種信息抽取任務的輸入和輸出 1138次閱讀
- 帶你從頭構建文本分類器 3288次閱讀
- 訓練一個機器學習模型,實現了根據基于文本分析預測葡萄酒質量 5965次閱讀
- SiATL——最新、最簡易的遷移學習方法 3506次閱讀
- 探討深度文本分類之DPCNN原理與代碼 3293次閱讀
- 如何為文本分類任務選擇正確的模型,這里有一個完整流程圖! 1.2w次閱讀
- 總結Tensorflow純干貨學習資源,分為教程、視頻和項目三大板塊 1.1w次閱讀
- 基于概率的常見的分類方法--樸素貝葉斯 5090次閱讀
- 詳細解析scikit-learn進行文本分類 4626次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費下載
- 0.00 MB | 1490次下載 | 免費
- 2單片機典型實例介紹
- 18.19 MB | 93次下載 | 1 積分
- 3S7-200PLC編程實例詳細資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識別和講解說明
- 4.28 MB | 18次下載 | 4 積分
- 5開關電源原理及各功能電路詳解
- 0.38 MB | 10次下載 | 免費
- 6基于AT89C2051/4051單片機編程器的實驗
- 0.11 MB | 4次下載 | 免費
- 7基于單片機和 SG3525的程控開關電源設計
- 0.23 MB | 3次下載 | 免費
- 8基于單片機的紅外風扇遙控
- 0.23 MB | 3次下載 | 免費
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費
- 4LabView 8.0 專業版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費
- 5555集成電路應用800例(新編版)
- 0.00 MB | 33562次下載 | 免費
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費
- 8開關電源設計實例指南
- 未知 | 21539次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費
- 2protel99se軟件下載(可英文版轉中文版)
- 78.1 MB | 537791次下載 | 免費
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費
- 6電路仿真軟件multisim 10.0免費下載
- 340992 | 191183次下載 | 免費
- 7十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183277次下載 | 免費
- 8proe5.0野火版下載(中文版免費下載)
- 未知 | 138039次下載 | 免費
評論
查看更多