编号
zgly0000659911
文献类型
期刊论文
文献题名
浅谈基于粗集理论的文本归类系统
作者单位
国家林业局昆明勘察设计院
母体文献
河北工业科技
年卷期
2010,27(6)
页码
414-416
年份
2010
分类号
TP311
关键词
粗集
林业文本信息分类
Apriori算法
文摘内容
文本归类是处理大量文本数据自动分类的重要技术。基于粗集理论建立的林业文本信息归类系统,是在已知类别的训练集的基础上,通过分析训练数据样本,建立决策表产生区分矩阵构造出区分函数,并化简它,得到最小属性约简,最后应用Apriori算法产生最终分类的规则表,利用产生的规则表,可将林业文本信息数据进行自动归类。