编号 zgly0000659911
文献类型 期刊论文
文献题名 浅谈基于粗集理论的文本归类系统
作者单位 国家林业局昆明勘察设计院
母体文献 河北工业科技
年卷期 2010,27(6)
页码 414-416
年份 2010
分类号 TP311
关键词 粗集 林业文本信息分类 Apriori算法
文摘内容 文本归类是处理大量文本数据自动分类的重要技术。基于粗集理论建立的林业文本信息归类系统,是在已知类别的训练集的基础上,通过分析训练数据样本,建立决策表产生区分矩阵构造出区分函数,并化简它,得到最小属性约简,最后应用Apriori算法产生最终分类的规则表,利用产生的规则表,可将林业文本信息数据进行自动归类。