编号
zgly0000498906
文献类型
期刊论文
文献题名
Web文本聚类算法WTCA的研究与实现
作者单位
东北林业大学理学院数学系
北京科技大学信息工程学院
母体文献
计算机工程与应用
年卷期
2007,43(4)
页码
170-172
年份
2007
分类号
TP18
关键词
Web文本挖掘
文本聚类
非结构化数据挖掘结构模型
自组织特征映射
文摘内容
提出了一种新的Web文本聚类算法WTCA——基于自组织特征映射神经网络(SOM)的聚类算法。谊算法分为训练SOM网络度聚类分析两个阶段, 具有自稳定性, 无须外界给出评价函数; 能够识别概念空间中最有意义的特征, 抗噪音能力强。该算法应用到现代远程教育网, 可以对各类远程教育站点上收集的文本资料信息自动进行聚类分析; 从海量Web文本信息源中快速有效地获取重要的知识。