数据资源: 中文期刊论文

Web文本聚类算法WTCA的研究与实现



编号 zgly0000498906

文献类型 期刊论文

文献题名 Web文本聚类算法WTCA的研究与实现

作者 郑煜  钱榕 

作者单位 东北林业大学理学院数学系  北京科技大学信息工程学院 

母体文献 计算机工程与应用 

年卷期 2007,43(4)

页码 170-172

年份 2007 

分类号 TP18 

关键词 Web文本挖掘  文本聚类  非结构化数据挖掘结构模型  自组织特征映射 

文摘内容 提出了一种新的Web文本聚类算法WTCA——基于自组织特征映射神经网络(SOM)的聚类算法。谊算法分为训练SOM网络度聚类分析两个阶段, 具有自稳定性, 无须外界给出评价函数; 能够识别概念空间中最有意义的特征, 抗噪音能力强。该算法应用到现代远程教育网, 可以对各类远程教育站点上收集的文本资料信息自动进行聚类分析; 从海量Web文本信息源中快速有效地获取重要的知识。

相关图谱

扫描二维码