编号
zgly0000783711
文献类型
期刊论文
文献题名
基于DBSCAN的最优密度文本聚类算法
作者单位
北京林业大学信息学院
母体文献
计算机工程与设计
年卷期
2012,33(4)
页码
1409-1413
年份
2012
分类号
TP391.3
关键词
搜索引擎
文本聚类
密度聚类
簇关系树
动态聚类
文摘内容
为有效地弥补全文搜索引擎的不足, 提出了一种动态求解的最优密度聚类算法并加以实现。该算法构造了一颗簇关系树, 将两种典型聚类算法: 密度聚类算法DBSCAN和层次聚类算法BIRCH进行有效结合, 对聚类参数E进行动态求解, 以达到参数£的最优。与其它文本聚类算法相比, 该算法的查询结果与用户感兴趣的主题相关度较大, 对具有二义性的关键词有较高的查准率, 能有效提升搜索引擎的查询效率, 加快用户搜索信息的速度。