编号 zgly0000783711
文献类型 期刊论文
文献题名 基于DBSCAN的最优密度文本聚类算法
作者单位 北京林业大学信息学院
母体文献 计算机工程与设计
年卷期 2012,33(4)
页码 1409-1413
年份 2012
分类号 TP391.3
关键词 搜索引擎 文本聚类 密度聚类 簇关系树 动态聚类
文摘内容 为有效地弥补全文搜索引擎的不足, 提出了一种动态求解的最优密度聚类算法并加以实现。该算法构造了一颗簇关系树, 将两种典型聚类算法: 密度聚类算法DBSCAN和层次聚类算法BIRCH进行有效结合, 对聚类参数E进行动态求解, 以达到参数£的最优。与其它文本聚类算法相比, 该算法的查询结果与用户感兴趣的主题相关度较大, 对具有二义性的关键词有较高的查准率, 能有效提升搜索引擎的查询效率, 加快用户搜索信息的速度。