编号
zgly0000783725
文献类型
期刊论文
文献题名
基于文本聚类搜索引擎的查询扩展算法
作者单位
北京林业大学信息学院
母体文献
计算机工程与应用
年卷期
2012,48(3)
页码
129-132
年份
2012
分类号
TP391
关键词
K中值聚类
主题词提取
相似度计算
查询扩展
文摘内容
目前多数基于文本聚类搜索引擎的研究对于聚类产生的小聚类簇查询未能给出深入查询解决方案,针对此类问题提出了一种基于聚类的查询扩展算法。此算法利用簇关系树结构改进相似度公式,对目标簇提取主题词并进行二次查询后,通过K中值聚类算法对查询结果进行聚类以对其进行扩展。此算法全部过程均为离线运算,旨在避免在线运算影响查询响应效率,并通过实验验证了该算法的有效性。