数据资源: 中文期刊论文

基于类内K-means聚簇的KNN改进算法



编号 zgly0001497943

文献类型 期刊论文

文献题名 基于类内K-means聚簇的KNN改进算法

作者 许奇功  郭洪 

作者单位 福州大学数学与计算机科学学院 

母体文献 木工机床 

年卷期 2015年04期

年份 2015 

分类号 TP311.13 

关键词 KNN  分类算法  类内聚簇 

文摘内容 传统的KNN算法的时间复杂度与训练样本集的数量成正比,大规模数据下其分类效率显著下降,因此它不适用于大规模数据的在线实时处理。为此,本文提出了一种基于类内K-means聚簇的KNN改进算法。该算法先对训练样本集内各个类别的样本分别进行K-means聚簇,得到各个样本所属的簇标签,与各个簇标签所对应的簇中心向量。在进行KNN分类时对于每个测试样本先计算它与各个簇中心向量的相似度,选出排名前的一定个数的簇标签,随后以这些簇所含的样本集作为该测试样本的训练样本集进行传统的KNN分类。改进算法通过这种选择训练样本集而缩小了比对范围,减少了大量计算量。实验表明,改进的KNN分类算法在分类的准确率没有明显变动下,运行效率得到了明显的提升。

相关图谱

扫描二维码