编号 zgly0001497943
文献类型 期刊论文
文献题名 基于类内K-means聚簇的KNN改进算法
作者单位 福州大学数学与计算机科学学院
母体文献 木工机床
年卷期 2015年04期
年份 2015
分类号 TP311.13
关键词 KNN 分类算法 类内聚簇
文摘内容 传统的KNN算法的时间复杂度与训练样本集的数量成正比,大规模数据下其分类效率显著下降,因此它不适用于大规模数据的在线实时处理。为此,本文提出了一种基于类内K-means聚簇的KNN改进算法。该算法先对训练样本集内各个类别的样本分别进行K-means聚簇,得到各个样本所属的簇标签,与各个簇标签所对应的簇中心向量。在进行KNN分类时对于每个测试样本先计算它与各个簇中心向量的相似度,选出排名前的一定个数的簇标签,随后以这些簇所含的样本集作为该测试样本的训练样本集进行传统的KNN分类。改进算法通过这种选择训练样本集而缩小了比对范围,减少了大量计算量。实验表明,改进的KNN分类算法在分类的准确率没有明显变动下,运行效率得到了明显的提升。