首页 > 编程语言 >k-近邻算法

k-近邻算法

时间:2023-03-05 11:33:01浏览次数:38  
标签:分类 近邻 样本 数值 算法 数据

1.k-近邻算法概述

简单地说,k-近邻算法采用测量不同特征值之间的距离方法进行分类

优点:精度高、对异常值不敏感、无数据输入假定。

缺点:计算复杂度高、空间复杂度高。

适用数据范围:数值型和标称型。

标称型:标称型目标变量的结果只在有限目标集中取值,如真与假(标称型目标变量主要用于分类)

数值型:数值型目标变量则可以从无限的数值集合中取值,如0.100,42.001等 (数值型目标变量主要用于回归分析)

2.k-近邻算法(kNN)的工作原理

存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数。最后,选择k个最相似数据中出现次数最多的分类,作为新数据的分类

3.k-近邻算法的一般流程

(1).收集数据:可以使用任何方法。

(2).准备数据:距离计算所需要的数值,最好是结构化的数据格式。

(3).分析数据:可以使用任何方法。

(4).训练算法:此步骤不适用于k-近邻算法。

(5).测试算法:计算错误率。

(6).使用算法:首先需要输入样本数据和结构化的输出结果,然后运行k-近邻算法判定输入数据分别属于哪个分类,最后应用对计算出的分类执行后续的处理。

4.kNN算法伪代码

对未知类别属性的数据集中的每个点依次执行以下操作:

(1).计算已知类别数据集中的点与当前点之间的距离;

(2).按照距离递增次序排序;

(3).选取与当前点距离最小的k个点;

(4).确定前k个点所在类别的出现频率;

(5).返回前k个点出现频率最高的类别作为当前点的预测分类。


标签:分类,近邻,样本,数值,算法,数据
From: https://blog.51cto.com/u_13753753/6101329

相关文章

  • 回溯算法
    leetcode:131分割回文串问题说实话,状态学了回溯,感觉已经懂了但是,今天这是搞笑代码直接上代码先上图,理解这个startIndexclassSolution{private:vector<vec......
  • 每日算法 230304
    每日算法230304题目982.按位与为零的三元组给你一个整数数组nums,返回其中按位与三元组的数目。按位与三元组是由下标(i,j,k)组成的三元组,并满足下述全部条......
  • python版基于协同过滤算法的图书管理系统
    基于协同过滤算法的图书管理系统DEMOdemo传送门可以参考一、简介​ 本系统基于推荐算法给用户实现精准推荐图书。​ 根据用户对物品或者信息的偏好,发现物品或者内容......
  • m在LTE-A系统载波聚合下的资源分配算法的matlab仿真
    1.算法描述载波聚合即CA,是LTE-A中的关键技术。是为满足用户峰值速率和系统容量提升的要求,增加系统传输带宽的技术,通过CA技术,用户最高上网速率可提升到300Mbps,带来极速上网......
  • m在LTE-A系统载波聚合下的资源分配算法的matlab仿真
    1.算法描述        载波聚合即CA,是LTE-A中的关键技术。是为满足用户峰值速率和系统容量提升的要求,增加系统传输带宽的技术,通过CA技术,用户最高上网速率可提升到300......
  • C/C++ 数据结构堆结构算法的实现
    #include<stdio.h>#include<stdlib.h>#include<string.h>//堆的算法实现#defineDEFAULT_CAPCITY128typedefstruct_Heap{int*arr;//存储堆元素的数组......
  • m基于RFID和DBSCAN聚类的InSAR室内三维定位算法的matlab仿真
    1.算法描述       许多室内应用需要有关物体的空间信息。示例应用程序包括项目查找,对象级别映射和在仓库或库中管理的大型对象。然而,使用802.11,可见光或声学的基于......
  • m基于kmeans和SVM的网络入侵数据分类算法matlab仿真
    1.算法描述首先计算整个数据集合的平均值点,作为第一个初始聚类中心C1;然后分别计算所有对象到C1的欧式距离d,并且计算每个对象在半径R的范围内包含的对象个数W。此......
  • m基于RFID和DBSCAN聚类的InSAR室内三维定位算法的matlab仿真
    1.算法描述许多室内应用需要有关物体的空间信息。示例应用程序包括项目查找,对象级别映射和在仓库或库中管理的大型对象。然而,使用802.11,可见光或声学的基于位置的服务的传......
  • m基于隐马尔科夫模型(HMM)的手机用户行为预测(MMUB)算法matlab仿真
    1.算法描述隐马尔可夫模型(HiddenMarkovModel,HMM)是一种统计模型,广泛应用在语音识别,词性自动标注,音字转换,概率文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语......