k-近邻算法

k-近邻算法

时间：2023-03-05 11:33:01浏览次数：38

标签：分类近邻样本数值算法数据

1.k-近邻算法概述

简单地说，k-近邻算法采用测量不同特征值之间的距离方法进行分类

优点：精度高、对异常值不敏感、无数据输入假定。

缺点：计算复杂度高、空间复杂度高。

适用数据范围：数值型和标称型。

标称型：标称型目标变量的结果只在有限目标集中取值，如真与假(标称型目标变量主要用于分类)

数值型：数值型目标变量则可以从无限的数值集合中取值，如0.100，42.001等 (数值型目标变量主要用于回归分析)

2.k-近邻算法（kNN）的工作原理

存在一个样本数据集合，也称作训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据（最近邻）的分类标签。一般来说，我们只选择样本数据集中前k个最相似的数据，这就是k-近邻算法中k的出处，通常k是不大于20的整数。最后，选择k个最相似数据中出现次数最多的分类，作为新数据的分类

3.k-近邻算法的一般流程

(1).收集数据：可以使用任何方法。

(2).准备数据：距离计算所需要的数值，最好是结构化的数据格式。

(3).分析数据：可以使用任何方法。

(4).训练算法：此步骤不适用于k-近邻算法。

(5).测试算法：计算错误率。

(6).使用算法：首先需要输入样本数据和结构化的输出结果，然后运行k-近邻算法判定输入数据分别属于哪个分类，最后应用对计算出的分类执行后续的处理。

4.kNN算法伪代码

对未知类别属性的数据集中的每个点依次执行以下操作：

(1).计算已知类别数据集中的点与当前点之间的距离；

(2).按照距离递增次序排序；

(3).选取与当前点距离最小的k个点；

(4).确定前k个点所在类别的出现频率；

(5).返回前k个点出现频率最高的类别作为当前点的预测分类。

标签：分类,近邻,样本,数值,算法,数据
From： https://blog.51cto.com/u_13753753/6101329

回溯算法
leetcode:131分割回文串问题说实话，状态学了回溯，感觉已经懂了但是，今天这是搞笑代码直接上代码先上图,理解这个startIndexclassSolution{private:vector<vec......
每日算法 230304
每日算法230304题目982.按位与为零的三元组给你一个整数数组nums，返回其中按位与三元组的数目。按位与三元组是由下标(i,j,k)组成的三元组，并满足下述全部条......
python版基于协同过滤算法的图书管理系统
基于协同过滤算法的图书管理系统DEMOdemo传送门可以参考一、简介本系统基于推荐算法给用户实现精准推荐图书。根据用户对物品或者信息的偏好，发现物品或者内容......
m在LTE-A系统载波聚合下的资源分配算法的matlab仿真
1.算法描述载波聚合即CA，是LTE-A中的关键技术。是为满足用户峰值速率和系统容量提升的要求，增加系统传输带宽的技术，通过CA技术，用户最高上网速率可提升到300Mbps，带来极速上网......
m在LTE-A系统载波聚合下的资源分配算法的matlab仿真
1.算法描述载波聚合即CA，是LTE-A中的关键技术。是为满足用户峰值速率和系统容量提升的要求，增加系统传输带宽的技术，通过CA技术，用户最高上网速率可提升到300......
C/C++ 数据结构堆结构算法的实现
#include<stdio.h>#include<stdlib.h>#include<string.h>//堆的算法实现#defineDEFAULT_CAPCITY128typedefstruct_Heap{int*arr;//存储堆元素的数组......
m基于RFID和DBSCAN聚类的InSAR室内三维定位算法的matlab仿真
1.算法描述许多室内应用需要有关物体的空间信息。示例应用程序包括项目查找，对象级别映射和在仓库或库中管理的大型对象。然而，使用802.11，可见光或声学的基于......
m基于kmeans和SVM的网络入侵数据分类算法matlab仿真
1.算法描述首先计算整个数据集合的平均值点，作为第一个初始聚类中心C1；然后分别计算所有对象到C1的欧式距离d，并且计算每个对象在半径R的范围内包含的对象个数W。此......
m基于RFID和DBSCAN聚类的InSAR室内三维定位算法的matlab仿真
1.算法描述许多室内应用需要有关物体的空间信息。示例应用程序包括项目查找，对象级别映射和在仓库或库中管理的大型对象。然而，使用802.11，可见光或声学的基于位置的服务的传......
m基于隐马尔科夫模型(HMM)的手机用户行为预测(MMUB)算法matlab仿真
1.算法描述隐马尔可夫模型（HiddenMarkovModel，HMM）是一种统计模型，广泛应用在语音识别，词性自动标注，音字转换，概率文法等各个自然语言处理等应用领域。经过长期发展，尤其是在语......

1.k-近邻算法概述

2.k-近邻算法（kNN）的工作原理

3.k-近邻算法的一般流程

4.kNN算法伪代码

相关文章

赞助商

阅读排行