K-近邻算法

K-近邻算法

时间：2022-10-27 00:33:16浏览次数：52

标签：group classCount 近邻 labels 算法 print 3d

1.简介

K-近邻算法（K-Nearest Neighbor, KNN），属于监督学习,是一中基本分类与回归方法。k 近邻法的输入为实例的特征向量,对应于特征空间的点;输出为实例的类别,可以取多类, k 近邻法假设给定一个训练数据集,其中的实例类别已定,分类时,对新的实例,根据其 k 个最近邻的训练实例的类别,通过多数表决等方式进行预测。

2.基本要素

　　①K值的选择

　　②距离量度

　　（1）欧氏距离

　　（2）曼哈顿距离

　　③分类决策规则

3.实现knn算法的代码实现

from numpy import * import operator #训练样本集以及对应的类别 def createDateSet(): group = array([[3,53],[2,48],[1,49],[101,10],[99,5],[98,2]]) labels = ['西苑','西苑','西苑','万人','万人','万人'] return group,labels def classify(inX, dataSet, labels, k): #dataSetSize是训练样本集数量 dataSetSize = dataSet.shape[0] #距离计算——欧式距离公式 #tile函数，把inX变成能与dataSet相减的二维数组 diffMat = tile(inX, (dataSetSize, 1)) - dataSet sqDiffMat = diffMat ** 2 #axis=1是列相加求和，即得到(x1-x2)^2+(y1-y2)^2的值 sqDistances = sqDiffMat.sum(axis = 1) distances = sqDistances ** 0.5 #按照距离递增次序排序，返回下标 sortedDistIndicies = distances.argsort() #选择距离最小的k个点 classCount = {} for i in range(k): voteILabel = labels[sortedDistIndicies[i]] classCount[voteILabel] = classCount.get(voteILabel,0) + 1 #按照字典里的关键字的值排序，reverse=True降序排序 sortedClassCount = sorted(classCount.items(), key = operator.itemgetter(1), reverse = True) #返回类别最多的标签 return sortedClassCount[0][0] 测试算法： i = 0 print("训练样本集") group, labels = createDateSet() for item in group: print('食堂%c：一楼%3d次二楼%3d次食堂选择： %s'%(chr(ord('A')+i),item[0],item[1],labels[i])) i += 1 print("\n测试数据集") myTests = array([[18,90],[20,66],[50,23]]) myLabels = [] for i in range(3): myLabels.append(classify(myTests[i], group, labels, 3)) print('食堂%c：一楼%3d次二楼%3d次食堂选择： %s'%(chr(ord('A')+i),myTests[i][0],myTests[i][1],myLabels[i])) 测试结果：

标签：group,classCount,近邻,labels,算法,print,3d
From： https://www.cnblogs.com/Moonee/p/16830658.html

代码随想录算法训练营第一天|704、二分查找|27、移除元素
704.二分查找·这是三个数的故事left,middle,right题目链接：https://leetcode.cn/problems/binary-search/前提：数组有序小->大数组无重复数使用语......
算法第四版电子书 pdf
作者:[美]RobertSedgewick/[美]KevinWayne出版社:人民邮电出版社原作名:Algorithms译者:谢路云链接：算法第四版本书作为算法领域经典的参考书，全面介......
基于GA优化的竞价博弈频谱分配算法的matlab仿真
目录一、理论基础二、核心程序三、仿真测试结果作者ID：fpga和matlabCSDN主页：https://blog.csdn.net/ccsss22?type=blog擅长技术：1.无线基带,无线图传,编解码2.机器视觉......
基于形态学处理的交通标志检测分割算法matlab仿真
目录一、理论基础二、核心程序三、仿真测试结果作者ID：fpga和matlabCSDN主页：https://blog.csdn.net/ccsss22?type=blog擅长技术：1.无线基带,无线图传,编解码2.机器视觉......
新浪微博2020界校招笔试-算法工程师
给定字符串A，A是由逗号分割的数字串，A可以解析成整数数组B。每次操作可以选择任意B[i],并将其递增1.返回使得B中的每个值都是唯一的最小操作次数。输入描述：输入每......
React进阶篇——六、Diff算法
六、Diff算法React每次组件的状态或属性更新，组件的render方法都会返回一个新的虚拟DOM对象，用来表述新的UI结构。如果每次render都直接使用新的虚拟DOM来生成真实DOM，那么会......
R语言用FNN-LSTM假近邻长短期记忆人工神经网络模型进行时间序列深度学习预测4个案例|
全文链接:tecdat.cn/?p=23792在最近的一篇文章中，我们展示了一个LSTM模型，通过假近邻（FNN）损失进行正则化，可以用来重建一个非线性动态系统（点击文末“阅读原文”获取完整代......
【算法】今天的算法题目是给出两组数组拼接最大数，了解一下看看你会吗？
算法题目：拼接最大数：提示：会使用到了贪心算法，题目难度：比较困难。贪心算法一般按如下步骤进行：①建立数学模型来描述问题。②把求解的问题分成若干个子问题。③对每个子......
循环不变量,双指针,精准定义| 代码随想录算法训练营第一天| 704. 二分查找、27. 移除
收获:抓住循环不变量双指针入门,学会精准定义目录704思路错误解法解题方法Code27思路解题方法Code704Problem:704.二分查找思路讲述看到这一题的思路思......
找回消失的密钥 --- DFA分析白盒AES算法
一、目标李老板：什么叫白盒AES算法？奋飞：将密钥进行白盒化处理，融入到整个加密过程中，使密钥无法跟踪还原，保障密钥安全。简单的说，就是你可以明明白白的调试整个算法过程，怎么看都......

相关文章

赞助商

阅读排行