首页 > 编程语言 >Python--scikit-learn

Python--scikit-learn

时间:2024-11-16 22:40:29浏览次数:1  
标签:neighbors fit KNeighborsClassifier Python scikit -- import 数据 sklearn

数据集 sklearn.datasets

  • from sklearn.datasets import load_iris, fetch_20newsgroups
  • 小数据集下载 load_xxx
  • 大数据集下载 fetch_xxx

模型

KNN K-近邻算法

  • 参考
  • 距离计算
  • k值选择
  • kd树
  • from sklearn.neighbors import KNeighborsClassifier
from sklearn.neighbors import KNeighborsClassifier


# 构造数据
x = [[1], [2], [10], [20]]
y = [0, 0, 1, 1]

# 训练模型
estimator = KNeighborsClassifier(n_neighbors=1)
estimator.fit(x, y)

# 数据预测
ret = estimator.predict([[0], [14]])
print('result: ', ret)

训练

  • 数据集划分:from sklearn.model_selection import train_test_split
  • 特征工程
    • 通过一些转换函数将特征数据转换成更加适合算法模型的特征数据的过程
    • 归一化:通过对原始数据进行变换,把数据映射到一个区间内,默认是[0, 1]
      • from sklearn.preprocessing import MinMaxScaler
      • 转换方法:fit_transform()
    • 标准化:通过对原始数据进行变换,把数据变换到均值为0,标准差为1的数据
      • from sklearn.preprocessing import StandardScaler
        • 转换方法:fit_transform()
      • x` = x - mean / σ

标签:neighbors,fit,KNeighborsClassifier,Python,scikit,--,import,数据,sklearn
From: https://www.cnblogs.com/yarightok/p/18549919

相关文章

  • 2021 Hubei Provincial Collegiate Programming Contest/2021湖北省赛 题解
    按解决顺序排列目录FAIDHECKJGBF二分答案ans,放最小的前ans个bi(变成必须放完)因为bi=2^k,所以小的放了可能会拆散大的空间,大的把小的地方占了的话小的可以塞其他地方,所以先放大的然后暴力能放则放,最多log次指针回到开头所以一次求解O(nlogn),总复杂度log^2A模拟,暴力枚举暴力异......
  • AtCoder Beginner Contest 380
    A-123233题意给个\(6\)位数,判断是否是\(1\)个\(1\),\(2\)个\(2\),\(3\)个\(3\)。思路模拟。代码点击查看代码#include<bits/stdc++.h>usingnamespacestd;#defineintlonglongtypedefpair<int,int>pii;constintmxn=1e6+5;voidsolve(){ s......
  • HTTP协议
    HTTP介绍1.全称超文本传输协议,用于从万维网服务器传输超文本到本地浏览器的传送协议。2.是一种应用层协议,基于TCP/IP通信协议传递数据。3.工作过程:客户端发送请求,服务端回复响应,一发一收。HTTP请求HTTP中的GET,POST,PUT,DELETE对应着对网络资源的查,改,增,删4个操作方法说......
  • 第七章
    7.3importnumpyasnpimportmatplotlibasmplimportmatplotlib.pyplotaspltplt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=Falsefromscipy.interpolateimportCubicSpline,interp1dimpor......
  • docker运行rabbitmq,mq用户以及vhost的持久化方法
    一、编写dockerfile文件,配置需要的插件vimpackage/dockerfile-rabbitmq.yamlFROMrabbitmq:3.8.5WORKDIR/var/lib/rabbitmqCOPYrabbitmq_delayed_message_exchange-3.8.0.ez/opt/rabbitmq/plugins/RUNchownrabbitmq:rabbitmq/opt/rabbitmq/plugins/rabbitmq_delayed_......
  • #1947 道路 || CF1214F Employment
    不难观察到一个性质:可以找到一条边\((i,i+1)\),满足存在一个最优解,其所有匹配的路径不经过这条边,称之为分界线。可以调整证明。如果我们已知了分界线,不妨设为\((m,1)\)。那么最小权匹配就是类似括号匹配,贪心扫一遍即可。这个不是很好优化,考虑对每条边算贡献。不妨令两类点的权......
  • 设计模式之单例模式
    一、概念单例模式(SingletonPattern)是一种创建型设计模式,确保一个类只有一个实例,并提供全局访问点。在C++中,实现单例模式需要考虑到线程安全、延迟初始化以及避免全局对象初始化顺序问题等因素。二、主要思想单例模式的主要思想是控制类实例的数量并集中管理访问。它通过一......
  • 动态规划-背包问题——[模版]完全背包问题
    1.题目解析题目来源[模版]完全背包_牛客题霸_牛客测试用例 2.算法原理1.状态表示与01背包相同,这里的完全背包也是需要一个二维dp表来表示最大价值,具体如下求最大价值dp[i][j]:在[1,i]区间选择物品,此时总体积不大于j时的最大价值求装满时的价值dp[i][j]:在[......
  • node.js毕设星光航空购票系统(程序+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容一、选题背景关于航空购票系统的研究,现有研究主要集中在系统设计、用户体验优化、支付方式多样化等方面。然而,专门针对星光航空购票系统的设计与实现的综合性研究较......
  • node.js毕设自律饮食与运动管理系统(程序+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带文档lw万字以上,文末可获取源码系统程序文件列表开题报告内容一、选题背景关于自律饮食与运动管理系统的研究,现有研究主要以单独的饮食管理或运动管理为主,专门针对将自律、饮食与运动整合到一个系统中的研究较少。在国内外,饮食......