首页 > 其他分享 >机器学习--数据操作初试

机器学习--数据操作初试

时间:2023-04-21 23:56:23浏览次数:35  
标签:初试 iris 机器 target 特征值 -- train 特征提取 数据

#加载数据集,返回字典类型的数据
sklearn.datasets.load_iris()

数据示例
image
image

iris = sklearn.datasets.load_iris()
#数据集特征值
iris['data']
#数据集标签值
iris['target']

特征和标签相对应

数据集的划分

由于数据集在某些情况下是很珍贵的,并且在训练后需要对模型性能进行验证,因此如果将所有数据都用于训练模型,那么将没有数据可以用来测试模型。所以需要对数据集进行划分,使用一大部分用来训练模型,剩余部分用来测试模型。
工具包提供了划分方法,使用sklearn.model_selection包下的train_test_split方法传递分割的参数进行划分。

  • 参数依次为:数据集特征值数据集标签值测试集规模(浮点数表示)随机数种子
  • 返回类型为:数据集特征值测试集特征值数据集标签值测试集标签值
    因此demo如下:
#0.2表示划分的测试集规模为20%
x_train, y_train, x_target, y_target = train_test_split(iris['data'], iris['target'], test_size=0.2,random_state=22)
print("训练集特征值:\n", x_train, x_train.shape)

特征提取

概念、意义

将任意数据转换为可用于机器学习的数字特征。
形象化比喻:剥鸡蛋,使计算机更好的去消化数据

  • 字典特征提取
  • 文本特征提取
  • 图像特征提取

特征提取API

sklearn.feature_extraction

字典特征提取

  • 作用:对字典数据进行特征值化

标签:初试,iris,机器,target,特征值,--,train,特征提取,数据
From: https://www.cnblogs.com/pureayu/p/17342255.html

相关文章

  • 原型设计工具比较及实践
    目录一,原型设计工具比较1.墨刀2.Axure3.Mockplus二,原型设计1.主题名称2.功能3.界面设计考虑因素4.切换页面界面交换流程一,原型设计工具比较1.墨刀适用领域  墨刀是一款在线原型设计与协同工具,借助墨刀,产品经理、设计师、开发、销售、运营及创业者等用户群体,能够搭......
  • supersocket新的配置属性 "textEncoding"
    supersocket新的配置属性"textEncoding" 在SuperSocket1.6之前的版本,当你通过Session对象发送文本时,将文本信息转换成能够通过Socket传输的二进制数据的默认编码是UTF8。你可以通过设置Session的Charset属性来修改这个编码。现在在SuperSocket1.6中,你......
  • delphi IDE里面的导航条太丑了,咱自己写一个
    效果图:  嗯我们今天主要看下面这一部分的实现:四个按钮是TscGPCharGlyphButton控件。上面一行显示记录位置和快速跳转的那一坨,它其实是由四个TscGPEdit控件拼接构成的。红色括号3那里,其实是把边设置成了红色,而4这个则是设置边框不显示.然后两个控件高度一致,但要比最外面......
  • 存钱问题
    假设银行整存整取存款不同期限的月息利率为:0.63% 期限为1年0.66% 期限为2年0.69% 期限为3年0.75% 期限为5年0.84% 期限为8年现在已知某人手上有2000元,要求通过计算选择出一种存钱方案,使得这笔钱存入银行20年后获得的利息最多,假定银行对超出存款期限的那部分时间不......
  • 表格里,如何实现input失去焦点事件
     一诺佳人创建于 2020-09-0213:33 大佬,请问表格的input框内怎么实现动态失去焦点事件,例如填写数量和单价,金额自动生成, 我在formatter里写了,如下,但是不是自动触发,是点击新增按钮,才会自动计算一次。     参考代码表格字......
  • 冲刺7
    1.写完了安卓的功能。2.安卓有些繁琐,xml,Java代码,布局。都得需要设置相应的东西。3.对安卓代码进行改进。4.packagecom.example.medicalretrieval;importandroid.content.Intent;importandroid.net.Uri;importandroid.os.Bundle;importandroidx.fragment.app.Fragm......
  • 测试
     导弹拦截intmain(){intx;while(cin>>x)a[++n]=x;intlen=1;f[len]=a[1];for(inti=2;i<=n;i++){intl=0,r=len+1;while(l+1!=r)//找小于a[i]的第一个数{in......
  • 1053 等重路径
    给定一个非空的树,树根为 R。树中每个节点 Ti 的权重为 Wi。从 R 到 L 的路径权重定义为从根节点 R 到任何叶节点 L 的路径中包含的所有节点的权重之和。现在给定一个加权树以及一个给定权重数字,请你找出树中所有的权重等于该数字的路径(必须从根节点到叶节点)。例如......
  • 基于smo算法的数据分类matlab仿真,对比线性分类和非线性分类
    1.算法仿真效果matlab2022a仿真结果如下:    2.算法涉及理论知识概要         SVM通常用对偶问题来求解,这样的好处有两个:1、变量只有N个(N为训练集中的样本个数),原始问题中的变量数量与样本点的特征个数相同,当样本特征非常多时,求解难度较大。2、可以方便地引入......
  • Springboot 使用nacos鉴权的简单步骤
    Springboot使用nacos鉴权的简单步骤背景前端时间nacos爆出了漏洞.因为他的默认token固定,容易被利用.具体的问题为:QVD-2023-6271漏洞描述:开源服务管理平台Nacos中存在身份认证绕过漏洞,在默认配置下未token.secret.key进行修改,导致远程攻击者可以绕过密钥认证进入......