机器学习--数据操作初试

时间：2023-04-21 23:56:23浏览次数：40

标签：初试 iris 机器 target 特征值 -- train 特征提取数据

#加载数据集，返回字典类型的数据
sklearn.datasets.load_iris()

数据示例

iris = sklearn.datasets.load_iris()
#数据集特征值
iris['data']
#数据集标签值
iris['target']

特征和标签相对应

数据集的划分

由于数据集在某些情况下是很珍贵的，并且在训练后需要对模型性能进行验证，因此如果将所有数据都用于训练模型，那么将没有数据可以用来测试模型。所以需要对数据集进行划分，使用一大部分用来训练模型，剩余部分用来测试模型。
工具包提供了划分方法，使用sklearn.model_selection包下的train_test_split方法传递分割的参数进行划分。

参数依次为：数据集特征值、数据集标签值、测试集规模（浮点数表示）、随机数种子
返回类型为：数据集特征值、测试集特征值、数据集标签值、测试集标签值
因此demo如下：

#0.2表示划分的测试集规模为20%
x_train, y_train, x_target, y_target = train_test_split(iris['data'], iris['target'], test_size=0.2,random_state=22)
print("训练集特征值:\n", x_train, x_train.shape)

特征提取

概念、意义

将任意数据转换为可用于机器学习的数字特征。
形象化比喻：剥鸡蛋，使计算机更好的去消化数据

字典特征提取
文本特征提取
图像特征提取

特征提取API

sklearn.feature_extraction

字典特征提取

作用：对字典数据进行特征值化

标签：初试,iris,机器,target,特征值,--,train,特征提取,数据
From： https://www.cnblogs.com/pureayu/p/17342255.html

原型设计工具比较及实践
目录一，原型设计工具比较1.墨刀2.Axure3.Mockplus二,原型设计1.主题名称2.功能3.界面设计考虑因素4.切换页面界面交换流程一，原型设计工具比较1.墨刀适用领域墨刀是一款在线原型设计与协同工具，借助墨刀，产品经理、设计师、开发、销售、运营及创业者等用户群体，能够搭......
supersocket新的配置属性 "textEncoding"
supersocket新的配置属性"textEncoding" 在SuperSocket1.6之前的版本,当你通过Session对象发送文本时,将文本信息转换成能够通过Socket传输的二进制数据的默认编码是UTF8。你可以通过设置Session的Charset属性来修改这个编码。现在在SuperSocket1.6中,你......
delphi IDE里面的导航条太丑了,咱自己写一个
效果图：嗯我们今天主要看下面这一部分的实现：四个按钮是TscGPCharGlyphButton控件。上面一行显示记录位置和快速跳转的那一坨，它其实是由四个TscGPEdit控件拼接构成的。红色括号3那里,其实是把边设置成了红色,而4这个则是设置边框不显示.然后两个控件高度一致,但要比最外面......
存钱问题
假设银行整存整取存款不同期限的月息利率为：0.63% 期限为1年0.66% 期限为2年0.69% 期限为3年0.75% 期限为5年0.84% 期限为8年现在已知某人手上有2000元，要求通过计算选择出一种存钱方案，使得这笔钱存入银行20年后获得的利息最多，假定银行对超出存款期限的那部分时间不......
表格里，如何实现input失去焦点事件
一诺佳人创建于 2020-09-0213:33 大佬，请问表格的input框内怎么实现动态失去焦点事件，例如填写数量和单价，金额自动生成，我在formatter里写了，如下，但是不是自动触发，是点击新增按钮，才会自动计算一次。参考代码表格字......
冲刺7
1.写完了安卓的功能。2.安卓有些繁琐，xml，Java代码，布局。都得需要设置相应的东西。3.对安卓代码进行改进。4.packagecom.example.medicalretrieval;importandroid.content.Intent;importandroid.net.Uri;importandroid.os.Bundle;importandroidx.fragment.app.Fragm......
测试
导弹拦截intmain(){intx;while(cin>>x)a[++n]=x;intlen=1;f[len]=a[1];for(inti=2;i<=n;i++){intl=0,r=len+1;while(l+1!=r)//找小于a[i]的第一个数{in......
1053 等重路径
给定一个非空的树，树根为 R。树中每个节点 Ti 的权重为 Wi。从 R 到 L 的路径权重定义为从根节点 R 到任何叶节点 L 的路径中包含的所有节点的权重之和。现在给定一个加权树以及一个给定权重数字，请你找出树中所有的权重等于该数字的路径（必须从根节点到叶节点）。例如......
基于smo算法的数据分类matlab仿真,对比线性分类和非线性分类
1.算法仿真效果matlab2022a仿真结果如下： 2.算法涉及理论知识概要 SVM通常用对偶问题来求解，这样的好处有两个：1、变量只有N个（N为训练集中的样本个数），原始问题中的变量数量与样本点的特征个数相同，当样本特征非常多时，求解难度较大。2、可以方便地引入......
Springboot 使用nacos鉴权的简单步骤
Springboot使用nacos鉴权的简单步骤背景前端时间nacos爆出了漏洞.因为他的默认token固定,容易被利用.具体的问题为:QVD-2023-6271漏洞描述：开源服务管理平台Nacos中存在身份认证绕过漏洞，在默认配置下未token.secret.key进行修改，导致远程攻击者可以绕过密钥认证进入......