最近又用到了，感觉机器学习中数据集处理还比较常用

关于模型的数据集划分

为了保证模型能起到预期的作用，一般需要将样本分成独立的三部分，分别为：

训练集：用于估计模型
验证集：用于确定网络结构或者控制模型复杂程度的参数。
测试集：用于检验最优的模型的性能。

其中，最典型的划分方式就是训练集50%，验证集25%，测试集25%
在训练集上训练模型，在验证集上评估模型。一旦找到了最佳参数，就在测试集数据上最后测试一次。

K折交叉验证

原因：不同的训练集和测试集的划分方式和比例差距很大，对预测模型的准确率影响也很大，因此划分方式就需要优化。
为了避免因为数据集划分的偏差，通俗点儿也就是为什么这一部分被划分为训练集，而那一部分就是规定是测试集，难免会划分不公平或者不太合理。那么，就有一个很好的想法：
交叉验证。即每组训练集中都调一份作为测试集

K折交叉验证的基本步骤与思路

将样本随机打乱shuffle，同时均匀分为k份（这就是为啥叫K折）
划分为K份，就代表了验证集的组成就有K种。即轮流不重复地选择K-1份作为训练集，而每次的剩下那份就是验证集。
把K次的评估标准的均值作为选择最优模型结构的依据

图片1.png

选择最入门的数据集之一：鸢尾花数据集作为样例

import sklearn.datasets
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
 
dataset = sklearn.datasets.load_iris()
X, y = dataset.data, dataset.target
 
model = KNeighborsClassifier()         # 模型选择
kfold = KFold(n_splits=5, random_state=3,shuffle = ‘True’)
results = cross_val_score(model, X, y, cv=kfold, scoring='accuracy')
print("acc: %.3f (%.3f)" % (results.mean(), results.std()))

# 得出结果为acc:0.913（0.083）,这里选择了用5折交叉验证的方法（因为n_splits=5）

标签：训练,交叉,模型,验证,划分,测试,sklearn
From： https://www.cnblogs.com/sdnu-dfl/p/16908589.html

EBS: API导入GL科目交叉验证规则要素
declarecursorc1isselecttmp.application_id,tmp.id_flex_code,tmp.id_flex_num,tmp.id_flex_structure_code,tmp.flex_vali......
多分类交叉熵理解
多分类交叉熵有多种不同的表示形式，如下图所示：但是，有时候我们读论文会深陷其中不能自拔。也有很多读者、观众会纠正其他作者的文章、视频的交叉熵形式。实际上，上述三种形式......
篇(16)-Asp.Net Core入门实战-权限管理之用户创建与关联角色(ViewModel再用与模型验证
入门实战-权限管理之用户创建与关联角色(ViewModel再用与模型验证二)（1）.在用户管理着模块中，相比较菜单功能的代码还是比较多的，设计到用户的创建，修改，角色变更和密码重置，同时......
python ddddocr图片验证码详解
下载地址：https://pypi.tuna.tsinghua.edu.cn/simple/ddddocr/安装命令：pipinstallD:\ChromeCoreDownloads\ddddocr-1.3.0-py3-none-any.whl-ihttps://pypi.tuna.ts......
selenium遇到手机验证码怎么解决
完整代码在： selenium使用案例解决思路，点击发送送验证码，程序用input方法去和人进行交互，手动输入验证码，按回车键，这样程序就接收到手机验证码了，再把验证码赋值给验证码......
反转字符串中的单词同构字符串验证回文串
151.反转字符串中的单词s=s.trim();先清除前后空格String[]sb=s.split("");StringBuilderans=newStringBuilder();for(inti=sb.length-1;i>0;i--)......
Node.js通过密钥计算验证码，无需存数据库
Node.js通过密钥计算验证码，无需存数据库constCRC32=require('crc-32');functionXixiOtp(sKey,iKeeptime=600){constoPri={};oPri.sKey=sKey;......
YOLOV5 train模块写，没验证对错，能跑
importtorchimporttorch.nnasnnimporttorch.optimasoptimimportdatasetimportmodelsimportnn_utilsclassYoloHead(nn.Module):def__init__(se......
PHP通过加密计算出短信验证码，无需缓存验证码
通过加密计算出短信验证码，无需缓存验证码classXixiOtp{private$iKeeptime;//验证码有效期private$sKey;//加密的密钥private$p1Len=1;//验......
使用redis实现验证码功能
redis模拟验证码发送要求：1.输入手机号，点击发送后随即生成6位数字码，2分钟有效 2.输入验证码，点击验证，返回成功或者失败 3.每个手机号每天只能输入3次分析：验......

K折交叉验证

最近又用到了，感觉机器学习中数据集处理还比较常用

关于模型的数据集划分

K折交叉验证

K折交叉验证的基本步骤与思路

选择最入门的数据集之一：鸢尾花数据集作为样例

相关文章

赞助商

阅读排行