首页 > 编程语言 >python 学习笔记

python 学习笔记

时间:2023-03-06 23:00:10浏览次数:36  
标签:python 笔记 学习 train split 随机数 test stratify size

 

train_test_split 函数

在机器学习中,我们通常将原始数据按照比例分割为“测试集”和“训练集”,从 sklearn.model_selection 中调用train_test_split 函数 

简单用法如下:

X_train,X_test, y_train, y_test =sklearn.model_selection.train_test_split(train_data,train_target,test_size=0.4, random_state=0,stratify=y_train)
# train_data:所要划分的样本特征集

# train_target:所要划分的样本结果

# test_size:样本占比,如果是整数的话就是样本的数量

# random_state:是随机数的种子。

随机数种子,其实就是该组随机数的编号,在需要重复试验的时候,保证得到一组一样的随机数。比如你每次都填1,其他参数一样的情况下你得到的随机数组是一样的。但填0或不填,每次都会不一样。

#stratify:是为了保持split前类的分布。比如有100个数据,80个属于A类,20个属于B类。如果train_test_split(... test_size=0.25, stratify = y_all), 那么split之后数据如下: 
training: 75个数据,其中60个属于A类,15个属于B类。 
testing: 25个数据,其中20个属于A类,5个属于B类。 

将stratify=X就是按照X中的比例分配 

将stratify=y就是按照y中的比例分配 

 

标签:python,笔记,学习,train,split,随机数,test,stratify,size
From: https://www.cnblogs.com/xcyjblog/p/17185861.html

相关文章

  • Python Flask 之 路由和渲染模板讲解与示例演示
    目录一、概述二、路由三、渲染模板四、重定向和错误五、日志六、集成WSGI中间件一、概述Flask是一款使用Python编写的Web应用框架,其设计理念是轻量级和简单易学。......
  • Python实现人脸识别,对视频跟踪打码,拒绝少儿不宜!
    事情是这样的,昨天去表弟家,用了下他的电脑,不小心点到了他硬盘里隐藏的秘密,本来我只需要用几分钟电脑的,害得我硬是在电脑旁坐了几个小时~还好他爸妈不在家,不然表弟又要被......
  • Windows Server 2003 安装 python
    WindowsServer2003是32位的系统,最高支持的python版本是3.4下载python-3.4https://www.python.org/ftp/python/3.4.4/python-3.4.4.msi D:\Python34\Scripts>pip......
  • c++基础学习路线
    c++基础学习路线类和对象c/c++内存管理模板IO流继承多态c++11新特新异常智能指针特殊类设计c++的类型转换STL......
  • python基础(2)
    1.什么是变量?为何要有变量?答:变量是存在变化的量,程序会一直变化,我们需要能反映出程序变化的东西,所以有了变量。2.变量的三大组成部分是?每部分的作用是什么?答:变量的三大组成......
  • python之路82 路飞项目、腾讯云短信开发、短信验证接口、短信登录接口、短信注册接口
    腾讯云短信开发前期准备工作:使用腾讯短信https://cloud.tencent.com,微信扫码登录搜索短信:https://console.cloud.tencent.com/smsv2创建短信签名:公......
  • jenkins学习笔记之八:jenkins认证集成gitlab
    1.gitlab创建新应用2.jenkins安装gitlab插件3.插件安装完成后全局安全配置中使用并配置gitlab认证4.注销重新登录后自动使用gitlab当前登录账号登录jenkins必须和......
  • 【THM】Hacking with PowerShell(Powershell脚本基础)-学习
    本文相关的TryHackMe实验房间链接:https://tryhackme.com/room/powershell通过学习相关知识点:了解PowerShell攻击和PowerShell脚本的基础知识。PowerShell教程参考链......
  • 软件工程学习第十二天
    今天我们上课讲解了如何规范代码,规范代码十分重要。代码是需要维护的,无论是自己维护,还是其他人维护,都需要阅读代码。符合规范的代码,能减少理解成本。其次,代码规范最大的目......
  • c#随笔记01
    C#语言的特点不允许直接操作内存,去掉了指针操作。彻底的面向对象设计:封装、继承、多态usingSystem;usingSystem.Collections.Generic;usingSystem.Linq;usingS......