首页 > 其他分享 >天池大赛_工业蒸汽量预测_day1

天池大赛_工业蒸汽量预测_day1

时间:2024-07-07 21:26:23浏览次数:19  
标签:origin sep 特征 大赛 day1 train test 天池 data

本文记录下我练习的过程,欢迎交流。

参考书目 《阿里云天池大赛赛题解析》

数据导入

    train_data = pd.read_csv('data_origin/zhengqi_train.txt', sep='\t', encoding='utf-8')
    test_data = pd.read_csv('data_origin/zhengqi_test.txt', sep='\t', encoding='utf-8')

数据分析

可视化分析

箱线图观察异常值情况

绿框是数据分布较为集中的特征,红框是存在离散特别大数据的特征。

img

img

KDE图分析数据分布偏斜情况

img

target特征

img

train和test相同特征分布情况对比

QQ图分析是否符合正太分布假设

红框框选了train和test相近表现的特征

img

img

相关性热力图,寻找与特征线性相关度高的特征

img

标签:origin,sep,特征,大赛,day1,train,test,天池,data
From: https://blog.csdn.net/hardw_littlew/article/details/140252693

相关文章

  • Day10-面向对象-继承和多态
    继承和多态Day10面向对象-继承2.继承2.1继承的好处2.2继承的语法2.3继承的特点一:成员变量2.3.1私有化(private)2.3.2成员变量不重名2.3.3成员变量重名(实际开发中不推荐这样做)2.4继承的特点二:成员方法2.4.1成员方法不重名2.4.2成员方法重名——重写(Override)......
  • [CISCN2019 华北赛区 Day1 Web1]Dropbox
    进入题目注册一个账号登录进去后上传一个文件发现只能上传图片下载删除时分别抓包发现在download.php里下载,在delete.php处删除发现filename参数,有任意文件下载漏洞下载download.php,delete.php目录遍历在delete.php里发现class.phpdb=$db;}publi......
  • [CISCN2019 华北赛区 Day1 Web5]CyberPunk
    进入题目点击左下角发现不同文件查看index.php检查发现file参数猜测文件包含用php为协议读取源码require_once"config.php";if(!empty($_POST["user_name"])&&!empty($_POST["phone"])){$msg='';$pattern='/select|insert......
  • IAP 2023 Day1
    HTMLHTML是Hypertextmarkuplanguage(超文本标记语言),你可以理解为网页的结构。<!DOCTYPEhtml><html><head><title>ProfilePage</title><linkrel="stylesheet"href="https://maxcdn.bootstrapcdn.com/bootstrap/4.0.0-beta......
  • 第四届BPAA算法大赛成功举办!共研算法未来
      大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行......
  • 从零学习的JAVAday1~day7
    作为一个刚要迈入大二的预备程序员,已经学习过了c语言和c++的部分知识,在暑假期间满怀期待的开始Java的学习,希望一个暑假可以对Java的了解加深一些。学习Java首先要学习windows电脑的cmd命令:同时点击键盘上面的win+r键输入cmd即可进入默认的cmd面版,然后我们就可以输入一些命令:比......
  • 大学生电子设计大赛超全资料分享
    超全大学生电子设计大赛项目合集免费分享 电赛竞赛资料大全,新增竞赛空间电子设计资料。包含嵌入式硬件和软件开发的学习资料,包括PCB教程,单片机例程,单片机课程设计毕业设计参考资料、项目设计方案,源码和开发文档等各类软件设计工具,一应俱全!绝对会对你有所帮助!!获取方法:打开......
  • 代码随想录day15 平衡二叉树 | 二叉树的所有路径 | 左叶子之和 | 完全二叉树的节点个
    平衡二叉树平衡二叉树解题思路二叉树节点的深度:指从根节点到该节点的最长简单路径边的条数。二叉树节点的高度:指从该节点到叶子节点的最长简单路径边的条数。这道题由于需要求节点的高度差来进行判断,因此我们需要用后序遍历,先左右,后中间。推荐使用递归把每个节点的高度算出来......
  • 职场<火焰杯>测试开发大赛决赛即将开始!
    亲爱的测试开发小伙伴们,令人期待的职场<火焰杯>测试开发大赛决赛即将拉开帷幕!不论你是否参加了初赛,现在都可以报名参与决赛,展示你的技术实力,争夺丰厚奖品与荣誉证书!01决赛时间决赛时间:2024年7月16日15:00-22:0002为什么不能错过这次决赛?丰厚奖品:总奖励价值高达10万元,等你......
  • rust学习 day1
    边读rust程序设计这本书边写代码。今天主要和cargo(换源,包提速),以及actix-web这个库(版本不兼容)鏖战。清华的源也太慢了,换了中科大的才搞定。书里的actix-web版本太落后了,编译通过不了,换了actix-web4.0然后参考官方指南:https://actix.rs/docs/getting-started/,才编译成功。usea......