首页 > 其他分享 >Handel 分类中的不平衡数据

Handel 分类中的不平衡数据

时间:2022-09-05 01:33:39浏览次数:74  
标签:www 预测 Handel com 分类 平衡 数据 变量

Handel 分类中的不平衡数据

预测我想知道的他们中的大多数人没有可预测的信息。例如预测欺诈的发生, 感染预后或简而言之

“因为东西少所以我想知道更多。”

在这项工作中,它将预测明天是否下雨。只有2个答案(2个班级)。

不坠落(0级和1级)

Imbalanced data — predict minority class

本次使用的数据来自 Kaggle。

[

澳大利亚的雨

预测澳大利亚第二天的降雨

www.kaggle.com

](https://www.kaggle.com/datasets/jsphyg/weather-dataset-rattle-package?datasetId=6012&sortBy=voteCount)

您可以转到链接以相应地运行代码。

https://github.com/golf41101/Suchet/blob/master/handle_imbalacedata_classification.ipynb

让我们开始使用 EDA。

从这个数据的性质来看,它是那个日期发生的各种值的时间戳,检索到的数据没有按日期排序。所以我们必须先从旧日期排序到新日期。

接下来,我们将检查每个变量的空值。

其中有空值比例较高的变量,因此,本次从建模中剔除。

其余变量将按数据类型填充数据。

  • 分类数据 =>> 按模式填充
  • 数值数据 =>> 均值填充

重要的是,在进入模型之前,不要忘记将文本数据转换为数字。

预测 RainTomorrow 的变量转换为 No : 0, Yes : 1。

特征变量使用 one-hot 编码来转换值。

是时候在建模中划分数据了。

  • 训练 80%
  • 测试 20%

但在拟合模型之前,让我们重新缩放数据。

Min-Max scale

每个变量的值可以有很大的不同。最好先重新缩放,否则您会对该变量产生偏见。

为测试解决不平衡数据的方法选择的模型如下:

  1. 逻辑回归
  2. 决策树
  3. 随机福雷斯特
  4. XGBoost

我使用的方法是:

  1. 类权重——将少数类的权重调整为大于多数类,保持所有权重之和相同(通常预先调整的权重相同)。
  2. SMOTE — KNN 算法的一种应用,它根据附近数据 (KNN) 生成新数据,以便要预测的数据类的数量等于未预测的类的数量。

before use smote

after use smote

在基准测试方面,我主要关注精度和准确性,因为我们确实对预测类正精度更感兴趣。

Table of All result

或者从非科学的角度来看

如果明天下雨然后我们提前知道,所以我们带了伞。这比预测要好没有下雨,所以我们没有带伞。这让我们湿漉漉地回家而且我感觉不舒服

我希望它对所有读者有用。面对这个季风别忘了带伞。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/14364/24300501

标签:www,预测,Handel,com,分类,平衡,数据,变量
From: https://www.cnblogs.com/amboke/p/16656695.html

相关文章

  • IP地址的分类与子网划分
    1.IP地址在网络中用来标识设备的具体地址,数据需要通过此进行寻址传输。IANA(TheInternetAssignedNumbersAuthority,互联网数字分配机构是INTERNET域名系统的最高权威......
  • Python机器学习-多元分类的5种模型
    Python机器学习-多元分类的5种模型最近上了些机器学习的课程,于是想透过Kaggle资料集来练习整个资料科学专案的流程,在模型训练阶段,虽然听过许多分类模型,但不是很了解其各别......
  • vue3项目-小兔鲜儿笔记-分类模块01
    1.二级类目-筛选区展示获取数据进行品牌和属性的渲染<template><divclass="sub-filter"v-if="filterData&&!filterDataLoading"><divclass="item"><......
  • 【luogu P5056】【模板】插头dp(插头DP)(分类讨论)
    【模板】插头dp题目链接:luoguP5056题目大意有一个n*m的网格,每个格子要么必须铺线,要么必须不铺。然后问你有多少个铺发使得形成一个闭合回路。思路快乐插头DP模......
  • 【校招VIP】[产品][211][8分]按需求分类书写简历
    关注【校招VIP】公众号,回复【简历】,添加校招顾问微信,即可获取简历指导!本份简历是一位22届一本的产品同学简历,简历评分8分一、学员简历  二、指导意见1简历版式字......
  • 11.业务功能实现---商品服务三级分类前后端联调
    1.商品服务三级分类前后端联调登录后台管理系统,添加系统管理菜单:目录(一级菜单)--商品系统、菜单(二级菜单)--分类维护、-----在侧边栏会显示新增加的菜单;编写......
  • 10.业务功能实现---商品服务三级分类树形API
    1.商品服务三级分类树形API实体类,添加属性@Data@TableName("pms_category")publicclassCategoryEntityimplementsSerializable{privatestaticfinallong......
  • vue3项目-小兔鲜儿笔记-一级分类页面01
    1.顶级类目-面包屑组件的封装了解render函数和h函数:render函数的返回值是html结构,渲染到#app容器,相对于template里传入html结构,render函数的优先级更高h函数是一个创建......
  • html+php 分类页面展示
    根据分类 展示不同页面:案例一:  案例二:   同宽度展示不同页面:if($child_cate_id){$hangye_pid=M("hangye")->where("status=1andcate......
  • 手势与时间表达共现的身体关键点轨迹分类
    手势与时间表达共现的身体关键点轨迹分类关于这篇文章——在这篇博客中,我将详细解释我的项目,“与时间表达同时发生的手势的身体关键点轨迹分类”,这是与RedHenLab组织......