Handel 分类中的不平衡数据

时间：2022-09-05 01:33:39浏览次数：82

标签：www 预测 Handel com 分类平衡数据变量

Handel 分类中的不平衡数据

预测我想知道的他们中的大多数人没有可预测的信息。例如预测欺诈的发生, 感染预后或简而言之

“因为东西少所以我想知道更多。”

在这项工作中，它将预测明天是否下雨。只有2个答案（2个班级）。

不坠落（0级和1级）

Imbalanced data — predict minority class

本次使用的数据来自 Kaggle。

[

澳大利亚的雨

预测澳大利亚第二天的降雨

www.kaggle.com

](https://www.kaggle.com/datasets/jsphyg/weather-dataset-rattle-package?datasetId=6012&sortBy=voteCount)

您可以转到链接以相应地运行代码。

https://github.com/golf41101/Suchet/blob/master/handle_imbalacedata_classification.ipynb

让我们开始使用 EDA。

从这个数据的性质来看，它是那个日期发生的各种值的时间戳，检索到的数据没有按日期排序。所以我们必须先从旧日期排序到新日期。

接下来，我们将检查每个变量的空值。

其中有空值比例较高的变量，因此，本次从建模中剔除。

其余变量将按数据类型填充数据。

分类数据 =>> 按模式填充
数值数据 =>> 均值填充

重要的是，在进入模型之前，不要忘记将文本数据转换为数字。

预测 RainTomorrow 的变量转换为 No : 0, Yes : 1。

特征变量使用 one-hot 编码来转换值。

是时候在建模中划分数据了。

训练 80%
测试 20%

但在拟合模型之前，让我们重新缩放数据。

Min-Max scale

每个变量的值可以有很大的不同。最好先重新缩放，否则您会对该变量产生偏见。

为测试解决不平衡数据的方法选择的模型如下：

逻辑回归
决策树
随机福雷斯特
XGBoost

我使用的方法是：

类权重——将少数类的权重调整为大于多数类，保持所有权重之和相同（通常预先调整的权重相同）。
SMOTE — KNN 算法的一种应用，它根据附近数据 (KNN) 生成新数据，以便要预测的数据类的数量等于未预测的类的数量。

before use smote

after use smote

在基准测试方面，我主要关注精度和准确性，因为我们确实对预测类正精度更感兴趣。

Table of All result

或者从非科学的角度来看

如果明天下雨然后我们提前知道，所以我们带了伞。这比预测要好没有下雨，所以我们没有带伞。这让我们湿漉漉地回家而且我感觉不舒服

我希望它对所有读者有用。面对这个季风别忘了带伞。

本文链接：https://www.qanswer.top/14364/24300501

标签：www,预测,Handel,com,分类,平衡,数据,变量
From： https://www.cnblogs.com/amboke/p/16656695.html

IP地址的分类与子网划分
1.IP地址在网络中用来标识设备的具体地址，数据需要通过此进行寻址传输。IANA(TheInternetAssignedNumbersAuthority，互联网数字分配机构是INTERNET域名系统的最高权威......
Python机器学习-多元分类的5种模型
Python机器学习-多元分类的5种模型最近上了些机器学习的课程，于是想透过Kaggle资料集来练习整个资料科学专案的流程，在模型训练阶段，虽然听过许多分类模型，但不是很了解其各别......
vue3项目-小兔鲜儿笔记-分类模块01
1.二级类目-筛选区展示获取数据进行品牌和属性的渲染<template><divclass="sub-filter"v-if="filterData&&!filterDataLoading"><divclass="item"><......
【luogu P5056】【模板】插头dp（插头DP）（分类讨论）
【模板】插头dp题目链接：luoguP5056题目大意有一个n*m的网格，每个格子要么必须铺线，要么必须不铺。然后问你有多少个铺发使得形成一个闭合回路。思路快乐插头DP模......
【校招VIP】[产品][211][8分]按需求分类书写简历
关注【校招VIP】公众号，回复【简历】，添加校招顾问微信，即可获取简历指导！本份简历是一位22届一本的产品同学简历，简历评分8分一、学员简历二、指导意见1简历版式字......
11.业务功能实现---商品服务三级分类前后端联调
1.商品服务三级分类前后端联调登录后台管理系统，添加系统管理菜单：目录(一级菜单)--商品系统、菜单(二级菜单)--分类维护、-----在侧边栏会显示新增加的菜单；编写......
10.业务功能实现---商品服务三级分类树形API
1.商品服务三级分类树形API实体类，添加属性@Data@TableName("pms_category")publicclassCategoryEntityimplementsSerializable{privatestaticfinallong......
vue3项目-小兔鲜儿笔记-一级分类页面01
1.顶级类目-面包屑组件的封装了解render函数和h函数：render函数的返回值是html结构，渲染到#app容器，相对于template里传入html结构，render函数的优先级更高h函数是一个创建......
html+php 分类页面展示
根据分类展示不同页面：案例一：案例二：同宽度展示不同页面：if($child_cate_id){$hangye_pid=M("hangye")->where("status=1andcate......
手势与时间表达共现的身体关键点轨迹分类
手势与时间表达共现的身体关键点轨迹分类关于这篇文章——在这篇博客中，我将详细解释我的项目，“与时间表达同时发生的手势的身体关键点轨迹分类”，这是与RedHenLab组织......

Handel 分类中的不平衡数据

Handel 分类中的不平衡数据

澳大利亚的雨

预测澳大利亚第二天的降雨

相关文章

赞助商

阅读排行