首页 > 其他分享 >机器学习中数据处理与处理不当的影响 - 学习思考

机器学习中数据处理与处理不当的影响 - 学习思考

时间:2023-01-09 17:14:00浏览次数:40  
标签:真实 公平性 处理不当 学习 效应 数据处理 因果

1、不公平性

由于数据组的分布不均匀(与真实场景分布不一致),会导致真实的预测结果会有一些“偏见”。在引入使用的预测特征时需要更加结合真实场景需求。

2、因果偏差

相关关系误用为因果关系或者因果关系建立不合理时会产生因果偏差。(非常重要 相关性 不等于因果性)

3、公平性

(1)意识公平性:是否显示使用敏感属性用于模型的训练与预测过程

(2)统计公平性:要求弱势、少数群体的待遇与非弱势、整体群体相似

 

4、基于平均因果效应与实验组平均因果效应的公平性:

FATE:基于平均因果效应

FACT:即将于试验组平均因果效应公平性

 

 

5、训练数据的修正:可以根据分布,在替代的数据上进行数据修正,使得训练的数据模型能够符合真实的分布模型

标签:真实,公平性,处理不当,学习,效应,数据处理,因果
From: https://www.cnblogs.com/AKsnoopy/p/17037592.html

相关文章

  • [VueJsDev] 其他知识 - NestJS 学习内容
    [VueJsDev]目录列表https://www.cnblogs.com/pengchenggang/p/17037320.htmlNestJS学习内容NestJS学习总结Step.1:全局安装包pnpmadd-g@nestjs/clinodemon......
  • UE5 学习地图
    UE5学习地图WilliamFauchehttps://www.youtube.com/@WilliamFaucherUE5打造一个完美的故事,或者是艺术表现,以至于他的教程都干货超级多,而且都是专注影视级方向的。G......
  • Java基础学习05
    通过一道简单的算法题找路问题总结一下一些小结论。问题:在迷宫中找到一条通路并计算长度(2023-01-09)解法:首先利用二维数组创建迷宫,创建一个类,调用类中的方法实现问题解决,方......
  • CMU 15-445 | Lecture 04 Database Storage II 学习
    行存储用OLTP(On-lineTransactionProcessing),列存储用OLAP(On-lineAnalyticalProcessing)。大多数数据库是行存储。行存储的读写较方便,因此工业上可以采取混合形式......
  • 整理下深度学习常见的学习平台
    原创不易,转载请注明出处。1、深度学习在线平台2、深度学习资源......
  • NLP基础知识学习掌握
    NLP入门总览教材推荐:实用文章NLP领域的重要模型100行代码完成的NLP任务好的课程NLP领域的几个研究方向与公共数据集NLP的基本方法和流程NLP基础知识1......
  • 英语学习方法(三)
    a.若干问题解答一份英文材料,你可以重复听到你厌烦,然后你再换材料.先学语法还是先积累词汇,什么都不要,开始需要听起来.学语法是在赚钱后,你在数钱,学语......
  • 转导推理_归纳推理_转导学习_归纳学习
    转导推理_归纳推理【Def:传统推理方法:归纳推理】直到今天,传统的推理方法仍然是归纳-演绎法,人们首先用已有信息定义一个一般规则,然后用这个规则来推断所需要的答案(首先从特殊......
  • 英语学习方法(二)
    01.忘记你在学习英语当你学习英语时,你看着看着就哈哈大笑,你忘记了你在学习英语,此时就是学习英语的最好方法.学习英语就是怎么爽,你就怎么来做.因此背单词,学语......
  • 学习笔记——在IDEA中创建Maven版的web工程;框架;Mybatis简介;搭建Mybatis框架步骤
    2023-01-09 一、在IDEA中创建Maven版的web工程(1)步骤:①创建一个maven模块,命名为“maven_web_end”,之后需要创建web工程的目录。在“maven_web_end.src.main”下创建“we......