首页 > 其他分享 >关于分类任务的一些知识点

关于分类任务的一些知识点

时间:2022-12-03 22:12:11浏览次数:37  
标签:知识点 F1 模型 分类 用户 情境 任务 TP

对于业务用户来说,希望技术团队完成的是正确分类,区别无分是分成两类还是多类,是一个级别的分类还是多个级别的分类,然后要求准一点。那么什么是准一点呢?也许用户还没有意识到这个问题的复杂性,或者说没有意识到他们真正关心的是什么。由于多分类问题可以简化为多个二分类问题,我们直接来分析看似简单的二分类问题。

准一点就是准确度(Accuracy),也就是说用户给了我们数据,我们分好类把答卷交给用户,用户判卷子的结果。以二分类举例,75%就是每100个数据,被正确挑出的正类和负类一共有75个。一般情况下这样的评估方式是合理的,但也有特殊的例子,譬如真实的正负类比例是98比2,那么模型只要把所有的数据都判别为正类,准确率就是98%,非常高,但对业务没有任何意义,因为一个负类都挑不出来。

(所以之前实习的时候主要看的不是accuracy)

那么用户实际关注的是什么呢?举两个例子。例如各大网站的商品推荐,建立一个模型的目的是尽量将正确的商品推荐给感兴趣的用户,如果推了一个产品用户没有兴趣,也不会有很大损失,这种情境下用户对于错误的推荐并不会很在意。这是一种情境。

而如果是欺诈、垃圾邮件、还款逾期判别的模型,对识别的用户和邮件会直接进行处理,被错判为欺诈的用户可能非常恼怒,被错判为垃圾邮件也许会直接影响用户工作。这种情况下宁可遗漏,也要减少误判。这是第二种情境。

(不同的业务对灵敏度和特异度的要求不一样)

这两种情境,用户关注点并不相同,情境一关注的是不要遗漏,可推荐可不推荐的都要给用户推荐过去。情境二关注的是误判,拿不准的宁可漏掉,也不要错误判定。使用技术语言,情境一关注的是查全率: Recall or TPR = TP/(TP+FN),情境二关注的是精确率: Precision = TP/(TP+FP)。那有没有平衡这两种评价标准的指标呢?有,就是F Measure,简化版本为F1。在多分类中,又细化为Micro F1和Macro F1。

 

总结一下,正确的做法是用AUC评价模型能力,选取好的模型之后根据实际需求确定阈值,再用Macro F1计算性能指标。

 

标签:知识点,F1,模型,分类,用户,情境,任务,TP
From: https://www.cnblogs.com/h694879357/p/16948880.html

相关文章

  • 多分类f1-score,Micro-F1和Macro-F1
    研究生开学以后不怎么写博客了,其实应该坚持写的。分类模型的指标:f1-score,auc,roc曲线,precision,specificity,sensitivity,recall,accuracyconfusionmatrix混淆矩阵 ......
  • Docker Compose 知识点
    docker-compose.yml中文件格式版本version,与DockerEngine兼容性:https://docs.docker.com/compose/compose-file/compose-versioning/#compatibility-matrix......
  • 设置Windows点击任务栏资源管理器打开此电脑
    描述Windows可以将资源管理器固定到底部任务栏,默认点击时打开个人文件夹,可以通过设置改为此电脑。由于设置入口不好找,因此记录下来。win10设置双击此电脑,打开资源管理......
  • MySQL 常问知识点(简略)
    前言稍微整理一下吧,因为平时关注这方面不多,所以不会很深入事务隔离级别事务中可能遇到的问题脏读同一时间有两个事务A和B,A对某条数据进行修改或增加,在B......
  • P4实现测量任务和sketch的思想
    P4实现HLL/*HLLSKETCH:https://research.neustar.biz/2012/10/25/sketch-of-the-day-hyperloglog-cornerstone-of-a-big-data-infrastructure/*///NOTE:instead......
  • pg_corn 定时任务失败,connection failed
    场景:这几天项目要验收,虽然我已经在学校里写论文了,是师弟师妹在负责,但是前期很多东西是我做的,所以我也得起来赶bug,呜呜呜。解决方法:主要是因为pg_corn是用libpg......
  • 新变化新营销 这些知识点你得 Get!(文末有 PPT 福利首次放送)
    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群在刚刚结束的第7期火山引擎数智平台VeDI「增长课堂」上,火山引擎数智平台VeDI零售......
  • vue3新增知识点(组合式API、ref和reactive、响应式原理、setup、watch和watchEffect)持
    1.组合式API和声明式API的区别,组合式API的优点2.Vue3的响应式原理通过Proxy(代理):拦截对象中任意属性的变化:包括:属性值的读写、属性的添加、属性的删除等。通过reflect(反射):......
  • 09Linux任务调度
    任务调度基本介绍crontab指令Linuxcrontab是用来定期执行程序的命令。当安装完成操作系统之后,默认便会启动此任务调度命令。crond命令每分钟会定期检查是否有要执......
  • 转 vue3讲义 知识点 整理文档PPT
      vue3自学理论笔记 vue3讲义  知识点  整理文档PPT项目不忙时就学习新内容,知识不全。 1.vue2使用es5中的object.definedPropert对数据进行双向绑定......