拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线

时间：2022-11-09 12:40:43浏览次数：53

ROC 曲线可能是评估评分分类器的预测性能的最常用的度量。

预测正类（+1）和负类（-1）的分类器的混淆矩阵具有以下结构：

预测/参考类	+1	-1
+1	TP	FP
-1	FN	TN

这里，TP表示真阳性的数量（模型正确预测正类），FP表示误报的数量（模型错误地预测正类），FN表示假阴性的数量（模型错误地预测阴性类），TN表示真阴性的数量（模型正确预测阴性类）。

ROC曲线

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_召回率

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_大数据_02

plot.scores.AUC <- function (y, y.hat, measure =  "tpr" , x.measure =  "fpr" ) {
    par(mfrow=c( 1 ,  2 ))
    hist(y.hat[y ==  0 ], col=rgb( 1  , 0 , 0 , 0.5 ), 
         main =  "Score Distribution" ,
         breaks=seq(min(y.hat),max(y.hat)+ 1 ,  1 ), xlab =  "Prediction" )
    hist(y.hat[y ==  1 ], col = rgb( 0 ,<span style="color:#880000">0</span>,<span style="color:#880000">1</span>,<span style="color:#880000">0.5</span>), add=<span style="color:#78a960">T</span>, 
            breaks=seq(min(y.hat),max(y.hat) + <span  
 # plot ROC curve</span>
     pr <- prediction(y.hat, y)
    prf <- performance(pr, measure = measure, x.measure = x.measure)
     auc <- performance(pr, measure = <span style="color:#880000">"auc"</span>)@y.values[ 
    plot(prf, main =  "Curve (AUC: "

AUC是完美的分类器

理想的分类器不会产生任何预测错误。这意味着分类器可以完美地分离这两个类，使得模型在产生任何误报之前实现100％的真正正率。因此，这种分类器的AUC是1，例如：

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_数据_03

AUC是一个很好的分类器

将两个类分开但不完美的分类器看起来像这样：

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_数据_04

可视化分类器能够在非常低的FPR下获得60％的灵敏度。

坏分类器的AUC

错误的分类器将输出其值仅与结果稍微相关的分数。这样的分类器将仅以高FPR为代价达到高TPR。

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_数据_05

只有在大约40％的FPR下，可视化分类器才能达到60％的灵敏度，这对于应该具有实际应用的分类器来说太高了。

随机分类器的AUC

随机分类器的AUC接近0.5。这很容易理解：对于每个正确的预测，下一个预测都是不正确的。

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_召回率_06

分类器的AUC表现比随机分类器差

[0.5,1][0.5,1]

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_大数据_07

可视化分类器在达到20％以上的灵敏度之前产生80％的FPR。

AUC-PR曲线

精确回忆曲线绘制阳性预测值（PPV，y轴）与真阳性率（TPR，x轴）。这些数量定义如下：

precisionrecall=PPV=TPTP+FP=TPR=TPTP+FNprecision=PPV=TPTP+FPrecall=TPR=TPTP+FN

例如，请考虑以下数据集：

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_大数据_08

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_数据_09

在下文中，我将演示 AUC-PR 下的面积如何受预测性能的影响。

AUC-PR是完美的分类器

理想的分类器不会产生任何预测错误。因此，它将获得1的AUC-PR：

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_数据_10

AUC-PR是一个好的分类器

将两个类分开但不完美的分类器将具有以下精确回忆曲线：

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_召回率_11

可视化分类器在没有任何错误的正面预测的情况下达到约50％的召回率。

坏分类器的AUC-PR

错误的分类器将输出其值仅与结果稍微相关的分数。这样的分类器只能以低精度达到高召回率：

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_数据_12

召回率仅为20％时，分级机的精度仅为60％。

随机分类器的AUC-PR

随机分类器的AUC-PR接近0.5。这很容易理解：对于每个正确的预测，下一个预测都是不正确的。

拓端tecdat|R语言代写辅导中绘制ROC曲线和PR曲线_召回率_13

AUC-PR的分类器比随机分类器表现更差

标签：PR,AUC,ROC,预测,曲线,0.5,分类器,hat
From： https://blog.51cto.com/u_14293657/5835813

我服了！SpringBoot升级后这服务我一个星期都没跑起来！（上）
最近由于各方面的原因在准备升级SpringCloud和SpringBoot，经过一系列前置的调研和分析，决定把SpringBoot相关版本从2.1.6升级到2.7.5，SpringCloud相关版本从Green......
Python用Apriori 算法关联规则分析亚马逊购买书籍关联推荐客户和网络图可视化
Apriori算法是一个相当新的算法，由Agrawal和Srikant于1994年提出。它是一种用于频繁项集挖掘的算法，允许公司理解和组织向上销售和交叉销售活动。视频：R语言关联规则模......
React高级特性之Render Props
renderprop是一个技术概念。它指的是使用值为function类型的prop来实现Reactcomponent之间的代码共享。如果一个组件有一个render属性，并且这个render属性的值为一个返......
R语言用隐马尔可夫Profile HMM模型进行生物序列分析和模拟可视化
相关视频：马尔可夫链原理可视化解释与R语言区制转换Markovregimeswitching实例马尔可夫链原理可视化解释与R语言区制转换Markov regime switching实例，时长07:25......
R语言决策树和随机森林分类电信公司用户流失churn数据和参数调优、ROC曲线可视化
在本教程中，我们将学习覆盖决策树和随机森林。这些是可用于分类或回归的监督学习算法。从决策树到随机森林：R语言信用卡违约分析信贷数据实例，时长10:11 下面的代码将加载本教......
关联规则APRIORI挖掘豆瓣读书评论爬虫采集数据与可视化
豆瓣读书是豆瓣网的一个子版块。本文数据来源于豆瓣读书网站，分析内容将基于豆瓣读书的图书评分和评论信息。主题将紧紧围绕以下几点：有哪些书籍值得推荐？一般书籍的价格是多......
SpringCloud 的 Ribbon负载均衡、原理分析及负载均衡策略与自定义策略、饥饿加载
(目录)Ribbon负载均衡我们添加了@LoadBalanced注解，即可实现负载均衡功能，这是什么原理呢？负载均衡原理SpringCloud底层其实是利用了一个名为Ribbon的组件，来实现......
Prometheus使用指南
一、介绍1.基本概念prometheus是一种时间序列的数据库，适合应用于监控以及告警，但是不适合100%的准确计费，因为采集的数据不一定很准确，主要是作为监控以及收集内存、CPU、硬盘......
The bean 'sysDictService' could not be injected because it is a JDK dynamic prox
问题2022-11-0911:26:21.693ERROR18228---[restartedMain]o.s.b.d.LoggingFailureAnalysisReporter:***************************APPLICATIONFAILEDTO......
Craft App Height and Width expressions to create responsive canvas apps
Ifyou’vebuiltcanvasappsusingPowerApps,you’venoticedthatoneofthefirstdecisionsyouneedtomakeiswhetheryouwantalayoutthatistailoredfo......