首页 > 编程语言 >拓端tecdat|R语言编程指导画ROC曲线总结

拓端tecdat|R语言编程指导画ROC曲线总结

时间:2022-11-27 21:00:57浏览次数:71  
标签:曲线 package ## downloads ROC tecdat 拓端 软件包

R语言画ROC曲线总结

 

 

 在本文中,我描述了如何在CRAN中搜索用于绘制ROC曲线的包,并重点介绍了六个有用的包。

尽管我从一些我想谈论的软件包开始就有了一些想法,例如​​ROCR​​​和​​pROC​​​(我在过去发现它们很有用),但我还是决定使用 相对较新的软件包​​pkgsearch​​​来搜索CRAN并查看其中的内容。该​​package_search()​​函数将文本字符串作为输入,并使用基本的文本挖掘技术来搜索所有CRAN。 

library(tidyverse)  # for data manipulation
library(dlstats) # for package download stats
library(pkgsearch) # for searching packages

拓端tecdat|R语言编程指导画ROC曲线总结_数据科学家

经过一番尝试和错误之后,我确定了以下查询,其中包括许多与ROC相关的有趣软件包。

rocPkg <-  pkg_search(query="ROC",size=200)

拓端tecdat|R语言编程指导画ROC曲线总结_数据科学家_02

 

rocPkgShort <- rocPkg %>% 
filter(maintainer_name != "ORPHANED", score > 190) %>%
select(score, package, downloads_last_month) %>%
arrange(desc(downloads_last_month))
head(rocPkgShort)

拓端tecdat|R语言编程指导画ROC曲线总结_搜索_03

## # A tibble: 6 x 3
## score package downloads_last_month
## <dbl> <chr> <int>
## 1 690. ROCR 56356
## 2 7938. pROC 39584
## 3 1328. PRROC 9058
## 4 833. sROC 4236
## 5 266. hmeasure 1946
## 6 1021. plotROC 1672

为了完成选择过程,我做了艰苦的工作,浏览软件包的文档,以挑选出我认为通常对大多数数据科学家有用的内容。下图使用了Guangchuang Yu的​​dlstats​​软件包,查看我选择分析的六个软件包的下载历史记录。

library(dlstats)
shortList <- c("pROC","precrec","ROCit", "PRROC","ROCR","plotROC")
downloads <- cran_stats(shortList)
ggplot(downloads, aes(end, downloads, group=package, color=package)) +
geom_line() + geom_point(aes(shape=package)) +
scale_y_continuous(trans = 'log2')

拓端tecdat|R语言编程指导画ROC曲线总结_数据科学家_04

拓端tecdat|R语言编程指导画ROC曲线总结_数据科学家_05

拓端tecdat|R语言编程指导画ROC曲线总结_搜索_06

 

2005年

 

以下代码​​ROCR​​使用包装随附的综合数据集设置并绘制默认的ROC曲线。在整个文章中,我将使用相同的数据集。

library(ROCR)
## Loading required package: gplots
##
## Attaching package: 'gplots'
## The following object is masked from 'package:stats':
##
## lowess
# plot a ROC curve for a single prediction run
# and color the curve according to cutoff.
data(ROCR.simple)
df <- data.frame(ROCR.simple)
pred <- prediction(df$predictions, df$labels)
perf <- performance(pred,"tpr","fpr")
plot(perf,colorize=TRUE)

拓端tecdat|R语言编程指导画ROC曲线总结_数据集_07

## Loading required package: gplots
## 
## Attaching package: 'gplots'
## The following object is masked from 'package:stats':
##
## lowess

拓端tecdat|R语言编程指导画ROC曲线总结_搜索_08

拓端tecdat|R语言编程指导画ROC曲线总结_搜索_09

 

2010

​ pROC​​​也受到数据科学家的欢迎。我喜欢​​AUC​​在图中绘制曲线下面积的置信区间非常容易。

拓端tecdat|R语言编程指导画ROC曲线总结_数据集_10

拓端tecdat|R语言编程指导画ROC曲线总结_数据科学家_11

拓端tecdat|R语言编程指导画ROC曲线总结_数据科学家_12

 

2014年

 该​​roc.curve()​​函数 会绘制出干净整齐的ROC曲线 。

 

拓端tecdat|R语言编程指导画ROC曲线总结_数据集_13

拓端tecdat|R语言编程指导画ROC曲线总结_数据科学家_14

2014年

该软件包提供了许多功能丰富的​​ggplot()​​几何图形 。 

拓端tecdat|R语言编程指导画ROC曲线总结_数据集_15

拓端tecdat|R语言编程指导画ROC曲线总结_搜索_16

 

 2015年

​precrec​​ 是另一个用于绘制ROC和精确调用曲线的库。

## 
## Attaching package: 'precrec'
## The following object is masked from 'package:pROC':
##
## auc

拓端tecdat|R语言编程指导画ROC曲线总结_数据科学家_17

拓端tecdat|R语言编程指导画ROC曲线总结_数据集_18

 

该​​evalmod()​​函数的参数选项使生成各种模型特征的基本图变得容易。

拓端tecdat|R语言编程指导画ROC曲线总结_搜索_19

拓端tecdat|R语言编程指导画ROC曲线总结_数据科学家_20

 

2019

​ROCit​​是一个用于绘制ROC曲线和其他二进制分类可视化效果的新程序包 ,并且正在迅速普及。 

## Warning: package 'ROCit' was built under R version 3.5.2

拓端tecdat|R语言编程指导画ROC曲线总结_数据科学家_21

拓端tecdat|R语言编程指导画ROC曲线总结_搜索_22

 

 下图显示了正响应和负响应的累积密度。KS统计数据显示两条曲线之间的最大距离。

ksplot(ROCit_obj)

拓端tecdat|R语言编程指导画ROC曲线总结_数据集_23

拓端tecdat|R语言编程指导画ROC曲线总结_数据集_24

拓端tecdat|R语言编程指导画ROC曲线总结_数据科学家_25

 

 

 

如果您有任何疑问,请在下面发表评论。 

 

▍关注我们 【大数据部落】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。



标签:曲线,package,##,downloads,ROC,tecdat,拓端,软件包
From: https://blog.51cto.com/u_14293657/5890340

相关文章