在这段R Markdown代码中,代表bootstrapping思想的代码片段是以下几段:
- 这部分代码使用bootstrapping方法来估计活性(Active)和抑制(Repressed)状态下
ave
列的中位数:
active_med <- c()
repress_med <- c()
for (rep in 1:100) {
active_sample <- sample(active_rep$ave, size = length(active_rep), replace = T)
repress_sample <- sample(repress_rep$ave,size = length(repress_rep),replace = T)
active_med <- c(c(active_med),median(active_sample))
repress_med <- c(c(repress_med),median(repress_sample))
}
- 这部分代码通过多次随机抽样来估计
result
中1
的数量的分布,并计算其均值和标准差:
num_count <- c()
for (rep in 1:1000) {
sample_num <- sample(result,276,replace = T)
num_count <- c(length(sample_num[sample_num==1]),c(num_count))
}
- 这部分代码使用一个双层循环来为
movie
数据集中的每个电影计算95%置信区间的上下界,这也是bootstrapping方法的应用:
min_list <- c()
max_list <- c()
for (i in 1:length(movie$students)){
size0 <- 267 - movie$students[i]
size1 <- movie$students[i]
sample0 <- rep(0, size0)
sample1 <- rep(1, size1)
result <- c(sample0, sample1)
num_count <- c()
for (rep in 1:1000) {
sample_num <- sample(result,276,replace = T)
num_count <- c(length(sample_num[sample_num==1]),c(num_count))
}
quan <- quantile(num_count,probs = c(0.025,0.975))
result <- as.matrix(quan)
min_list <- c(c(min_list),result[1])
max_list <- c(c(max_list),result[2])
}
Bootstrapping是一种统计方法,它通过从数据集中进行多次随机抽样(有放回),来估计统计量的分布。在上述代码中,这种方法被用来估计中位数、数量的分布以及构建置信区间。
标签:置信区间,bootstrapping,代码,这部分,估计,随机抽样 From: https://www.cnblogs.com/chen-heybro/p/18221610