原文链接:http://tecdat.cn/?p=25564
原文出处:拓端数据部落公众号
最近我们被客户要求撰写关于生态学冗余分析RDA的研究报告,包括一些图形和统计输出。
冗余分析(redundancy analysis,RDA)是一种回归分析结合主成分分析的排序方法,也是多因变量(multiresponse)回归分析的拓展。从概念上讲,RDA是因变量矩阵与解释变量之间多元多重线性回归的拟合值矩阵的PCA分析。
本报告对植物生态多样性做了数据分析。
冗余分析
首先,加载数据。
要加载数据,所有文件都必须在工作目录中。
ste <- read.csv("sr.csv")
ev <- read.csv("ev.csv")
as <- read.csv("as.csv")
我对数据做了一些修改。首先,我将 ev
数据的所有定量变量(即除地貌单元外的所有变量)与 as
数据组合成一个名为 enqut
. 然后,我对数据进行了归一化, 允许非常不同单位的变量之间进行比较。最后,我在归一化的定量环境变量中添加了地貌单元列,创建数据框 era
,用于冗余分析。
enqut<- cbind(ev[,-5],ap)
enz <- scale
ut <- env[,5]
era<- data.frame
结构数据
我使用环境数据era
作为解释变量对植被结构进行了冗余分析。我将结果分配给对象 str
。
summary(str)
然后我得到了这个分析的 R 方和调整后R 方。
RsquareAdj
RsqeAdj$adj.r.sqd
制作三序图。
par
plot
points
usc <- scores
points
text
成分数据
首先我加载了物种数据。同样,该文件 PAl.csv
必须在工作目录中。为了降低大丰度的重要性,我将 Hellinger 转换应用于物种数据。
sp <- Hellinger(sp)
然后我使用所有环境变量作为解释变量进行了冗余分析。
head(suda)
# 获得R^2和调整后的R^2
(sR2 <- RseAdj
(spdj <- RseAdj$adj.r.sed)
以2型标尺 对物种数据制作 RDA三序图。
# 做好绘图空间
par
plot
# 绘制站点的分数
spc <- scores
points
# 绘制出物种的点数
ssc <- scores
points
# 绘制定量解释变量的箭头和它们的标签
spesc <- scores
arrows
env.names
text
# 绘制地貌单元中心点和它们的标签的绘图点
spsc <- scores
points
text
论文图形
这是为论文制作图形的代码。
par
ensc <- scores
arrows
points
# 制作绘图空间
par
plot
abline
mtext
# 绘制站点的分数
spsc <- scores
points
# 绘制出物种的点数
sp.sc <- scores
points
# 绘制定量解释变量的箭头和它们的标签
spsc <- scores
arrows
text
# 绘制地貌单元中心点和它们的标签的绘图点
unimes
spusc <- scores
points
text
最受欢迎的见解
1.matlab偏最小二乘回归(PLSR)和主成分回归(PCR)
2.R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析
6.r语言中对lasso回归,ridge岭回归和elastic-net模型
9.R语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA)
标签:分析,语言,回归,可视化,RDA,数据,冗余 From: https://www.cnblogs.com/tecdat/p/17805582.html