首页 > 其他分享 >标准化(Z-score)

标准化(Z-score)

时间:2024-07-05 09:58:21浏览次数:18  
标签:12 均值 标准化 score 丰度 微生物 标准差

标准化(Z-score)是用于将不同微生物的丰度数据进行标准化处理,以便在热图中更容易比较和解释不同样本之间的差异。具体来说,标准化的过程如下:

abundance <- scale(
  abundance, 
  center = TRUE, # 减去均值
  scale = TRUE # 除以标准差
)

标准化过程详解:

  1. 减去均值(center = TRUE

    • 对每个微生物(列)来说,计算其在所有样本(行)中的均值。
    • 将每个样本的丰度值减去该微生物的均值。这一操作可以使得数据的均值为0,从而消除不同微生物由于丰度水平差异带来的影响。
  2. 除以标准差(scale = TRUE

    • 对每个微生物(列)来说,计算其在所有样本(行)中的标准差。
    • 将每个样本的丰度值(已经减去均值)除以该微生物的标准差。这一步将数据按标准差进行缩放,使得不同微生物的丰度值在标准化后具有相同的单位和尺度。

标准化的效果:

  • 均值为0:标准化后的每个微生物丰度数据的均值为0。
  • 方差为1:标准化后的每个微生物丰度数据的标准差为1。

这种标准化处理的好处是,使得不同微生物的丰度数据具有可比性,即使它们的原始丰度水平相差很大。通过这种处理,我们可以在热图中更清楚地看到哪些样本中哪些微生物的丰度相对较高或较低。

举例说明:

假设有三个样本(A, B, C)和两个微生物(X, Y)的丰度数据如下:

  X Y
Sample A 10 50
Sample B 12 55
Sample C 14 60
  1. 计算均值和标准差:

    • 微生物X:均值 = (10 + 12 + 14) / 3 = 12,标准差 = 2
    • 微生物Y:均值 = (50 + 55 + 60) / 3 = 55,标准差 = 5
  2. 标准化:

    • 微生物X:标准化后为 [(10-12)/2, (12-12)/2, (14-12)/2] = [-1, 0, 1]
    • 微生物Y:标准化后为 [(50-55)/5, (55-55)/5, (60-55)/5] = [-1, 0, 1]

标准化后的数据:

X Y
Sample A -1 -1
Sample B 0 0
Sample C 1 1

通过标准化处理后,尽管原始丰度数据差别很大,但标准化后的数据都在同一个尺度上,这使得我们在热图中更容易识别出哪些样本中哪些微生物丰度相对较高或较低。

标签:12,均值,标准化,score,丰度,微生物,标准差
From: https://www.cnblogs.com/wzbzk/p/18285194

相关文章

  • OCP4.2.2 主机标准化检查系统配置项修复clocksource 报错
    适应版本:社区版本OCP:4.2.2-20240315150922背景描述OCP纳管主机后进行主机标准化时,setclocksource一直没有成功   自动修复后还是有问题 分析过程查看官方ocp.4.2文档,有相关信息 执行相关命令再次查看文件并未写入tsc 重新检查 自动修复,......
  • 异常值检测(2)——Z-score和Grubbs假设检验
    Z分数异常检测        z分数异常检测是一种基于标准化的异常值检测方法,它不受数据分布假设的限制,可以广泛应用于各种类型的数据集。检测步骤:1.计算数据集的均值(μ)和标准差(σ)。2.计算每个数据点的z分数:z=(x-μ)/σ  其中x是原始数据点(它的值)。3......
  • [题解]AT_arc138_a [ARC138A] Larger Score
    思路不难发现:对于每一个\(i(1\leqi\leqk)\),如果能在\((k+1)\simn\)中找到任何一个\(j\),满足\(a_j>a_i\)就算满足条件。进一步思考,为了使操作数最小,对于每一个\(1(1\leqi\leqk)\),都找一个在\((k+1)\simn\)中第一个大于\(a_i\)的数,便于它交换。那么......
  • AUCell和AddModuleScore函数进行基因集评分
    AUCell和AddModuleScore分析是两种主流的用于单细胞RNA测序数据的基因集活性分析的方法。这些基因集可以来自文献、数据库或者根据具体研究问题进行自行定义。AUCell分析原理:1、AUCell分析可以将细胞中的所有基因按表达量进行排序,生成一个基因排名列表,表达量越高的基因排名......
  • YOLO 模型的评估指标——IOU、Precision、Recall、F1-score、AP、mAP、
    一、置信度是什么?置信度用于评估模型对检测结果的信心程度下图中,绿色框A表示GroundTruth,也称GT,GT就是正确的标注(人工)二、IOU与TP、FP、FNiou:表示预测的边界框(或分割区域)与真实边界框(或分割区域)之间的交集与并集之间的比值。阈值:根据实际情况可调节IOU=0.5如果预......
  • 11-标准化知识与IT服务相关标准
    11.1标准化知识11.1.1标准相关概念标准化是指“为了在一定范围内获得最佳秩序,对现实问题或潜在问题制定共同使用和重复使用的条款的活动”(引自GB/T20000.1-2001,定义2.1.1)特点:共同使用和重复使用,针对的对象是现实问题或潜在问题总结:多项条款的组合构成了规范性文件,如果这......
  • 知识产权与标准化
    知识产权与标准化导航目录知识产权与标准化导航一、知识产权概述二、保护范围与对象三、保护期限四、知识产权归属五、侵权判定六、标准的分类一、知识产权概述知识产权:知识产权是指人们就其智力劳动成果所依法享有的专有权利,通常是国家赋予创造者对其智力成果在一定时期内享......
  • 分类算法中精确率、召回率、F1 Score的理解
    在机器学习和深度学习中,将分类任务的预测结果分为以下四种,被称作混淆矩阵:TruePositive(TP):预测出的为正例,标签值也为正例,预测正确FalseNegative(FN):预测出的为负例,标签值为正例,预测错误FalsePositive(FP):预测出的为正例,标签值为负例,预测错误TrueNegative(TN):预测出的为负......
  • CF1787H Codeforces Scoreboard
    CF1787HCodeforcesScoreboard校内测试的一道题,考试时根本没动。。题面考虑\(k\)比较大的放前面肯定优,然后修门挨着放也肯定优,所以先按\(k\)排个序,然后我们就只考虑每个门修不修。设计状态\(f[i][j]\)表示前\(i\)个点,有\(j\)个门取\(b-kt\),少送回去的最少......
  • 随机抽样将所有样本的测序深度标准化到相同的水平
    dataset$sample_sums()%>%range#计算并查看样本总数的范围dataset$rarefy_samples(sample.size=1000000)#执行重采样,标准化样本中的测序深度"46featuresareremovedbecausetheyarenolongerpresentinanysampleafterrandomsubsampling..."这意味着在稀......