首页 > 其他分享 >方差分析中的“元”和“因素”是什么?

方差分析中的“元”和“因素”是什么?

时间:2023-04-21 12:36:23浏览次数:43  
标签:因素 表达 什么 基因 方差分析 指标 试验


试验中要考察的指标称为试验指标,影响试验指标的条件称为因素,因素所处的状态称为水平 (通常用于3个或更多水平时;如果只有2个水平考虑T-test);若试验中只有一个因素改变则称为单因素试验,若有个因素改变则称为因素试验,若有个因素改变则称为因素试验。

方差分析就是对试验数据进行分析,检验方差相等的多个正态总体 均值是否相等,进而判断各因素对试验指标的影响是否显著;根据影响试验指标条件的个数可以区分为单因素方差分析、双因素方差分析和多因素方差分析。(来源于:百度百科)

方差分析中的因素

方差分析中的因素通常是人为选定或可控的影响条件,如对样品的人为处理、样品自身的标记属性等。不可控因素如病人的心情、试验操作人的心情等一般不视为因素或不作为关注的因素;(还有一些不可控因素或通常认为不会带来很多影响的因素,如不同的取样时间、不同的RNA提取时间、提取人、细胞所处的分裂周期等;在某些情况下,如果我们记录了这些因素并且关心这些因素时,也会变为方差分析中的因素)。

举个例子,比如病人服用不同浓度药物后基因表达变化试验中:

  • 基因表达试验指标;
  • 药物浓度是因素,假设有3个水平低浓度中浓度高浓度

这就是单因素方差分析 (one-way ANOVA),比较病人服用不同浓度药物后基因表达的均值是否相等;

如果同时考虑病人的年龄的影响,则

  • 年龄也是因素,有多个水平比如幼年青年成年老年等。

这就是两因素方差分析 (two-way ANOVA),比较用药浓度和年龄对基因表达变化的影响,称为“主效应”影响;有时还需要同时比较浓度+年龄组成的新变量对基因表达变化的影响,称为“交互效应”影响。(如果只是比较浓度+年龄组成的新变量对基因表达变化的影响,就又是单因素方差分析了)

如果再考虑病人的籍贯、药物种类、吃药时间、病人Marker突变等的影响,就是多因素方差分析了。

方差分析中的试验指标

试验中要考察的指标称为试验指标。在上面的例子中基因表达是一个试验指标,不过很笼统,默认为是个基因的表达,称为一元方差分析

那如果是关注个基因或所有基因的表达变化整体是否有差异呢?

这就是多元方差分析,每组样本不是只包含一个试验指标而是多个试验指标

表现在数据形式上:

  • (一元)方差分析是比较多组向量的均值是否存在显著差异。
  • 多元方差分析是比较多组矩阵的均值是否存在显著差异。

因此,比较多组样本整体基因表达的差异、多组样本整体菌群构成的差异,就需要多元方差分析了。

多元方差分析

在统计学中,多元方差分析 (MANOVA, multivariate analysis of variance) 是一种对多个分组中检测了多个指标变量 (这里的变量等同于上面的指标;如每个样本中每个物种的丰度信息、每个样本中每个基因的表达信息)的样本整体均值的检验方法  。作为一个多变量过程,它在有两个或多个因变量时使用,并且通常会分别涉及各个因变量的显着性检验。它有助于回答:

  1. 自变量 (因素)的变化是否对因变量 (试验指标)有显着影响?
  2. 因变量之间有什么关系?
  3. 自变量之间有什么关系?

注: 对应上面 - 所有的因素都是自变量 (independent variable),而试验指标因变量 (dependent variable)。这在看英文文献或不同教程时需要注意描述差异。

多元方差分析 (MANOVA, multivariate analysis of variance)的前提假设可类比于一元方差分析 (观测指标值的独立性、正态性、方差齐性)

  1. 数据独立性。
  2. 每个分组内的检测指标符合多元正态分布。
  3. 每个分组内的检测指标的协方差矩阵一致。

但在很多生物、生态和环境数据集中,多元方差分析的前提假设通常难以满足。

一些鲁棒性更强、对数据分布依赖更少的检验方法被提出来并且获得广泛应用,如ANOSIM (analysis of similarities), PERMANOVA (permutational multivariate analysis of variance) (也称为NPMANOVA, non-parametric MNOAVA), 和Mantel test。这些方法都通过一个样本间的距离矩阵或相似性矩阵构建ANOVA分析类似的统计量,然后对每组的观测结果进行随机置换来计算显著性P-value。对于单因素分析,对数据唯一的假设条件就是观察指标数据存在可置换性 (exchangeability)。

下面我们再介绍如何应用PERMANOVA来检验PcOA等的结果的显著性。

方差分析中的“元”和“因素”是什么?_大数据

方差分析中的“元”和“因素”是什么?_大数据_02

标签:因素,表达,什么,基因,方差分析,指标,试验
From: https://blog.51cto.com/u_16077014/6212516

相关文章

  • 什么配置的电脑可满足基因组索引构建的需求?
    经常有朋友问起自己要做什么分析,推荐一个电脑的配置。通常限制程序运行的最主要因素是内存,内存不足程序会直接运行不起来,CPU性能弱顶多是运行的慢,硬盘比较便宜,不需要特别评估。针对这个问题,我们准备推出一系列测试推文,统计计算常用软件的运行时间、所需的最大物理内存(后面统计的都......
  • linux 下 rm 为什么要这么写?
    在我们的培训课程改为长期课之后(易生信培训改为长周期模式),大家学习、练习、理解宏基因组、扩增子、转录组、全基因组各个分析流程的时间也多了,每次直播都能提出很多代码使用的问题,更加促进了代码的理解、培训知识的落地、应用于自己的分析。有时一次直播全用来回答最近一周练习......
  • 分析什么情况下回有大量的垃圾回收(GC)
    在前端性能监控中,大量的垃圾回收(GC)通常是由以下原因导致的:内存泄漏:当页面中的对象没有被正确地释放或引用计数错误时,会导致内存泄漏。当内存中的对象达到一定数量时,JavaScript引擎会执行垃圾回收以释放这些不再使用的对象,从而导致大量的GC。频繁的创建和销毁对象:如果页面......
  • Linux系统中Shell的优势是什么?
    Linux系统中Shell的优势是什么?京东云开发者 51Testing软件测试网 2023-04-2017:30 发表于上海  Shell可以帮我们做什么 作为一名测试开发工程师,在与Linux服务器交互过程中,大都遇到过以下这些问题:一次申请多台服务器,多台服务器需要安装相同软件,配置相同的环......
  • 什么样的测试才是优秀的测试
    什么样的测试才是优秀的测试优秀的测试应该包括以下要素:·测试代码的可读性和可维护性·代码在项目中及特定源代码中的组织方式·测试所检查的内容·测试的可靠性及可重复性·测试对测试替身的使用·可读的代码才是可维护的代码代码较差......
  • 【Spring】@Configuration为什么会生成代理呢?
    1 前言首先说下为什么会产生这样的疑惑哈,最近在看Spring-retry的时候,发现:其次我们再来看个现象,@Component声明了一个Bean,内部有个单例AService,当我们调用两次 aService()发现得到的对象不一样:@ComponentpublicclassDemo{publicclassAService{publ......
  • 将MySQL当中的数据表在PHP当中转换成数组并打印,为什么没有显示到网页上面呢?
    如果你已经成功将MySQL中的数据表转换成了PHP数组,并且没有在网页上看到输出,那么可能是因为你没有将数组中的数据正确地渲染到HTML代码中。以下是一个简单的示例代码,演示如何将PHP数组转换为HTML表格并输出到网页上:phpCopycode<?php//连接到MySQL数据库$servername="local......
  • Abbyy FineReader是什么软件 2023年有免费Abbyy软件的吗
    在数字化时代,数据处理和转换变得非常重要,AbbyyFineReader就是一款专门用于处理、转换和识别图像和PDF文件的软件。在本文中,我们将会详细介绍AbbyyFineReader的功能以及适合使用该软件的电脑。                         ......
  • 【个人杂谈】什么样的人才能赚钱?(转载)
    转载自:https://zhuanlan.zhihu.com/p/384516446应该有不少的人每天都在思考一个问题,就是到底怎么样才能多赚点钱?做什么行业是最赚钱的?当然前提是合法(俗话说:赚钱的方法都写在刑法里......
  • 为什么要虚拟化
    前言如标题中的问题所提到的虚拟化,容器,Docker和K8s那样,我们不妨这样问:这些技术到底适用于哪些场景,有没有别的技术可以替代?这些技术的优劣在哪里?下面我将针对性地从以上几个问题的出发点,去和大家分享自己的答案。一、虚拟化—历史的选择我们现在提到虚拟化技术,一般会知道有5种:......