首页 > 其他分享 >今天我们来聊一聊孟德尔随机化

今天我们来聊一聊孟德尔随机化

时间:2022-10-17 22:32:05浏览次数:74  
标签:因素 变量 来聊 一聊 暴露 随机化 SNP MR 位点

欢迎关注”生信修炼手册”!

在传统的实验设计中,由于种种混杂因素的存在,我们仅仅能够分析变量之间的关联性,最典型的比如GWAS, 对于显著的位点,只能够说明这些位点和性状之间存在关联。对于了解事情发生的原因和规律而言,关联性是不够的,我们需要的是因果性。为了更好的探究因果关系,必须在实验设计和方法上加以改进。

孟德尔随机化, Mendilian Randomization,  简写为MR, 是一种在流行病学领域应用广泛的一种实验设计方法。通过引入一个称之为工具变量的中间变量,来分析暴露因素和结局之间的因果关系,示意图如下

今天我们来聊一聊孟德尔随机化_随机化

参考资料

​http://chinaepi.icdc.cn/zhlxbx/ch/reader/create_pdf.aspx?file_no=20170427&flag=1&journal_id=zhlxbx&year_id=2017​

传统的实验方法直接探究暴露因素和结局变量之间的因果关联,由于混杂因素的存在,无法有效说明二者之间的因果性。工具变量的引入巧妙规避了混杂因素的影响,在上述模型中

  1. 暴露因素X和结局变量Y会受到混在因素U的影响
  2. 工具变量Z和混杂因素U之间不存在任何联系,相互独立
  3. 工具变量Z和暴露因素X之间存在关联性, 结局变量Y之间没有直接的关联性,仅能够通过暴露因素X和结局变量Y之间建立关联


之所以称之为孟德尔随机化,是因为在工具变量的选择上,将遗传变异作为了工具变量。在孟德尔遗传规律中,亲代等位基因随机分配给子代,基因型决定表型,基因型通过表型与疾病发生关联,基因型看做是工具变量Z, 表型看做是暴露因素X, 疾病看做是结局变量Y。

基因型(特指胚系细胞的基因型)是先天决定的,不会受到生长环境,经济地位,行为因素的干扰,而且先有基因,再有表型,再有疾病,三者的先后顺序符合因果时序。

孟德尔随机化的具体实验设计有很多种,来看一个最简单的模型,示意如下

今天我们来聊一聊孟德尔随机化_数据_02

遗传变量G与暴露因素X有关联,如果观测到遗传变异与解决变量Y之间也存在关联,那么可以说明是遗传变异G通过暴露因素X对结局变量Y造成的影响,从而说明了暴露因素X和结局变量Y之间的因果性。

上述模型称之为一阶段MR, 为了增加分析结果的可靠性,量化关联效应的大小,还有很多更复杂的孟德尔随机试验设计,比如独立样本MR, 两样本MR, 双向MR, 两阶段MR, 基因-暴露交互作用MR等等,其中两样本MR,用来自相同群里的两批数据分别研究遗传变异G与暴露因素X, 遗传变异G与结局变量Y之间的关联性,通常是利用大样本量的GWAS分析,由于其样本量大,分析结果具有较好的把握度。而且可以基于已有的GWAS结果来进行分析,经济高效,应用的最为广泛。

在选择遗传变异时,可以是SNP,也可以是CNV等其他类型的遗传变异,只不过SNP使用的最多。对于SNP而言,并非选择全部的SNP位点,而是需要选择与暴露因素具有较强关联性的SNP位点,可以参考gwas结果来进行筛选。筛选出SNP位点之后,还有多种建模方式,可以利用单个SNP位点,多个SNP位点,等位基因个数,遗传风险评分等不同方式来建模,量化关联。使用多个SNP位点来建模时,需要进行MR-Egger分析来评价基因多效性带来的偏倚。

GWAS数据的不断增加为孟德尔随机化研究提供了数据基础,随着统计方法的推陈出新,各种组学技术的发展,孟德尔随机化的研究也应用的越来越广泛。

·end·



今天我们来聊一聊孟德尔随机化_数据_03


标签:因素,变量,来聊,一聊,暴露,随机化,SNP,MR,位点
From: https://blog.51cto.com/u_10721944/5764557

相关文章

  • 孟德尔随机化中的无效工具变量检验
    ​两样本的孟德尔随机化研究只需要基于gwassummary数据,就可以研究暴露因素和结局变量之间的因果关系,是最广泛使用的研究手段之一。要保证MR研究结果的可靠性,需要在分析的各......
  • 孟德尔随机化研究中评估因果效应大小的方法
    欢迎关注”生信修炼手册”!孟德尔随机化研究借助遗传变异这一工具变量,来评估暴露因素与结局变量之间的因果效用。为了准确评估因果效应的大小,有多种方法相继被发明。本文重......
  • 聊一聊被 .NET程序员 遗忘的 COM 组件
    一:背景1.讲故事最近遇到了好几起和COM相关的Dump,由于对COM整体运作不是很了解,所以分析此类dump还是比较头疼的,比如下面这个经典的COM调用栈。0:044>~~[138c]s......
  • AtCoder Beginner Contest 272 G - Yet Another mod M // 随机化
    题目来源:AtCoderBeginnerContest272G-YetAnothermodM题目链接:ABC272G-YetAnothermodM题意给定一个大小为\(N\),元素各不相同的数组\(A\)。求一个数字\(......
  • 虫逢——随机化数据的随机化处理
    【清华集训2014】虫逢一道随机化数据的好题。题干小强和阿米巴是好朋友。阿米巴告诉小强,变形虫(又叫阿米巴虫)和绝大多数生物一样,也是有DNA的。并且,变形虫可以通过分......
  • 聊一聊输入阻抗、输出阻抗和阻抗匹配
    ▼关注公众号:工程师看海▼朋友问了一个问题:“集总参数电路中,阻抗匹配(内阻=外阻)可以使负载得到最大的功率输出”这句话怎么理解?这里涉及到几个概念:输入阻抗、输出阻抗、阻抗......
  • 【Coel.学习笔记】随机化算法:模拟退火与爬山法
    简介模拟退火(\(\text{SimulateAnneal}\))和爬山法是随机化算法,二者的原理都在于通过随机生成答案并检查,把答案逐步缩小在一个可行的区间,尽可能地靠近正确答案。在考场......
  • 随机化方法
    受约束的随机验证提供了三种随机化的方法:1.Randomize()2.Pre-randomize()3.Post-randomize()每个类都有一个内置的randomize()方法,它是一个虚函数,它为受约束的......
  • 随机化与SA学习笔记
    SA今天翻出了很久之前给自己安排做的题P4035[JSOI2008]球形空间产生器结果我把高斯消元忘了,想起之前拿随机化贪心骗分的快乐,于是学习了另一种解法A掉这道题。看标签都......
  • 聊一聊向上管理
    聊一聊向上管理一、先看看向下管理在平时大家日常工作中,遇到最多的情况其实是领导向下管理。也就是领导会分配工作任务,任务排期,然后验收大家的工作情况。这些工作任务也......