两样本的孟德尔随机化研究只需要基于gwas summary数据,就可以研究暴露因素和结局变量之间的因果关系,是最广泛使用的研究手段之一。要保证MR研究结果的可靠性,需要在分析的各个环节进行有效的质控。
孟德尔随机化研究中以遗传变异为工具变量,而合格的工具变量需要符合以下几个条件
- 与暴露因素的强关联,称之为关联性假设
- 与混杂因素相独立,称之为独立性假设
- 只会通过暴露因素对结局变量造成影响,称之为排他性假设
众所周知,基因具有多效性(pleiotropy effect), 当把具有多效性的基因纳入工具变量的集合时,会对MR的分析结果造成影响。当多效性的基因可以通过混杂因素影响结局变量时,违背了独立性假设;当多效性的基因可以通过代谢通路等其他途径来影响结局变量时,违背了排他性假设。无法满足以上3点的遗传变异,称之为无效的工具变量。
为了确保分析结果的准确性,需要对无效工具变量进行检验, 有多种检验方式,其核心思想是异质性检验, 假设每个工具变量的因果效应估计值是相似的,当存在无效工具变量时,其计算得到的因果效应估计值与有效的工具变量存在较大差异,总体上看就会存在显著的异质性。
在进行无效工具变量的显著性检验时,常用的方法为Cochran’s Q检验,这一检验异质性的方法在meta分析中广泛使用。Q检验适用于处理如下数据
subject表示样本,其他列表示不同的条件。Q检验要求条件的个数要大于等于2,而且每个样本的数值为分二类的数值。其空假设为所有条件下数值的分布相同,其统计量称之为Q, 计算公式如下
其中
N表示样本总数,k表示条件的个数,i表示行,j表示列,Y表示i行j列对应的值。当样本量很大时,Q统计量服从自由度为k-1的卡方分布,对应p值的计算公式如下
当pvalue小于0.05 ,认为异质性不显著。除了Q检验外,还有一种在Q统计量的基础上发展而来的I square统计量,计算公式如下
通常情况下,I square的值在0-0.25之间,认为是较低异质性;0.25-0.5之间,中等程度的异质性,0.5到0.75之间,真实存在异质性,0.75以上,异质性很大。
在MR分析中,为了确保分析结果的可靠性,有必要进行无效工具变量的检验。
·end·
—如果喜欢,快分享给你的朋友们吧—