通过GWAS分析可以找出与疾病相关联的SNP位点,然而我们的根本目的是找出可能导致疾病发生的SNP位点,这些位点位于GWAS分析结果中,完成了GWAS分析之后,我们还需要借助下游分析对GWAS的分析结果进一步注释和挖掘,筛选可能致病的SNP位点。
相关的注释网站和数据库很多,为了更加方便和有效的利用各种资源,科学家搭建了一个整合型的在线网站FUMA
, 对应的文章发表在nature communications上,链接如下
网址如下
通过该网站,可以对GWAS分析结果中的SNP位点进行功能注释,基因优先级排序,并提供了结果的交互式展示,共包含以下两个模块
- SNP2GENE, 该模块输入GWAS分析的结果,对其中的显著SNP位点进行功能注释
- GENE2FUNC, 该模块输入为基因列表,对基因的功能进行注释
数据分析的pipeline示意如下
对于输入的GWAS分析结果,有两条分析路线,一条是经典的挑选显著SNP位点然后进行功能注释,另外一条是进行gene-based关联分析,筛选候选的关联基因,两种策略的结果都提供了交互式的结果展示。对于筛选出来的候选基因,提供了在不同组织中的表达和差异,以及在OMIM, DrugBank, GeneCards等数据库中的详细注释,并提供了pathway, go等功能富集分析结果。
如果想要上传自己的数据进行分析,需要注册账号,在没有注册账号的情况下,可以查看一些公开数据集的相关结果。以SNP2GENE这个模块为例,结果包含以下几个部分
1. Genome-wide plots
同时提供了SNP-based和Gene-based两种关联分析策略的结果,给出了经典的曼哈顿图,QQ图等结果展示形式,示意如下
2. summary of results
提供了显著SNP位点,基因组风险区域的个数以及分布等汇总信息,示意如下
3. table of results
提供了每个结果详尽的表格数据,示意如下
点击每一行可以查看locuszoom的结果,示意如下
官网还有更多的功能,请大家自行探究。通过该网站,可以轻松的对GWAS结果进行下游的功能注释,有助于筛选潜在的致病突变。
·end·