- 2024-06-16尘封在文件夹中的GWAS和QTL定位的古老笔记
longlongago,小野记录了关于重测序基因定位和GWAS相关的笔记。打开古老的文件夹,发现有些东西依然不过时,零零散散,随意发布。QTL定位策略:群体类型:作图群体,自然群体选材策略:全群个体分析,选择基因型分析,混合分组分析优点:适合稀有基因研究;群体可控,目的性和结果预期性强缺点:需
- 2024-04-27scPagwas-gwas data pruning的处理-inhouse 【未完成整理】
总共三个大步骤:step1:提取503例EUR-Sample的1000G.EUR.QC.chr,通过python脚本批量跑plink得到step2:提取my-MDD中SNP的1000G.EUR.QC.chr-sub-chr,通过python脚本批量跑plink得到step3:进行pruning,得到MDD.chr*_plink_prune_EUR_filtered_LD0.8.prune.in,通过python脚本批量跑pli
- 2023-11-29GWAS + 选择进化 代码
library(CMplot)library(tidyverse)fst=choose.files()pi=choose.files()fst1=read.table(fst,header=T)head(fst1)fst2=fst1%>%select(1,2,3,6)%>%top_frac(0.05,wt=MEAN_FST)head(fst2)write.table(fst2,"fst_vasuclar.txt",qu
- 2023-11-26GWAS:plink进行meta分析
之前教程提到过Metal是可以做Meta分析,除了Metal,PLINK也可以进行Meta分析。命令如下所示:plink--meta-analysisgwas1.plinkgwas2.plinkgwas3.plink+logscaleqt--meta-analysis-snp-fieldSNP--meta-analysis-chr-fieldCHR--meta-analysis-bp-fieldBP--meta-analysis
- 2023-10-29GWAS软件包:GAPIT3它来啦
GAPIT是一款非常老的而且非常流行的软件包,傻瓜式操作,一键出图出结果,一篮子的解决方案,是我最经常使用的GWAS分析软件包。最近,GAPIT现在的版本是GAPIT3,速度比第二版有较大的提升:更大的变化,终于有GAPIT这个软件包了,可以用library载入进去,而且安装方式可以用github安装,更符合R-style。1
- 2023-10-15SNP间的上位效应
传统的全基因组关联分析(GWAS)计算的是单个SNP与表型的相关性,除此之外,我们还可以进行SNP之间的互作效应与表型的相关性分析。上位效应的公式为:Y~b0+b1.A+b2.B+b3.AB+eY为表型,A和B分别为两个变异位点,在GWAS中通常指SNP,如果b3为显著,则说明存在上位效应。 REFhttps:
- 2023-06-23QQplot
在GWAS(基因组关联研究)中,QQplot(Quantile-Quantileplot,分位数-分位数图)是一种常用的统计图形,用于评估GWAS结果中的关联统计量是否偏离了预期的分布。GWAS旨在寻找基因型和表型之间的关联,通过对大量的SNP(单核苷酸多态性)进行关联分析。在GWAS中,每个SNP都会计算一个关联统计量(例如p
- 2023-06-22GWAS数据库
NHGRI-EBIGWAS数据库:https://www.ebi.ac.uk/gwas/描述:由美国国家人类基因组研究所(NHGRI)和欧洲生物信息研究所(EBI)合作建立的GWAS数据库,提供了公开可访问的GWAS关联结果和相关信息。GRASP:http://grasp.nhlbi.nih.gov/Overview.aspx描述:由美国国家心脏、肺部和血液
- 2023-06-21遗传相关估计方法
遗传相关(GeneticCorrelation)是遗传学核心概念,用于衡量表型之间由基因决定的相关性。实现方法包括LDSC(连锁不平衡得分回归; https://github.com/bulik/ldsc)、HDL(高精度似然函数;https://github.com/bulik/ldsc)、GNOVA(geneticcovarianceanalyzer;https://github.com/
- 2023-06-20GLM/MLM/CMLM
GLM(GeneralizedLinearModel)、MLM(MixedLinearModel)和CMLM(CompressedMixedLinearModel)都是统计模型,常用于基因组关联分析(Genome-WideAssociationStudy,GWAS)中。GLM(GeneralizedLinearModel):广义线性模型是一种常见的线性回归模型扩展,用于分析因变量与一个或多个自变量之
- 2023-06-20GWAS:表型的标准化(the normalization of phenotype)
GWAS表型的标准化方法一般有Quantilenormalization、Inverseranknormalization、Z-scorenormalization等。各自区别如下:一、Quantilenormalization该方法将每个样本中表型值进行排序,然后将其规范化到一个标准分布,通常是正态分布。规范化是通过将每个样本的分布等同于目标
- 2023-05-22post-GWAS: transcriptome-wide association studies (TWAS) 结果解读
Thetoppanelshowsallofthegenesinthelocus.ThemarginallyTWASassociatedgenesarehighlightedinblue,andthosethatarejointlysignificant(inthiscase,FAM109B)highlightedingreen.Thestatisticsforthejointlysignificantgenesarerepo
- 2023-04-26R语言实现GWAS结果显著SNP位点归类提取与变异类型转化
GWAS结果显著SNP位点归类提取与变异类型转化根据GWAS得到的Rresult文件信息,能够找出每个snp位点对应的显著性情况和基因变异信息,接下来,需要根据表格中的信息进行归纳总结,对不同显著性层次进行区分,找出可能性最大的点,过程比较繁琐。这里笔者分享一个算法,使统计SNP和变异类型变的
- 2023-02-14GWAS:mtag (Multi-Trait Analysis of GWAS) 分析
mtag(Multi-TraitAnalysisofGWAS)作用:通过对多个表型相似的GWASsummary结果进行联合分析,发现更多的表型相关基因座。以抑郁症状、神经质和主观幸福感这三个表型为例,
- 2023-01-03GWAS中的effective sample size
Forcontinuoustraits,theeffectivesamplesizeisthetotalsamplesize;Forbinarytraits,theeffectivesamplesizeisNcase*Ncontrol/(Ncase+Ncontrol).出
- 2022-12-15Post-GWAS: single-cell disease relevance score (scDRS) 分析
1、scDRS的计算原理如下所示:图片来源:ZhangMJ,HouK,DeyKK,etal.Polygenicenrichmentdistinguishesdiseaseassociationsofindividualcellsinsingle-ce
- 2022-12-04GWAS研究发现新的类风湿关节炎遗传机制
类风湿性关节炎(Rheumatoidarthritis,RA)是一种自身免疫性疾病,发病时,免疫系统攻击关节中的滑膜从而导致炎症,可造成关节损伤,严重时可导致残疾。尽管现代医疗技术可以改变R
- 2022-12-02Post-GWAS: Partitioned Heritability 分析
LDSC除了可以计算基因多效性、遗传度、遗传相关性,还可以计算不同的功能注释对表型的遗传度贡献,即PartitionedHeritability分析。下面具体讲讲怎么分析。1下载数据w
- 2022-11-11R数据分析:孟德尔随机化实操
好多同学询问孟德尔随机化的问题,我再来尝试着梳理一遍,希望对大家有所帮助,首先看下图1分钟,盯着看将下图印在脑海中: 上图是工具变量(不知道工具变量请翻之前的文章)的模式
- 2022-11-07gwas分析为什么使用f2
利用混合的F2群体研究水稻杂种优势机理的文章于2016年9月以Article的形式发表在Nature上(Huang等,2016),研究人员首先对水稻的杂交种进行分类,综合分类情况,选择17个能代表主
- 2022-11-04gwas流程
1.首先创建ID列表和表型文件用gwas5.sh进行FarmCPU和MLM进行关联分析(mvp_p_k.r),同时计算了PCA。2.用lddecay.sh计算vcf的ld,储存在lddecay文件夹3.用annovar对vcf进行注
- 2022-10-17GWAS做完了,下一步做什么?
通过GWAS分析可以找出与疾病相关联的SNP位点,然而我们的根本目的是找出可能导致疾病发生的SNP位点,这些位点位于GWAS分析结果中,完成了GWAS分析之后,我们还需要借助下游分析对
- 2022-08-18文献解读-An effificient hierarchical generalized linear mixed model for pathway analysis of genome-wide
文献解读Profiles文章题目:Anefficienthierarchicalgeneralizedlinearmixedmodelforpathwayanalysisofgenome-wideassociationstudies不想看英文题目:一