在生物信息学中,变异等位基因频率(Variant 等位基因频率,VAF)是指在一个种群中,某个特定变异位点上变异等位基因出现的频率,常见的计算 VAF 的方法如下:
1. 基于测序深度的计算方法
- 原理:通过统计变异位点的测序深度以及变异等位基因的支持 reads 数来计算 VAF。测序深度是指在该位点上所有覆盖到的 reads 数量,而变异等位基因的支持 reads 数是指与参考基因组不同的等位基因的 reads 数量。
- 计算公式:VAF = 变异等位基因的支持reads数量/ 测序深度
- 例子:假设在某个变异位点上,测序深度为 100X,其中有 20 条 reads 支持变异等位基因,则 VAF = 20 / 100 = 0.2
2. 基于基因型数据的计算方法
- 原理:如果已经有了个体的基因型数据,可以直接根据基因型来计算 VAF。对于二倍体生物,每个个体在每个位点上有两个等位基因。
- 计算公式:
纯合变异:VAF=1.0
杂合变异:VAF=0.5 - 例子:若一个个体在某位点的基因型为 AA,则该位点无变异,VAF = 0;若基因型为 Aa,则为杂合变异,VAF = 0.5;若基因型为 aa,则为纯合变异,VAF = 1。
3. 基于群体数据的计算方法
- 原理:在群体遗传学研究中,通常会对多个个体进行测序或基因分型,以了解某个变异在群体中的分布情况。此时,可以通过统计群体中所有个体在该变异位点上的等位基因情况来计算群体水平的 VAF。
- 计算公式:VAF = 群体中所有个体的变异等位基因数 / 群体中所有个体的等位基因总数
- 例子:假设在一个包含 100 个个体的群体中,某个变异位点上,所有个体的等位基因总数为 200 个,其中变异等位基因数为 40 个,则VAF = 40 / 200 = 0.2。