易混淆亲缘关系统计量（血缘系数、亲缘系数、近交系数）介绍

背景

血缘系数、亲缘系数、近交系数等表征亲缘关系的统计量，在遗传学中经常使用。然而，这些概念很容易混淆。下面是几个概念的区别。注意的是，这些名词大多由英文翻译而来，而不同地方的中文翻译可能会有所差异，以英文名词为准。

介绍之前简单说一下同源性（Identity by Descent, IBD）的概念，它指两个等位基因来源于同一祖先。

Kinship coefficient / Coefficient of kinship

血缘系数的定义

血缘系数/近亲系数（Coefficient of Kinship，简称 \(\phi\) ）是遗传学中的一个重要概念，表示两个个体之间共享等位基因的概率。具体来说，它表示从两个个体中随机选择的两个等位基因在一个基因座上同源（即从共同祖先继承）的概率（Probability that an allele at a locus for two individuals was inherited from the same genome）。

血缘系数的计算

血缘系数的计算涉及到追踪两个个体的家谱，并根据他们的共同祖先的数量和每代的遗传贡献来估算。例如，兄弟姐妹之间的系谱系数为0.25，因为他们有50%的概率从同一对父母继承相同的等位基因，而每个父母贡献了50%的遗传物质。

血缘系数 \(\phi_{XY}\) 可以通过以下公式计算：

\[\phi_{XY} = \sum (0.5)^{n_1 + n_2} \]

其中 \(n_1\) 和 \(n_2\) 分别是从共同祖先到个体 \(X\) 和 \(Y\) 的代数。

常见亲属关系的血缘系数

以下是一些常见亲属关系的亲属系数：

自我：\(\phi = 0.5\)（每个人与自己共享50%的等位基因）
父母与子女：\(\phi = 0.25\)（父母与子女共享25%的等位基因）
全同胞（兄弟姐妹）：\(\phi = 0.25\)（兄弟姐妹共享25%的等位基因，因为他们有50%的概率从同一对父母继承相同的等位基因。）
半同胞（同母异父或同父异母的兄弟姐妹）：\(\phi = 0.125\)（半同胞共享12.5%的等位基因）
祖父母与孙子女：\(\phi = 0.125\)（祖父母与孙子女共享12.5%的等位基因）
叔侄、姨甥关系：\(\phi = 0.125\)
堂表亲（第一代表亲）：\(\phi = 0.0625\)（堂表亲共享6.25%的等位基因）

Coefficient of relationship / coefficient of relatedness

亲缘系数的定义

亲缘系数（Coefficient of Relationship，简称 \(r\)）是指两个个体之间的遗传关系程度。它表示两个个体共享的基因的比例，通常用百分比或小数表示。亲缘系数是遗传学中的一个重要概念，用于估计亲属之间共享等位基因的概率。亲缘系数由 Sewall Wright 定义。亲缘系数数值上是血缘系数 \(\phi\) 的两倍。

亲缘系数的计算方法

亲缘系数基于家谱信息，可以通过追溯共同祖先来计算。假设两个个体 \(X\) 和 \(Y\) 通过多个路径可以追溯到他们的共同祖先，那么可以通过以下步骤计算他们的亲缘系数：

确定所有共同祖先。
计算每条路径的概率。对于每条路径，通过各代分支处的传递概率（每代为0.5）计算。
将所有路径的概率相加。

公式表示如下：

\[r_{XY} = \sum (0.5)^n \]

其中，\(n\) 是从共同祖先到 \(X\) 和 \(Y\) 的路径中间的代数。

常见亲属关系的亲缘系数

以下是一些常见亲属关系的亲缘系数：

自我：\(r = 1\)（每个人与自己共享100%的基因）
父母与子女：\(r = 0.5\)（父母与子女共享50%的基因）
全同胞（兄弟姐妹）：\(r = 0.5\)（兄弟姐妹共享50%的基因）
半同胞（同母异父或同父异母的兄弟姐妹）：\(r = 0.25\)（半同胞共享25%的基因）
祖父母与孙子女：\(r = 0.25\)（祖父母与孙子女共享25%的基因）
叔侄、姨甥关系：\(r = 0.25\)
堂表亲（第一代表亲）：\(r = 0.125\)（堂表亲共享12.5%的基因）

Coefficient of inbreeding

近交系数的定义

近交系数（Coefficient of Inbreeding，简称 \(F\) ）是衡量一个个体在某基因座位上从父母双方继承的等位基因是同源（即从共同祖先继承）的概率。简单来说，近交系数表示个体的父母是否有血缘关系及其程度，反映的是近亲交配的程度。近交系数由 Sewall Wright 最早定义，有时也称为固定系数 Fixation index。

近交系数的计算

近交系数 \(F\) 的计算通常涉及家族谱系图，并且需要知道个体的祖先及其关系。以下是计算近交系数的一般步骤：

识别共同祖先：确定个体的共同祖先（即个体的父母双方都从这些祖先继承了基因）。
确定路径：找到从共同祖先通过父母到个体的所有可能路径。
计算每条路径的概率：对于每条路径，从共同祖先到个体的每一步都有 50% 的概率传递一个等位基因。
累加所有路径的概率：将所有路径的概率累加起来。

对于一个个体来说，假设 \(A\) 是父母 \(X\) 和 \(Y\) 的共同祖先，近交系数 \(F\) 可以通过以下公式计算：

\[F = \sum_{A} \frac{1}{2^{n_1 + n_2 + 1}} (1 + F_A) \]

其中：

\(n_1\) 是从共同祖先 \(A\) 到个体 \(X\) 的代数。
\(n_2\) 是从共同祖先 \(A\) 到个体 \(Y\) 的代数。
\(F_A\) 是共同祖先 \(A\) 的近交系数。如果 \(A\) 是非近交个体，\(F_A = 0\)。

具体例子

假设一个个体 \(Z\) 的父母 \(X\) 和 \(Y\) 是全同胞（兄弟姐妹），那么个体 \(Z\) 的近交系数 \(F_Z\) 的计算如下：

识别共同祖先：假设 \(X\) 和 \(Y\) 的共同祖先是 \(A\) 和 \(B\)。
确定路径：从 \(A\) 到 \(X\) 和 \(Y\)，以及从 \(B\) 到 \(X\) 和 \(Y\) 的路径。
计算每条路径的概率：每条路径有两代（从 \(A\) 到 \(X\)，从 \(A\) 到 \(Y\)），所以 \((0.5)^{2 + 2 + 1} = (0.5)^5 = 0.03125\)。
累加所有路径的概率：有两条路径（通过 \(A\) 和通过 \(B\)），所以 \(2 \times 0.03125 = 0.0625\)。

因此，个体 \(Z\) 的近交系数 \(F_Z = 0.0625\)。

常见的近交系数

自我：\(F = 1\)（完全同质化）
父母与子女：\(F = 0.5\)
全同胞（兄弟姐妹）：\(F = 0.25\)
半同胞（同母异父或同父异母的兄弟姐妹）：\(F = 0.125\)
叔侄、姨甥关系：\(F = 0.125\)
堂表亲（第一代表亲）：\(F = 0.0625\)

换算

对于个体 \(r\) 和 \(j\)，同一亲属关系的亲缘系数 \(r_{ij}\) 数值上是血缘系数 \(\phi\) 的两倍。

亲缘系数 \(r_{ij}\) 与近交系数 \(F_i\) 和 \(F_j\) 的换算关系为：

\[r_{ij} = \frac{2F_{ij}}{\sqrt{1+F_i} \sqrt{1+F_j}} \]

对于二倍体生物：

血缘系数 \(\phi\)	近交系数 \(F\)	亲缘系数 \(r\)	亲属关系例子
1/2	1/2	1	同卵双胞胎、克隆体、自交
1/4	1/4	1/2	父母和孩子
1/4	1/4	1/2	亲兄弟姐妹
1/8	1/8	1/4	同母异父或同父异母的兄弟姐妹
1/8	1/8	1/4	祖父母和孙
1/8	1/8	1/4	叔/舅和侄女、姑/姨和侄子
1/16	1/16	1/8	曾祖父母和曾孙
1/16	1/16	1/8	伯/叔祖父和大侄、伯/叔祖母和大甥
1/16	1/16	1/8	表/堂兄弟姐妹
1/32	1/32	1/16	高祖父母和玄孙
1/32	1/32	1/16	父母的表/堂兄弟姐妹
1/64	1/64	1/32	从表兄弟姐妹
~0	~0	~0	陌生人

注意：

表中列出的近交系数 \(F\) 为对应亲属关系近交后子代的近交系数。
在给定的例子中，血缘系数 \(\phi\) 与近交系数 \(F\) 数值相等，但含义不一样。以母子关系为例，母 \(i\) 和子 \(j\) 的血缘系数 \(\phi_{ij}\) 为 1/4。表中列出的近交系数 \(F\) 在这里的值为虽然也为1/4，但其表达的意思是如果个体 \(i\) 与亲属 \(j\) 近交后，子代随机一个基因座的两个等位基因同源的概率为 1/4。

参考资料

标签：phi,系数,亲缘,等位基因,近交系数,个体
From： https://www.cnblogs.com/shiyanhe/p/18320765