首页 > 其他分享 >易混淆亲缘关系统计量(血缘系数、亲缘系数、近交系数)介绍

易混淆亲缘关系统计量(血缘系数、亲缘系数、近交系数)介绍

时间:2024-07-24 14:09:28浏览次数:10  
标签:phi 系数 亲缘 等位基因 近交系数 个体

背景

血缘系数、亲缘系数、近交系数等表征亲缘关系的统计量,在遗传学中经常使用。然而,这些概念很容易混淆。下面是几个概念的区别。注意的是,这些名词大多由英文翻译而来,而不同地方的中文翻译可能会有所差异,以英文名词为准。

介绍之前简单说一下同源性(Identity by Descent, IBD)的概念,它指两个等位基因来源于同一祖先。

image

Kinship coefficient / Coefficient of kinship

血缘系数的定义

血缘系数/近亲系数(Coefficient of Kinship,简称 \(\phi\) )是遗传学中的一个重要概念,表示两个个体之间共享等位基因的概率。具体来说,它表示从两个个体中随机选择的两个等位基因在一个基因座上同源(即从共同祖先继承)的概率(Probability that an allele at a locus for two individuals was inherited from the same genome)。

血缘系数的计算

血缘系数的计算涉及到追踪两个个体的家谱,并根据他们的共同祖先的数量和每代的遗传贡献来估算。例如,兄弟姐妹之间的系谱系数为0.25,因为他们有50%的概率从同一对父母继承相同的等位基因,而每个父母贡献了50%的遗传物质。

血缘系数 \(\phi_{XY}\) 可以通过以下公式计算:

\[\phi_{XY} = \sum (0.5)^{n_1 + n_2} \]

其中 \(n_1\) 和 \(n_2\) 分别是从共同祖先到个体 \(X\) 和 \(Y\) 的代数。

常见亲属关系的血缘系数

以下是一些常见亲属关系的亲属系数:

  • 自我:\(\phi = 0.5\)(每个人与自己共享50%的等位基因)
  • 父母与子女:\(\phi = 0.25\)(父母与子女共享25%的等位基因)
  • 全同胞(兄弟姐妹):\(\phi = 0.25\)(兄弟姐妹共享25%的等位基因,因为他们有50%的概率从同一对父母继承相同的等位基因。)
  • 半同胞(同母异父或同父异母的兄弟姐妹):\(\phi = 0.125\)(半同胞共享12.5%的等位基因)
  • 祖父母与孙子女:\(\phi = 0.125\)(祖父母与孙子女共享12.5%的等位基因)
  • 叔侄、姨甥关系:\(\phi = 0.125\)
  • 堂表亲(第一代表亲):\(\phi = 0.0625\)(堂表亲共享6.25%的等位基因)

Coefficient of relationship / coefficient of relatedness

亲缘系数的定义

亲缘系数(Coefficient of Relationship,简称 \(r\))是指两个个体之间的遗传关系程度。它表示两个个体共享的基因的比例,通常用百分比或小数表示。亲缘系数是遗传学中的一个重要概念,用于估计亲属之间共享等位基因的概率。亲缘系数由 Sewall Wright 定义。亲缘系数数值上是血缘系数 \(\phi\) 的两倍。

亲缘系数的计算方法

亲缘系数基于家谱信息,可以通过追溯共同祖先来计算。假设两个个体 \(X\) 和 \(Y\) 通过多个路径可以追溯到他们的共同祖先,那么可以通过以下步骤计算他们的亲缘系数:

  1. 确定所有共同祖先
  2. 计算每条路径的概率。对于每条路径,通过各代分支处的传递概率(每代为0.5)计算。
  3. 将所有路径的概率相加

公式表示如下:

\[r_{XY} = \sum (0.5)^n \]

其中,\(n\) 是从共同祖先到 \(X\) 和 \(Y\) 的路径中间的代数。

常见亲属关系的亲缘系数

以下是一些常见亲属关系的亲缘系数:

  • 自我:\(r = 1\)(每个人与自己共享100%的基因)
  • 父母与子女:\(r = 0.5\)(父母与子女共享50%的基因)
  • 全同胞(兄弟姐妹):\(r = 0.5\)(兄弟姐妹共享50%的基因)
  • 半同胞(同母异父或同父异母的兄弟姐妹):\(r = 0.25\)(半同胞共享25%的基因)
  • 祖父母与孙子女:\(r = 0.25\)(祖父母与孙子女共享25%的基因)
  • 叔侄、姨甥关系:\(r = 0.25\)
  • 堂表亲(第一代表亲):\(r = 0.125\)(堂表亲共享12.5%的基因)

Coefficient of inbreeding

近交系数的定义

近交系数(Coefficient of Inbreeding,简称 \(F\) )是衡量一个个体在某基因座位上从父母双方继承的等位基因是同源(即从共同祖先继承)的概率。简单来说,近交系数表示个体的父母是否有血缘关系及其程度,反映的是近亲交配的程度。 近交系数由 Sewall Wright 最早定义,有时也称为固定系数 Fixation index。

近交系数的计算

近交系数 \(F\) 的计算通常涉及家族谱系图,并且需要知道个体的祖先及其关系。以下是计算近交系数的一般步骤:

  1. 识别共同祖先:确定个体的共同祖先(即个体的父母双方都从这些祖先继承了基因)。
  2. 确定路径:找到从共同祖先通过父母到个体的所有可能路径。
  3. 计算每条路径的概率:对于每条路径,从共同祖先到个体的每一步都有 50% 的概率传递一个等位基因。
  4. 累加所有路径的概率:将所有路径的概率累加起来。

对于一个个体来说,假设 \(A\) 是父母 \(X\) 和 \(Y\) 的共同祖先,近交系数 \(F\) 可以通过以下公式计算:

\[F = \sum_{A} \frac{1}{2^{n_1 + n_2 + 1}} (1 + F_A) \]

其中:

  • \(n_1\) 是从共同祖先 \(A\) 到个体 \(X\) 的代数。
  • \(n_2\) 是从共同祖先 \(A\) 到个体 \(Y\) 的代数。
  • \(F_A\) 是共同祖先 \(A\) 的近交系数。如果 \(A\) 是非近交个体,\(F_A = 0\)。

具体例子

假设一个个体 \(Z\) 的父母 \(X\) 和 \(Y\) 是全同胞(兄弟姐妹),那么个体 \(Z\) 的近交系数 \(F_Z\) 的计算如下:

  1. 识别共同祖先:假设 \(X\) 和 \(Y\) 的共同祖先是 \(A\) 和 \(B\)。
  2. 确定路径:从 \(A\) 到 \(X\) 和 \(Y\),以及从 \(B\) 到 \(X\) 和 \(Y\) 的路径。
  3. 计算每条路径的概率:每条路径有两代(从 \(A\) 到 \(X\),从 \(A\) 到 \(Y\)),所以 \((0.5)^{2 + 2 + 1} = (0.5)^5 = 0.03125\)。
  4. 累加所有路径的概率:有两条路径(通过 \(A\) 和通过 \(B\)),所以 \(2 \times 0.03125 = 0.0625\)。

因此,个体 \(Z\) 的近交系数 \(F_Z = 0.0625\)。

常见的近交系数

  • 自我:\(F = 1\)(完全同质化)
  • 父母与子女:\(F = 0.5\)
  • 全同胞(兄弟姐妹):\(F = 0.25\)
  • 半同胞(同母异父或同父异母的兄弟姐妹):\(F = 0.125\)
  • 叔侄、姨甥关系:\(F = 0.125\)
  • 堂表亲(第一代表亲):\(F = 0.0625\)

换算

对于个体 \(r\) 和 \(j\),同一亲属关系的亲缘系数 \(r_{ij}\) 数值上是血缘系数 \(\phi\) 的两倍。

亲缘系数 \(r_{ij}\) 与近交系数 \(F_i\) 和 \(F_j\) 的换算关系为:

\[r_{ij} = \frac{2F_{ij}}{\sqrt{1+F_i} \sqrt{1+F_j}} \]

对于二倍体生物:

血缘系数 \(\phi\) 近交系数 \(F\) 亲缘系数 \(r\) 亲属关系例子
1/2 1/2 1 同卵双胞胎、克隆体、自交
1/4
1/4 1/2 父母和孩子
1/4
1/4 1/2 亲兄弟姐妹
1/8 1/8 1/4 同母异父或同父异母的兄弟姐妹
1/8 1/8 1/4 祖父母和孙
1/8 1/8 1/4 叔/舅和侄女、姑/姨和侄子
1/16 1/16 1/8 曾祖父母和曾孙
1/16 1/16 1/8 伯/叔祖父和大侄、伯/叔祖母和大甥
1/16 1/16 1/8 表/堂兄弟姐妹
1/32 1/32 1/16 高祖父母和玄孙
1/32 1/32
1/16 父母的表/堂兄弟姐妹
1/64 1/64 1/32
从表兄弟姐妹
~0 ~0 ~0 陌生人

注意:

  1. 表中列出的近交系数 \(F\) 为对应亲属关系近交后子代的近交系数。
  2. 在给定的例子中,血缘系数 \(\phi\) 与 近交系数 \(F\) 数值相等,但含义不一样。以母子关系为例,母 \(i\) 和子 \(j\) 的血缘系数 \(\phi_{ij}\) 为 1/4。表中列出的近交系数 \(F\) 在这里的值为虽然也为1/4,但其表达的意思是如果个体 \(i\) 与 亲属 \(j\) 近交后,子代随机一个基因座的两个等位基因同源的概率为 1/4。

参考资料

标签:phi,系数,亲缘,等位基因,近交系数,个体
From: https://www.cnblogs.com/shiyanhe/p/18320765

相关文章

  • Geostudio简单实现边坡安全系数的计算
    Geostudio是加拿大团队开发的用于岩土工程稳定性分析的一款工程软件,里面的安全系数的计算基本都是基于极限平衡法原理进行求解的,SLOPE/W模块用于安全系数的求解。SEEP/W模块考虑渗水作用。QUAKE/W模块考虑地震因素。其余模块不常用。今天教大家如何对简易边坡进行一个简单的求......
  • 有名管道:实现无亲缘关系进程间的通信
    有名管道的基本概念:具体操作例程:vimkfifo.c  编辑下列代码:#include<stdio.h>#include<sys/types.h>#include<sys/stat.h>#include<fcntl.h>#include<unistd.h>intmain(){intret;intfd;intnread;charreadbuff[50]={0};ret=......
  • C++ 空间和时间高效的二项式系数(Space and time efficient Binomial Coefficient)
    这里函数采用两个参数n和k,并返回二项式系数C(n,k)的值。 例子: 输入:n=4和k=2输出:6解释:4C2等于4!/(2!*2!)=6输入:n=5和k=2输出:10解释:5C2等于5!/(3!*2!)=10        在本文中,我们讨论了O(n*k)时间和O(k)额外空间算法。C(n,......
  • Java 空间和时间高效的二项式系数(Space and time efficient Binomial Coefficient)
    这里函数采用两个参数n和k,并返回二项式系数C(n,k)的值。 例子: 输入:n=4和k=2输出:6解释:4C2等于4!/(2!*2!)=6输入:n=5和k=2输出:10解释:5C2等于5!/(3!*2!)=10        在本文中,我们讨论了O(n*k)时间和O(k)额外空间算法。C(n,......
  • PART1-Oracle关系数据结构
    2.Oracle关系数据结构2.1.表和表簇2.1.1.模式对象简介数据库模式是数据结构的逻辑容器,这些数据结构称为模式对象。模式对象的例子有表和索引。模式对象是通过SQL创建和操作的。一个数据库用户拥有密码和各种数据库权限。每个用户拥有一个与其同名的模式。模式包含了属于......
  • R语言ggplot怎么在热图上标注相关系数
    1.R语言简介R语言是一种开源、免费的编程语言,主要用于统计分析、图形化和机器学习。以下是关于R语言的详细介绍:(1)起源和开发者R语言由奥克兰大学的RossIhaka和RobertGentleman在1993年开发,旨在提供一种强大的工具,用于处理和分析大型数据集。(2)主要特点面向统计:R语言为统......
  • R语言ggplot怎么在热图上标注相关系数
    1.R语言简介R语言是一种开源、免费的编程语言,主要用于统计分析、图形化和机器学习。以下是关于R语言的详细介绍:(1)起源和开发者R语言由奥克兰大学的RossIhaka和RobertGentleman在1993年开发,旨在提供一种强大的工具,用于处理和分析大型数据集。(2)主要特点面向统计:R语言为统计......
  • 关系数据库
    关系模型的数据结构及其形式化定义关系的形式化定义及其有关概念域(Domain):域是一组具有相同数据类型的值的集合。笛卡尔积(CartesianProduct):一个记录叫做一个元组(tuple),元组中每一个属性值,叫一个分量。允许其中某些域是相同的。D1,D2,…,Dn的笛卡尔积为:D1×D2×…×Dn={(d1,d......
  • Python统计实战:一题搞定一元线性回归的回归系数、显著性及预测值计算
    为了解决特定问题而进行的学习是提高效率的最佳途径。这种方法能够使我们专注于最相关的知识和技能,从而更快地掌握解决问题所需的能力。(以下练习题来源于《统计学—基于Python》。联系获取完整数据和Python源代码文件。)练习题随机抽取10家航空公司,对其最近一年的航班准点率......
  • 数据库系统概论-第6章关系数据理论
    6.1问题的提出针对一个具体问题,应该如何构造一个适合于它的数据库模式,即应该构造几个关系模式,每个关系由哪些属性组成。关系数据库的规范化理论。本章中把关系模式看作一个三元组R<U,F>。当且仅当U上的一个关系r满足F时,r称为关系模式R<U,F>的一个关系。作为一个二维表,关系要......