首页 > 其他分享 >基因组变异分析

基因组变异分析

时间:2023-12-15 11:14:26浏览次数:23  
标签:分析 校正 变异 模型 测序 基因组

基因组变异分析

基因组变异是指与参考序列相比,基因组中发生的单碱基变异、DNA序列片段插入、缺失、扩增和复杂结构变异等。

目前基于测序方法进行单核苷酸多态性(Single Nucleotide Polymorphism, SNP)、短的插入缺失(Insertion-Deletion, InDel)等变异检测的策略主要有:

 

(1)基于比对结果直接检测变异信息;

(2)基于从头组装结果比对检测变异信息。

而在结构变异(Structural Variation, SV)检测方面目前主要有四种策略:

(1)基于插入片段长度的异常分布(Read Pair, RP);

(2)基于读段覆盖度的异常分布(Read Depth, RD);

(3)基于未比对上的读段进行分割比对(Split Read, SR);

(4)长读段或者从头组装[43]。

不同策略可检测到的变异类型不同,可将多个策略整合在一起,从而大大降低假阳性率[43]。基于拼接的方法是当前获得全基因组范围内各类型变异最好的方法,但是该方法的结果准确性取决于高质量组装,有待高效准确组装方法的发展。GATK是当前公认的最主流的基因组变异分析软件之一,可应用于人和其它物种[44]。但是当前基因组数据变异分析在计算处理能力的瓶颈限制了这些技术的广泛使用,针对该问题已有用FPGA进行硬件加速、搭载GPU加速的Parabricks软件等方案来加速GATK的运行效率。测序读长加长可以提高变异分析的准确度,尤其是大的结构变异分析。未来测序技术的发展,兼具测序读长长和测序准确性,也将极大的改变变异检测方法的现状[45]。

如何解读这些变异信息,从海量的变异位点中筛选出真正具有生物学意义的基因位点是变异组学运用的主要瓶颈之一。目前可以通过GWAS分析获得基因型和表型之间的关系[46]。在GWAS分析中需要考虑适合样本的关联模型。样本的表型分两种:(1)数量性状的表型,这种关联分析主要采用线性回归模型,包括一般线性模型和混合线性模型,对于受到多因素共同影响的复杂数量性状常采用混合线性模型或者改进后的模型进行分析,仔细选择模型或者整合互补模型可以对复杂性状的遗传基础有更深入的了解[47,48];(2)case-control二元的表型,case和control比例失衡时,可能会导致较高的假阳性率,针对该问题提出的SAIGE模型显示出在样品比例极其失衡时结果仍较为正常的特点[49]。当前GWAS分析对于低频基因的挖掘能力有待提高,可以通过改进开发新的模型和新的群体设计揭示表型变异的确定原因[47]。而将GWAS关联结合转录组、甲基化组等组学研究的数据分析,即eQTL、meQTL等分析,则可以将表型与基因组变异,再到基因表达、甲基化等之间的关系联系起来。整合多组学数据进行联合分析揭示复杂性状的分子机制,这也是目前变异解析的主要挑战[50]。在识别各类QTLs位点的时候,需要进行多重假设检验和校正,常用的多重假设检验校正方法有Bonferroni校正、BH校正和随机打乱后进行Storey校正等[51]。当前的多重假设检验校正方法难以兼具准确性和速度,保证准确度需要耗费大量的内存和时间,尤其是对于trans-eQTLs位点识别时用随机打乱后进行Storey校正方法,通常的超级计算机集群是基本不可能完成的,亟需新的模型和算法优化来攻克这道难关[52]。

标签:分析,校正,变异,模型,测序,基因组
From: https://www.cnblogs.com/wangprince2017/p/17902931.html

相关文章

  • Uboot-3链接脚本lds分析
    1u-boot.lds解读(armv8)文件位于u-boot-2021.10\arch\arm\cpu\armv8\u-boot.lds。分析过程已在lds内部注释了./*SPDX-License-Identifier:GPL-2.0+*//**(C)Copyright2013*DavidFeng<[email protected]>**(C)Copyright2002*GaryJennejohn,DENXSof......
  • 高分辨率拼接案例分析【基础算法】
    一、案例来源本例项目来源于群里面网友提问“在流水线上采集到的图片,相互之间位移基本确定,需要进行进一步精细拼接”希望得到的结果。具体而言,这是一块大型服务器板子,会走点拍100张图【特定设备】,每张图有部分重合,算下来应该七百多宽度重合,图像大小为5000多。难点是重合的全是......
  • 倾斜摄影三维模型的根节点合并纹理匀色技术方法分析
    倾斜摄影三维模型的根节点合并纹理匀色技术方法分析 倾斜摄影三维模型的根节点合并中,纹理色彩匀色技术是一种重要的方法,旨在优化模型的纹理质量,使其在合并后呈现出更加均衡和自然的色彩。在本文中,我们将对纹理色彩匀色技术的方法进行详细分析。1、色彩均衡调整:色彩均衡调整......
  • R语言结构方程模型SEM、路径分析房价和犯罪率数据、预测智力影响因素可视化2案例|附代
    原文链接:http://tecdat.cn/?p=25044原文出处:拓端数据部落公众号最近我们被客户要求撰写关于结构方程模型的研究报告,包括一些图形和统计输出。1简介在本文,我们将考虑观察/显示所有变量的模型,以及具有潜在变量的模型。第一种有时称为“路径分析”,而后者有时称为“测量模型”。......
  • 软件需求与分析课堂测试十——综合案例分析
    根据下列案例需求描述,回答相关问题:有一个对外营业的会议中心,有各种不同规格的会议室,为用户提供以下服务:1、用户可以按照会议人数、会议时间预订会议室。可以只预订1次,也可预订定期召开的会议。2、开会前允许用户修改会议时间、人数,重新选择会议室,甚至取消预订的会议。3、......
  • 高通msm8996平台的ASOC音频路径分析
    前言关于为什么要记录音频链路音频链路的链接是个什么东西,关于这一点,是一个从开始接触android音频的第一天就困扰的问题,几乎我所有对于音频框架的研究都是针对这个问题在进行,不知不觉中似乎把整个android、linux以及高通adsp的音频框架看了个遍,感觉整个音频框架其实也是围绕着这一......
  • 形式化建模与分析方法知识点
    这个是比较针对期末复习的知识点整理,根据我的复习随缘更新,如果发现有些部分没写那就是因为我还没复习到(大概)(PS:这些知识点中有很大部分来自老师的PPT,也有一部分来源于学长学姐整理的资料,最后也有一小部分来源于我自己的总结)一.简答题1.串行系统的程序正确性定义。......
  • 事后诸葛亮分析报告
    这个作业属于哪个课程https://edu.cnblogs.com/campus/gdgy/CSGrade21-12这个作业要求在哪里https://edu.cnblogs.com/campus/gdgy/CSGrade21-12/homework/13022这个作业的目标事后诸葛亮分析报告设想和目标1.我们的软件要解决什么问题?是否定义得很清楚?是否对......
  • Qt之modbus_slave例程的底层串口数据分析
    一.参考网址1. qCDebug输出到日志文件2. HowtoredirectqDebug,qWarning,qCriticaletcoutput?二.问题1. 如何查看slave底层收到的主机发送的消息和回复的消息?解决办法:在main.cpp代码中取消注释 注:QLoggingCategory::setFilterRules函数不能重复使用,其只能最后......
  • 智能分析/可视化安防监控系统EasyCVR风光互补远程视频监控方案
    一、背景需求在一些偏远地区,也具有视频监控的需求。但是这类场景中,一般无法就近获取市电,如果要长距离拉取市电,建设的成本非常高且长距离传输有安全隐患,因此风光互补远程视频监控方案的需求也较多。利用风光电转化原理为偏远或无电区域的视频监控设备提供电力供应,从而满足偏远地区......