首页 > 编程语言 >GB | 华中农大焦文标团队开发适用于植物基因组的基于图形的集成式分型算法

GB | 华中农大焦文标团队开发适用于植物基因组的基于图形的集成式分型算法

时间:2024-06-16 11:34:51浏览次数:27  
标签:焦文标 变异 图谱 集成式 基因 基因组 EVG GB 分型

今年4月,华中农业大学焦文标团队在Genome Biology上发表论文:A comprehensive benchmark of graph‑based genetic variant genotyping algorithms on plant genomes for creating an accurate ensemble pipeline,主要研究了基于图谱的植物基因组变异基因分型算法,并创建了一个准确的集成流程(Ensemble Variant Genotyper,EVG)。

研究背景

随着高通量测序技术的发展,植物基因组的基因多样性测量得到了极大的推动。然而,如何准确基因分型数百万的遗传变异,尤其是结构变异,仍然是一个挑战。近年来,许多基于图谱的变异基因分型方法被开发出来,并在人类基因组上进行了测试。但是,它们在植物基因组中的性能尚不清楚。此外,考虑到植物基因组的不同复杂性,可能需要集成当前基因分型方法的优势的管道。

研究方法

本研究全面评估了八种基因分型工具在不同情境下的性能,包括变异类型和大小、测序参数、基因组背景和复杂性,以及图谱大小。使用了来自代表性植物基因组的模拟和真实数据集(包括拟南芥1001基因组项目、水稻SNP-Seek数据库、中国国家生物信息数据库等)。这些工具主要分为两类:基于读段比对的(例如vg map、vg giraffe、Paragraph、GraphTyper2和Gramtools)和基于k-mer比对的(例如BayesTyper和PanGenie)。

研究内容

研究内容包括构建全面的仿真面板,评估工具在模拟数据上的性能,以及在不同复杂性的植物基因组上的性能。研究还探讨了测序参数(如读段长度、片段大小和测序深度)对基因分型性能的影响,以及图谱中基因组数量对变异基因分型的影响。

集成变异基因分型方法EVG的工作流程和性能。

研究结果

研究发现,将现有方法应用于植物仍然存在巨大挑战,如重复序列过多、变异或高资源消耗等问题。因此,作者提出了一个名为Ensemble Variant Genotyper (EVG)的流程,它在几乎所有实验情境中都能实现更好的基因分型性能,并且即使使用5倍覆盖率的读段,也能比较地实现更高的基因分型召回率和精确度。此外,研究表明EVG在基因组图谱数量增加时更加稳健,尤其是对于插入和缺失变异。

结论

本研究为基于图谱的基因分型算法的开发和应用提供了新的见解。作者得出结论,EVG为基因分型提供了一种准确、无偏倚且成本效益高的方式,适用于小型和大型变异的基因分型,有潜力用于大型、重复性和异质性植物基因组的大规模基因分型。

EVG的源代码:https://github.com/JiaoLab2021/EVG

标签:焦文标,变异,图谱,集成式,基因,基因组,EVG,GB,分型
From: https://www.cnblogs.com/miyuanbiotech/p/18250354

相关文章

  • 基于SpringBoot+Spark搭建本地计算引擎服务
    1.项目背景 上一篇文章我们讲解了搭建数据挖掘可视化系统(大数据数据挖掘系统可视化设计艺术-CSDN博客)的主要内容,通过构建算子工作流可以完成数据挖掘的工作。这时这里的算子可以提交到本地计算请求,也可以提交大数据集群做计算,本文将详细介绍搭建本地计算请求的过程。2.......
  • Java毕业设计-基于springboot开发的图书个性化推荐系统设计与实现-毕业论文(附毕设源代
    文章目录前言一、毕设成果演示(源代码在文末)二、毕设摘要展示1、开发说明2、需求/流程分析3、系统功能结构三、系统实现展示1、前台首页功能模块2、管理员功能模块3、学生功能模块四、毕设内容和源代码获取总结Java毕业设计-基于springboot开发的图书个性化推荐系统......
  • Java毕业设计-基于springboot开发的图书管理系统-毕业论文(附毕设源代码)
    文章目录前言一、毕设成果演示(源代码在文末)二、毕设摘要展示1、开发说明2、需求/流程分析3、系统功能结构三、系统实现展示1、个人中心2、管理员管理3、用户管理4、图书出版社管理5、公告类型管理6、所在书架管理7、图书类型管理8、论坛管理9、公告信息管理10、图书信息......
  • springboot事务管理的机制是什么
    SpringBoot的事务管理机制实质上是基于Spring框架的事务处理机制。其主要目的是确保一系列数据库操作要么全部成功,要么全部失败(回滚),从而维护数据的完整性和一致性。SpringBoot事务管理遵循ACID四大特性:1、原子性(Atomicity)事务是一个原子操作单元,其对数据的修改要么全都执......
  • gbase8s数据库阻塞检查点和非阻塞检查点的执行机制
    1.检查点的描述为了便于数据库系统的复原和逻辑恢复,数据库服务器生成的一致性标志点,称为检查点,其是建立在数据库系统的已知和一致状态时日志中的某个时间点检查点的目的在于定期将逻辑日志中的重新启动点向前移动如果存在检查点,数据库只需要完成检查点之后的逻辑日志的恢复......
  • gbase8s的select查询数据物理位置寻址分析和学习
    1.执行的sql语句和目的执行的sql语句selectrowid,*fromtest1whereid=1;目的:查找到test1表中id=1这个值在硬盘中的真实位置并取出2.寻址的过程-确定表的数据空间和逻辑页的信息根据表名查看这张表的数据空间位置和逻辑页号[gbasedbt@iZ2ze5s78e4tanwe5q2znxZ~]$......
  • springboot的多线程事务能否保证事务的一致性
    在SpringBoot中,多线程事务的一致性取决于事务管理的配置和实现。SpringFramework本身提供了多种事务管理的方式,如基于注解的声明式事务、编程式事务等。在多线程环境下,要保证事务的一致性需要特别注意以下几点:事务传播属性(TransactionPropagation):在进行多线程事务处理时,需......
  • GB | 华中农大焦文标团队开发适用于植物基因组的基于图形的集成式分型算法
    今年4月,华中农业大学焦文标团队在GenomeBiology上发表论文:Acomprehensivebenchmarkofgraph‑basedgeneticvariantgenotypingalgorithmsonplantgenomesforcreatinganaccurateensemblepipeline,主要研究了基于图谱的植物基因组变异基因分型算法,并创建了一个准确的......
  • 基于spingboot的车辆违章管理系统
    博主介绍:java高级开发,从事互联网行业六年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了多年的设计程序开发,开发过上千套设计程序,没有什么华丽的语言,只有实实在在的写点程序。......
  • C#批量设置海康和大华录像机NVR,GB28181的通道编码.
    我经常要把小区海康或者大华的硬盘录像机推送到自己搭建的gb28181监控平台,每次几百个摄像头编码,有点头大,就用了1个多周写了个批量设置海康和大华硬盘录像机的通道编码的程序,海康和大华的SDK简直不是人看的.太乱了.大华读取通道编码的代码///<summary>......