首页 > 其他分享 >比较第三代测序技术在不同基因组中的组装策略

比较第三代测序技术在不同基因组中的组装策略

时间:2024-06-15 22:56:58浏览次数:25  
标签:Hifiasm 复杂度 组装 测序 基因组 评估

目录

论文概述

本文主要探讨了第三代测序技术在不同基因组中的组装策略比较。随着长读序列技术的发展,如Pacific Biosciences和Oxford Nanopore技术,组装精度和计算成本得到了显著提高。然而,从头组装仍然存在计算成本高、结果质量差等挑战。因此,选择正确的测序平台、适当的测序深度以及合适的组装工具对于进行高质量组装至关重要。本文评估了最近的混合和非混合流程在不同基因组上的主要组装重建,并发现使用PacBio高保真度长读(HiFi)对构建单倍型具有重要作用,而高保真度ONT数据集的正确性也有了显著改善。此外,将它与HiFi或短读组合起来可以进一步提高组装的准确性。

论文速读

论文方法

方法描述

该研究使用了多种组装算法,包括非混合组装和混合组装,并在大规模计算集群上进行了评估。具体来说,他们使用了HiCanu、Hifiasm、Miniasm和Shasta等四个最新的非混合组装器,以及Wengan和Verkko两个混合组装器来处理长和短读序列数据。对于非混合组装,研究人员采用了标准配置,并使用purge_dups和marginPolish等工具进行额外预处理。而对于混合组装,则使用了推荐的标准模式。

方法改进

本研究的主要贡献在于将多个组装算法组合在一起,以提高组装质量和性能。此外,他们还使用了多种指标来评估组装质量,如基因组连续性、正确性和完整性等。

解决的问题

本研究主要解决了组装过程中的一些问题,例如如何准确地反映染色体的数量和大小,如何识别重复区域并避免错误的连接等。通过使用多种组装算法和评估指标,研究人员能够更全面地评估组装的质量和性能,并为后续的研究提供参考。

论文实验

本文主要介绍了作者对不同基因组装算法的性能评估和比较实验。实验包括了对不同算法在不同复杂度的基因组上的组装效果、正确率、完整性等方面的评估,并通过CPU工作量、内存使用等指标进行了系统分析。

具体来说,作者首先对两个最近发布的非混合策略的基因组装工具HiCanu和Hifiasm进行了评估,比较了它们在不同基因组大小和复杂度下的组装效果。结果表明,在高复杂度的基因组上,Hifiasm具有更高的组装质量和更高的平行处理能力。然而,在低复杂度的基因组上,HiCanu表现更好。

接着,作者还对两种非混合策略的组装工具Shasta和Miniasm在Nanopore(ONT-bases)数据集上的组装效果进行了评估。结果表明,Shasta和Miniasm在不同的基因组上都有很好的组装效果,但Shasta在组装D. melanogaster和H. sapiens时表现更优。

此外,作者还对一个混合策略的组装工具Wengan和Verkko进行了评估,比较了它们在不同基因组大小和复杂度下的组装效果。结果表明,Wengan和Verkko的组装质量都比非混合策略的组装工具要好,但在某些情况下,它们的组装速度较慢。

最后,作者还评估了两个混合策略的组装工具HiCanu和Hifiasm在不同基因组大小和复杂度下的组装效果。结果表明,HiCanu和Hifiasm在组装D. melanogaster和H. sapiens时表现出色,但Hifiasm在组装H. sapiens时需要更多的CPU时间和内存空间。

总的来说,本文通过对不同基因组装算法的性能评估和比较实验,为研究人员提供了选择合适组装工具的重要参考。

用于对混合和非混合策略进行基准测试的管道设计。

基因组的质量评估。

基于人类二倍体细胞系(HG002)组装的杂交和非杂交策略评估的连续性分析。(A)重叠群的长度分布。(B)-(C) Nx(左)和 NGx(右)值为 x,从 0 到 100% 不等。

对 Hifiasm、HiCanu 和 Miniasm 消耗的资源进行计算分析。

论文总结

文章优点

  • 该研究对不同组装工具进行了全面的评估,并比较了它们在不同基因组大小和复杂度下的性能。
  • 研究人员使用了多种指标来评估组装的质量,包括连续性和完整性等。
  • 通过对比不同的组装工具,研究人员得出了Hifiasm和HiCanu具有较高的组装质量和较低的计算成本的优点。
  • 研究人员还探讨了高保真长读序列技术对组装的影响,并提出了改进组装效率的方法。

方法创新点

  • 研究人员采用了多种组装工具进行评估,并使用了多种指标来衡量组装质量。
  • 研究人员还使用了Amdahl's law和Moore's law等理论来解释组装过程中的计算成本问题。
  • 研究人员提出了一些新的组装策略和技术,如数据为中心的计算、近数据处理和内存处理等,以提高组装效率。

未来展望

  • 随着测序技术的发展,组装工具需要不断地更新和改进,以适应更大更复杂的基因组。
  • 数据为中心的计算、近数据处理和内存处理等新技术可以为组装提供更好的解决方案。
  • 未来的组装工具需要更加高效、准确地组装大规模、多样的基因组数据。

标签:Hifiasm,复杂度,组装,测序,基因组,评估
From: https://www.cnblogs.com/miyuanbiotech/p/18249916

相关文章

  • Tropical Plants | 改进的日本晴单倍型基因组UQ_NIP
    昆士兰大学RobertJ.Henry教授团队利用改进的单倍型水平基因组组装揭示更多的水稻基因。本研究利用更准确的测序技术,分析组装了一个改进的单倍型水平水稻基因组。该改进的基因组组装包含了早期基因组序列中缺失的区域,并且基于更高的序列准确性注释了3000多个新的基因。这个单倍......
  • GB | 华中农大焦文标团队开发适用于植物基因组的基于图形的集成式分型算法
    今年4月,华中农业大学焦文标团队在GenomeBiology上发表论文:Acomprehensivebenchmarkofgraph‑basedgeneticvariantgenotypingalgorithmsonplantgenomesforcreatinganaccurateensemblepipeline,主要研究了基于图谱的植物基因组变异基因分型算法,并创建了一个准确的......
  • Trends in Plant Science | 中国农科院基因组所武志强团队综述植物细胞器基因组
    2024年1月13日,中国农科院深圳基因组研究所武志强教授团队综述了植物细胞器基因组研究进展,文章发表在《TrendsinPlantScience》,题为:Plantorganellargenomes:muchdone,muchmoretodo。质体和线粒体是唯一具有内共生起源基因组的细胞器。近几十年来,测序技术的进步导致已发......
  • 从零组装一个便携式台式机
    这篇文章主要用于记录我是如何从零开始组装一个便携式台式机的,还附带一点我的碎碎念。便携式台式机是我一直以来的梦想。很早之前我就看到过类似的文章,展示了自己如何从头组装一个便携式台式机,就那种可以用手提着到处走的,让幼小的我对此充满了无限遐想。现在我也高考完了,马上也......
  • 115. 组装手机(卡码网周赛第十七期(23年oppo提前批B组笔试真题))
    115.组装手机(卡码网周赛第十七期(23年oppo提前批B组笔试真题))题目描述小欧是手机外壳供应商,小蕊是手机零件供应商。小欧已经生产了n个手机外壳,第i个手机外壳售价ai元,小蕊生产了n个手机零件,第i个手机零件售价bi元。在组装手机中,一个手机外壳与一个手机零件可......
  • 单细胞RNA测序(scRNA-seq) 理解Seurat对象存储信息含义和基本操作
    单细胞测序技术是在单个细胞水平上,对基因组、转录组和表观基因组水平进行分析测序技术。bulkRNA-seq获得的是组织或器官等大量细胞中表达信号的均值,无法获取细胞之间的差异信息(即丢失了细胞的异质性),而单细胞测序技术可以很好的弥补bulkRNA-seq这一不足,即获取混合样本中......
  • 易基因:表观基因组分析揭示转录因子结合区DNA甲基化表征其功能和进化背景 | 研究速递
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。DNA甲基化是一种重要的表观遗传修饰,对调控基因组功能有多种作用。其水平在整个基因组中具有空间相关性,通常在被抑制区域较高,在转录因子(TF)结合位点(TFBS)和活性调控区域较低。然而建立全基因组和TF结合位点甲基化模......
  • 一种基于E3处理器平台的NAS完整方案(从电脑组装到网站部署)
    一种基于E3处理器平台的NAS完整方案(从电脑组装到网站部署)本文将简要简要介绍本人自建NAS的完整配置,截至发文此NAS已经连续良好运行一年,应当说具有良好的稳定性。本文所述配置包含洋垃圾成分,在仿照本文搭建系统前,请确保自己已掌握相关知识和具备足够的问题解决能力0.概论本文......
  • 易基因:RNA免疫共沉淀测序 (RIP-seq) 技术介绍
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。RIP-seq是将RNA免疫共沉淀(RNAImmunoprecipitation,RIP)与二代测序技术(NGS)相结合以研究细胞内RNA与蛋白互作的技术,RIP利用目标蛋白抗体把相应的RNA-蛋白复合物(RNABindingProtein,RBP)沉淀下来,然后经过富集和纯化就可以......
  • 一种基于E3处理器平台的NAS完整方案(从电脑组装到网站部署)
    一种基于E3处理器平台的NAS完整方案(从电脑组装到网站部署)本文将简要简要介绍本人自建NAS的完整配置,截至发文此NAS已经连续良好运行一年,应当说具有良好的稳定性。本文所述配置包含洋垃圾成分,在仿照本文搭建系统前,请确保自己已掌握相关知识和具备足够的问题解决能力0.概论本文......