首页 > 其他分享 >NC | 三代测序鉴定SV的方法权衡

NC | 三代测序鉴定SV的方法权衡

时间:2024-06-16 10:56:48浏览次数:28  
标签:基于 组装 检测 NC 测序 SV 工具 方法

SV鉴定方法概述

近日,范德堡大学发表一篇关于长读长鉴定SV比较的文章。

Tradeoffs in alignment and assembly-based methods for structural variant detection with long-read sequencing data

这类文章近几年来比较多,去年就有一篇类似的发表在NM上。


A survey of algorithms for the detection of genomic structural variants from long-read sequencing data

不过今天这篇文章不同的地方是重点比较了两类不同鉴定SV的方法,即基于比对对齐的检测和基于组装的检测。

我们知道,基于比对的方法因其计算效率高、覆盖率要求低而备受青睐。而基于基因组从头组装,并通过与参考基因组比较的SV检测方法,需要的计算资源要多很多,但可能更加准确。具体情况如何?该文进行了详细的比较。

基于比对和基于组装的长读长SV检测的基准测试工作流

文章主要结论

本文的主要结论如下:

  1. 长读测序技术提供了连续的DNA片段,有助于二倍体基因组组装和SV检测。随着数据可用性的增加,开发高效且健壮的SV识别算法变得至关重要。

  2. 文章系统比较了14种基于读取比对的SV检测方法(包括4种基于深度学习的方法和1种混合方法)以及4种基于组装的SV检测方法,同时还评估了4种上游比对工具和7种组装工具。

  3. 基于组装的工具在检测大型SV(特别是插入)方面表现出色,并且在评估参数变化和覆盖度波动方面显示出鲁棒性。相反,基于比对的工具在低测序覆盖度(5-10×)下表现出更高的基因型准确性,并且在检测复杂SV(如易位、倒位和重复)方面表现出色。

  4. 评估提供了性能洞察,强调了没有一种工具在所有条件下都表现出优越性。研究提供了31种标准组合的指导方针,帮助用户为不同情况选择最合适的工具,并为进一步的方法开发提供方向。

  5. 讨论了基于深度学习的最新SV调用方法SVision和INSnet的性能,这些方法在删除和插入SV调用方面取得了相当合理和稳健的性能,但在大多数情况下并没有表现出比传统基于对齐的方法更优越的性能。

  6. 尽管基于比对的方法目前几乎普遍使用,因为它们计算要求较低,但这些方法在准确表示完整基因组、SV的起始和结束位置(即“断点”)以及识别SV完整序列方面存在局限性。

  7. 基于组装的工具在检测精确SV方面比基于比对的方法更有效和稳健,但在低测序覆盖度(5-10×)下,由于组装断裂,它们更可能具有较低的基因型准确性,并且大多数基于组装的工具并未设计用于检测复杂SV。

  8. 文章建议未来的研究应考虑二倍体基因组组装和基于组装的工具的重要性,尽管对个体的整个基因组进行组装在计算资源方面要求更高。更大规模和高效的基因组组装算法和基于组装的工具可能会进一步提高精确SV检测的性能。

有关问答

基于深度学习的最新SV检测方法SVision和INSnet在实际应用中的表现如何?

文章中提到的基于深度学习的最新SV调用方法SVision和INSnet在实际应用中的表现是合理和稳健的,但它们并没有在大多数情况下或条件下实现比传统基于比对的方法更优越的性能。尽管这些工具使用了先进的深度学习方法,有望提供比传统方法更优秀的SV检测,但在实际的基准测试中,它们并没有展现出一致的超越性能。

具体来说,SVision和INSnet在检测删除和插入SV方面取得了相当合理的性能,但在评估的多种场景中,并没有一种工具能够在所有条件下都实现一致的高性能。这表明在选择最佳的SV检测工具时,用户需要根据具体的应用场景和需求来决定,并且需要意识到SV评估阈值的问题。未来算法的发展需要解决这一问题,一个有前景的方法可能是通过混合方法整合局部组装策略,如文章中提到的DeBreak工具就是一个例子,在大多数条件下都表现出良好的性能。

在实际应用中,如何评估和选择最适合特定项目的SV检测方法?

项目需求分析

  • 确定项目的目标,例如是否关注特定类型的SV(如插入、删除、倒位等)。
  • 评估可用的计算资源和时间限制。
  • 确定数据类型和质量,例如长读测序数据的来源(PacBio、Oxford Nanopore等)和测序覆盖度。

性能基准测试

  • 使用标准化的基准测试集,如GIAB(Genome in a Bottle)提供的SV标准集,来评估不同工具的性能。
  • 考虑使用模拟数据集来测试工具对复杂SV的检测能力。

工具特性对比

  • 对比不同工具的特性,包括它们在检测大型SV、复杂SV、以及低覆盖度下的性能。
  • 考虑工具的易用性、输出格式的兼容性以及是否支持自动化流程。

参数调整和优化

  • 根据项目需求调整SV调用工具的参数,如对齐工具的最小对齐长度、最小覆盖度要求等。
  • 进行网格搜索或使用其他参数优化策略来找到最佳的参数组合。

基因型准确性和鲁棒性

  • 评估工具在不同测序覆盖度下的基因型准确性。
  • 考虑工具对评估参数变化的鲁棒性。

社区和文献支持

  • 查阅相关的科学文献和社区讨论,了解不同工具的最新进展和已知问题。
  • 考虑选择那些有活跃社区支持和定期更新的工具。

实际数据测试

  • 在实际项目数据上测试选定的工具,以评估其在真实情况下的表现。
  • 比较不同工具的输出,以确定哪个工具最符合项目需求。

综合决策

  • 基于上述所有因素,综合考虑后选择最适合特定项目的SV调用方法。
  • 如果可能,结合多个工具的优势来提高SV检测的准确性和完整性。

标签:基于,组装,检测,NC,测序,SV,工具,方法
From: https://www.cnblogs.com/miyuanbiotech/p/18250271

相关文章

  • 攻防世界web新手题fileinclude&fileclude
    题目1:fileinclude工具:BurpsuiteHackbarV2火狐浏览器的扩展应用解题关键:学会文件包含的命令以及学会读懂php脚本解题过程:首先对该网站进行抓包,发现潜藏的php脚本这段代码的作用是:检查是否display_errors配置项被设置为打开,如果没有则将其打开,这样可以在页面上......
  • clion+msvc+qml demo
    CMake设置-DCMAKE_PREFIX_PATH=C:\Qt\6.6.2\msvc2019_64demo工程结构:├───CMakeLists.txt└───main.cpp└───Main.qml└───MyObject.cpp└───MyObject.h└───MyRectangle.qmlCMakeLists.txtcmake_minimum_required(VERSION3.16)project(qmltest02......
  • 比较第三代测序技术在不同基因组中的组装策略
    目录论文概述论文速读论文方法论文实验论文总结论文概述本文主要探讨了第三代测序技术在不同基因组中的组装策略比较。随着长读序列技术的发展,如PacificBiosciences和OxfordNanopore技术,组装精度和计算成本得到了显著提高。然而,从头组装仍然存在计算成本高、结果质量差等挑战......
  • Trends in Plant Science | 中国农科院基因组所武志强团队综述植物细胞器基因组
    2024年1月13日,中国农科院深圳基因组研究所武志强教授团队综述了植物细胞器基因组研究进展,文章发表在《TrendsinPlantScience》,题为:Plantorganellargenomes:muchdone,muchmoretodo。质体和线粒体是唯一具有内共生起源基因组的细胞器。近几十年来,测序技术的进步导致已发......
  • vue 使用vite-plugin-svg-icons
    安装npminstallvite-plugin-svg-icons--savenpminstallfast-glob--save在vite.config.js配置 import{defineConfig}from'vite'importvuefrom'@vitejs/plugin-vue'import{createSvgIconsPlugin}from'vite-plugin-svg-icons......
  • 首途第三十三套清新简约卡片风格蓝紫渐变色短视频模板 | 苹果CMSV10主题
    下载地址:首途第三十三套清新简约卡片风格蓝紫渐变色短视频模板|苹果CMSV10主题首途第三十三套清新简约卡片风格蓝紫渐变色短视频模板|苹果CMSV10主题我们的简约风格,以纯洁的白色和深邃的紫色为主色调,为您提供了一种清新、时尚的浏览体验。在这个简洁而美丽的界面中,您可以......
  • OpenCV 形态学操作
    canny边缘检测        canny边缘检测算法是JohnF.Canny于1986年开发出来的一个多边缘检测算法,也被很多人认为是边缘检测的最优算法,最优边缘检测的三个主要标准是:        低错误率:标识出尽可能多的实际边缘,同时尽可能的减少噪声产生的误报。       ......
  • openEuler22.03(LTS-SP3)安装kubernetesV1.29
    一、环境配置主机配置角色系统版本IPmaster012核4GmasteropenEuler22.03(LTS-SP3)192.168.0.111master022核4GmasteropenEuler22.03(LTS-SP3)192.168.0.112master032核4GmasteropenEuler22.03(LTS-SP3)192.168.0.113worker012核4GworkeropenEu......
  • 汽车电子-如何用Test Sequence做自动化测试
    汽车电子-如何用Test Sequence做自动化测试附赠自动驾驶最全的学习资料和量产经验:链接如何用来做自动化测试呢?创建一个测试序列点击模型右键Test Harness/Creat for左边选择Sequence通过Harness进行调试修改后可以保存到原来模型中双击点开表格,在里面填入输入......
  • SoftReference 到底在什么时候被回收 ? 如何量化内存不足 ?
    本文基于OpenJDK17进行讨论,垃圾回收器为ZGC。提示:为了方便大家索引,特将在上篇文章《以ZGC为例,谈一谈JVM是如何实现Reference语义的》中讨论的众多主题独立出来。大家在网上或者在其他讲解JVM的书籍中多多少少会看到这样一段关于SoftReference的描述——“......