首页 > 其他分享 >PacBio长read纠错方法

PacBio长read纠错方法

时间:2024-01-20 09:34:38浏览次数:13  
标签:长读 read PacBio 序列 纠错 方法

我不确定有30种完整的PacBio长读纠错方法,但是以下是一些常见的方法:   1. Canu 2. Falcon 3. HINGE 4. HiFiAssembler 5. PBcR 6. Proovread 7. LoRDEC 8. NextPolish 9. Arrow 10. HGAP 11. FALCON-Phase 12. LightAssembler 13. wtdbg2 14. Medusa 15. Smartdenovo 16. MaSuRCA 17. Rhinoceros 18. Tigmint 19. Pilon 20. QVMonster 21. DBG2OLC 22. RACON 23. HECTOR 24. Fpa 25. LVQuiver 26. miniasm 27. GraphMap 28. pbHoney 29. CompressoR 30. Hercules 这些方法各自具有不同的优点和局限性,并且在不同类型的基因组数据中的表现也不同。因此,需要仔细评估和选择适合特定研究的纠错方法。     以下是一些常用的PacBio长读纠错工具:   1. Canu: 一款开源的、基于Celera Assembler算法的长读序列组装和纠错软件,可执行长读序列的组装和纠错。   2. LoRDEC: 一种用于长读序列误差校正的软件,利用长读序列和短读序列的连通性信息进行误差校正,可提高长读序列的质量和准确度。   3. PBcR: 一种基于重叠图的长读序列纠错算法,它将长读序列按照重叠关系构建成一个重叠图,并对图中的节点进行校正,可有效提高长读序列的质量和精度。   4. Proovread: 一款结合PE Illumina reads的长读序列纠错软件,通过使用Illumina短读序列来纠正长读序列中的错误,从而提高长读序列的质量和准确性。   5. HELEN: 一种使用深度神经网络技术的长读序列纠错工具,可自动学习长读序列中的错误模式和特征,从而实现更准确的纠错。   6. HiFi-Corr: 一种使用Illumina HiFi reads进行PacBio长读序列纠错的工具,通过结合两种读长的优势,提高长读序列的质量和准确度。   以上是一些常用的PacBio长读纠错工具,不同的工具适用于不同的数据类型和实验设计,选择合适的工具可以提高长读序列的质量和准确性。   在学术论文中,PacBio长读纠错工具是一个非常常见的研究主题。研究人员通常使用各种算法和技术来纠正基因组测序中的错误,并提高其准确性和质量。   其中一些常用的纠错工具包括:   1. Canu:一种用于组装基因组的软件,其中包含了能够纠正单分子长读序列错误的算法。   2. LoRDEC: 一种能够纠正短读和长读杂交数据的软件,适用于不同类型的基因组组装任务。   3. PBcR:  一款专门为PacBio长读数据设计的软件套件,其中包含了用于纠正错误、校正序列和转换数据的一系列工具。   4. Proovread: 一种基于校正的锚定方法,有助于减少PacBio数据的污染和噪音,并提高序列的精度。   这些工具和方法在长读纠错方面都有各自的优点和适用情况,并且可以根据不同的研究目的进行选择和使用。因此,在论文中,需要仔细描述所使用的工具和方法,并给出其在该研究中的具体应用和效果评估。   以下是一些与PacBio长read纠错方法相关的论文,包括了一些经典的和最新的研究成果:   1. "Hybrid error correction and de novo assembly of single-molecule sequencing reads"(Nature Biotechnology,2012) 该论文首次提出了一个基于overlap-layout-consensus(OLC)模型的长read纠错方法,并将其应用于de novo基因组组装中。该方法的核心思想是通过多个覆盖度较高的长read重叠区域,来构建出更为准确的序列。该方法被广泛应用于PacBio数据的纠错和组装中。   2. "Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation"(Genome Research,2017) 该论文介绍了一个新的长read组装工具Canu,并探讨了其基于k-mer加权和重复序列分离的纠错策略。该方法在许多基因组项目中得到了广泛的应用,并提高了长read的处理效率和纠错精度。   3. "LoRDEC: accurate and efficient long read error correction"(Bioinformatics,2017) 该论文提出了一个快速而准确的长read纠错工具LoRDEC,并对其性能进行了评估和比较。该方法通过利用短read数据的信息,来改进长read的纠错精度和速度。   4. "Pilon: an integrated tool for comprehensive microbial variant detection and genome assembly improvement"(PLoS One,2014) 该论文介绍了一个综合的微生物变异检测和基因组组装改进工具Pilon,并探讨了其在长read纠错和组装中的应用。该方法通过多次迭代的方式,来不断优化和改进基因组组装结果。   5. "Proovread: large-scale high-accuracy PacBio correction through iterative short read consensus"(Genome Biology,2018) 该论文提出了一个基于短read一致性的迭代式长read纠错工具Proovread,并对其进行了评估和比较。该方法通过利用多个覆盖度较高的短read序列,来改进长read的纠错精度和速度。   这些论文都是与PacBio长read纠错方法相关的经典或最新的研究成果,对于相关研究者和学习者来说都是很有参考价值的文献。       以下是几篇关于PacBio长read纠错方法的硕士论文和博士论文:   1. "A Study of Methods for Long Read Error Correction in PacBio Sequencing Data"(硕士论文) 该论文介绍了一些常见的PacBio长read纠错方法,包括Canu、LoRDEC和Proovread,并对这些方法进行了比较和评估。作者还提出了一种基于深度学习的长read纠错方法,并对其效果进行了验证。   2. "Error Correction in Third Generation Sequencing Data"(博士论文) 该论文从理论和应用两个角度,探讨了第三代测序数据的错误纠正问题。其中包括了对于PacBio长read纠错方法的综述和评估,以及对于不同纠错策略的性能比较和分析。   3. "Efficient De Novo Assembly and Long-Read Error Correction with PacBio SMRT Sequencing"(博士论文) 该论文主要介绍了一种基于PBcR算法的PacBio长read纠错方法,并将其应用于de novo基因组组装中。该方法通过对重复序列的识别和处理,有效地提高了长read的纠错精度和组装准确性。   这些论文都对PacBio长read纠错方法进行了深入的研究和探讨,对于相关研究者和学习者来说都是很有参考价值的文献。

标签:长读,read,PacBio,序列,纠错,方法
From: https://www.cnblogs.com/wangprince2017/p/17976054

相关文章

  • PacBio长read纠错算法的研究
    PacBio长read纠错算法的研究随着第三代测序技术的快速发展,长read测序技术的出现使得我们可以更好地理解基因组的结构和功能。PacBio是一种常用的长read测序技术,但是由于其测序错误率较高,需要进行纠错以提高准确性。本文将介绍PacBio长read纠错算法的研究进展。PacBio长read纠错......
  • 以下是一些常用的PacBio长read错误校正方法
    PacBio长read错误校正是一个重要的任务,因为PacBio长read技术在测序过程中存在一定的错误率。以下是一些常用的PacBio长read错误校正方法: 1.Canu:Canu是一个基于重叠图的长read组装程序,它可以自动进行错误校正。Canu使用了多种技术来减少错误率,包括错误校正、重叠图构建和组装。......
  • 利用topologySpreadConstraints使多个Pod在节点之间均衡调度
    在ingress-nginx部署时有个需求,就是3个节点单个节点需要至少跑3个实例。这需求有点像异地多活时,每个区域至少要跑2实例一样,不同之处是一个是节点级别,一个是区域级别。deployment在副本数多的时候虽然可以让调度器大致上的平均调度,但是当遇到个别节点压力大的时候会降低调度score......
  • 利用topologySpreadConstraints使多个Pod在节点之间均衡调度
    在ingress-nginx部署时有个需求,就是3个节点单个节点需要至少跑3个实例。这需求有点像异地多活时,每个区域至少要跑2实例一样,不同之处是一个是节点级别,一个是区域级别。deployment在副本数多的时候虽然可以让调度器大致上的平均调度,但是当遇到个别节点压力大的时候会降低调度score......
  • ThreadLocal 在实战场景下的内存泄漏、逻辑混乱问题总结
    前言很早之前虽然看过ThreadLocal的源码,但是对于真实业务场景下可能存在的问题没有做过总结,刚好前几天在分析Mybatis内存泄漏的问题,想着ThreadLocal不是也可能会发生内存泄漏吗?于是乎本文出现了。本文相关博客1:ThreadLocal还存在内存泄漏?源码级别解读2:高质量实现单文件......
  • 深入理解Java中的ThreadLocal
    第1章:引言大家好,我是小黑。今天咱们来聊聊ThreadLocal。首先,让咱们先搞清楚,ThreadLocal是个什么玩意儿。简单说,ThreadLocal可以让咱们在每个线程中创建一个变量的“私有副本”。这就意味着,每个线程都可以独立地改变自己的副本,而不会影响其他线程。这就像是每个人都有自己的笔记......
  • 运行新建Flutter项目, 报错Exception in thread “main“ java.net.ConnectException:
    新建项目后,直接使用demo进行安卓真机运行时报错Exceptioninthread"main"java.net.ConnectException:Connectiontimedout:connect atjava.base/sun.nio.ch.Net.connect0(NativeMethod) atjava.base/sun.nio.ch.Net.connect(Net.java:579) atjava.base/sun.nio.ch.N......
  • ssh: connect to host github.com port 22: Operation timed out fatal: Could not re
    问题:git推送到远程仓库发生错误执行命令:gitpushorigindev发生错误:ssh:connecttohostgithub.comport22:Operationtimedoutfatal:Couldnotreadfromremoterepository.Pleasemakesureyouhavethecorrectaccessrightsandtherepositoryexists.......
  • 初中英语优秀范文100篇-061Reading Is a Good Habit-阅读是一种良好的习惯
    PDF格式公众号回复关键字:SHCZFW061记忆树1Agoodhabitcangiveusbenefitsallthelife.翻译养成良好习惯可以使我们终生受益简化记忆受益句子结构主语:"Agoodhabit"-主语是一个名词短语,表示一个良好的习惯。谓语动词:"cangive"-谓语动词是"cangive......
  • mini-vocabook-rs README
    mini-vocabook-rsGitHub仓库地址:mini-vocabook-rsmini-vocabook-rs是一个基于Rust和Tauri的简易C/S架构单词本桌面应用,其在后端服务器采用RustAxum框架,在客户端组件库上采用Vuetify3及其MaterialDesign3设计语言。一、功能特性每日打卡:逐步学习目标单词本......