长读段纠错算法综述
长读段纠错算法主要分为三种类型[6]:
- 基于短读段的算法:将同一物种的短读段比对到长读段上,并利用能够比对上且错误率低的短读段进行错误纠正。
- 基于短读段组装的算法:将长读段比对到同一物种的短读段组装后的de Bruijn图上,以此进行错误纠正。
- 只基于长读段的算法:采用不同策略,如将长读段比对到由这些长读段自己构建的de Bruijn图上,通过一些策略纠错,或通过寻找长读段的多个比对结果来纠错。
其中,基于短读段的纠错算法和基于短读段拼接结果的纠错算法是用于短读段和长读段混合测序项目的常见纠错算法[3]。基于短读段的纠错算法包括LSC、PacBioToCA和Proovread;基于短读段拼接结果的纠错算法包括LoRDEC和HALC[3]。
现有的长读段纠错算法中,存在一些问题。一方面,某些算法虽然能够纠错长读段的错误,但通量较低,即纠错后长读段的长度较短,例如HALC算法[1]。另一方面,一些算法虽然通量较高,但纠错时间较长,例如MECAT算法[4]。因此,目前尚未有一种能够同时保持高通量且快速纠错的算法[4]。
综上所述,长读段纠错算法主要分为基于短读段的算法和基于短读段拼接结果的算法,但目前仍然存在一些挑战,如通量较低或纠错时间较长的问题[3][4]。
参考文献:
高通量长read纠错算法的研究与实现
学位
2018
基于MapReduce的基因数据分析算法研究
学位
2014
高通量长read纠错算法的研究与实现
学位
2018
基于长短读长和参考基因组的组装错误检测算法的研究
学位
2019
基于de Bruijn图和k-mers序列比对的长序列混合纠错算法
学位
2021
基于哈希学习的高效RNA-seq数据转录组比对研究
学位
2020
在基于短读段的算法中,如何将短读段比对到长读段上并进行错误纠正? 基于短读段拼接结果的纠错算法是如何将长读段比对到同一物种的短读段组装后的de Bruijn图上的? 在只基于长读段的算法中,通过将长读段比对到由这些长读段自己构建的de Bruijn图上,采用何种策略进行错误纠错? 标签:基于,长读,综述,de,算法,纠错,短读 From: https://www.cnblogs.com/wangprince2017/p/17927436.html