基于长读段的算法可以通过将长读段比对到由这些长读段自己构建的de Bruijn图上来进行错误纠错。在这种算法中,可以采用以下策略进行错误纠错:
1. 比对路径评判:通过比对长读段到de Bruijn图上的路径,可以得到多条比对路径。为了找到正确的比对路径用于纠错,可以采取两种规则来评判比对路径的可信度[9]。
2. 错误检测与纠正:基于de Bruijn图的长读段纠错算法可以利用比对的高准确度的第二代短读段来进行错误纠正[7]。通过比对长读段与第二代短读段的序列,可以识别出存在的单碱基替换、插入和缺失错误,并进行相应的纠正操作[2]。
3. 遍历图路径:在de Bruijn图中,通过遍历图中的路径,可以为长读段数据中的每个错误区域寻找校正序列[7]。这样可以将长读段与de Bruijn图中的路径进行连接,从而实现错误纠错的目的。
4. 序列比对:在基于de Bruijn图的算法中,可以采用序列比对来纠正长序列与短序列对准的区域[2]。通过比对长读段与短读段的序列,可以识别出存在的插入和删除错误,并进行相应的纠正操作。
综上所述,基于长读段的de Bruijn图算法可以通过比对路径评判、错误检测与纠正、遍历图路径和序列比对等策略来进行错误纠错操作。
标签:路径,长读,错误,de,纠错,Bruijn From: https://www.cnblogs.com/wangprince2017/p/17927465.html