建库过程PCA扩增过程中引入重复序列,会对变异检测结果产生影响,重复的DNA片段会比对到参考基因组的相同位置,根据这一特点来进行去重复。
001、gatk(picard标记重复)
gatk MarkDuplicates -I sample01.sorted.bam -O sample01.sorted.markdup.bam -M sample01.sorted.markdup_metrics.txt
002、samtools
参考:
01、https://www.jianshu.com/p/8cdbb89530c6?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes
02、
.
标签:文件,utm,重复,sample01,gatk,sorted,bam From: https://www.cnblogs.com/liujiaxin2018/p/17723575.html