001、
bwa mem -t 4 -k 32 -M -R "@RG\tID:name\tSM:name\tPL:illumina\tLB:name\tPU:name" reference.fna sm.clean.1.fastq.gz sm.clean.2.fastq.gz | samtools view -Sb - > sm.bam
mem:mem比对算法
-t:指定线程数
-k: (这个参数可以不设置)最小的种子长度(minimum seed length),bwa采用seed-and-extend的策略,在seed阶段,bwa取read的碱基片段在reference上进行精确匹配,并选择满足一定长度要求和匹配次数的read片段作为seed,这个阶段算法的核心是基于FM-index的精确匹配; 在extend阶段,bwa利用smith-waterman算法将seed在read和reference上向两边延伸比对(容忍gap),进而找到整个read在reference上符合条件的全局匹配。
-M: bwa mem在比对的时候, 对于一条序列同时比对到基因组不同区域的情况,bwa认为都是最优匹配,但是会和picard不兼容,影响后面gatk的检测,这个时候可以设置-M选项,将较短的比对标记为次优,与picard兼容。
-R:
管道后接samtools:
-S:表示读入文件为sam格式
-b:表示输出文件为bam格式
。
参考:
标签:name,reference,read,bwa,seed,使用,序列,mem From: https://www.cnblogs.com/liujiaxin2018/p/17723226.html