Hisat2+stringtie+ballgown
#加载module中的hisat2
module load RNAseq_hisat2
在下面操作开始前,需先进性mkdir文件的创建,输入和输出的文件前面都加上了文件的绝对路径,例如:/home/sisc/ref_genome/Bol_kaleZHn/
#建索引:hisat2-build
hisat2-build /home/sisc/ref_genome/Bol_kaleZHn/Bol_kaleZHn.dna.fa /home/sisc/raw_sequences/2_hisat2/1_index/Y_genome
#第一部分为下载的参考基因组fasta文件;第二部分为输出的Y_genome,文件后缀为.ht2
#hisat2软件使用
hisat2 --dta -p 6 -x /home/sisc/raw_sequences/2_hisat2/1_index/Y_genome -1 /CEPH/sequence_raw/Chinese_kale_genome/transcript/kale_heat_stress_2017/Y-T25-T2-1_R1.fq.gz -2 /CEPH/sequence_raw/Chinese_kale_genome/transcript/kale_heat_stress_2017/Y-T25-T2-1_R2.fq.gz -S Y-T25-T2-1_genome.sam
#p为线程数;--dta务必要输入;-x为前面的index索引得到的;
#因为为双端测序,则-1、-2分别为双端测序的2条reads
#-S为输出的sam文件
#samtools将sam转换为bam文件
samtools sort -@ 6 -o /home/sisc/raw_sequences/2_hisat2/3_samtools/Y-T25-T2-1_genome.bam /home/sisc/raw_sequences/2_hisat2/2_hisat2/Y-T25-T2-1_genome.sam
#sort是进行排序;@为线程数;o为输出的bam文件;最后为上述的sam文件
#转录本组装:stringtie
stringtie -p 6 -G /home/sisc/ref_genome/Bol_kaleZHn/Bol_kaleZHn.gff3 -o /home/sisc/raw_sequences/2_hisat2/4_stringtie/Y-T25-T2-1_genome.gtf -l Y-T25-T2-1_genome /home/sisc/raw_sequences/2_hisat2/3_samtools/Y-T25-T2-1_genome.bam
#p为线程数;G为基因组注释文件gff;o为输出的gtf文件;l(字母)为文件前缀名;最后是bam文件