首页 > 其他分享 >Metagenome宏基因组 质控 过滤 比对 去除宿主 2023.01.01-202301.02

Metagenome宏基因组 质控 过滤 比对 去除宿主 2023.01.01-202301.02

时间:2023-01-04 20:31:25浏览次数:51  
标签:fq 01 Metagenome .. gz A1 clean data 质控

质控 过滤 比对 去除宿主

# 云硬盘挂在100G
virtio-disk-bxgzkldx
/dev/disk/by-id/virtio-disk-bxgzkldx /data ext4 defaults 0 0
# uniport数据库下载
wget https://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/idmapping/idmapping_selected.tab.gz
wget https://ftp.uniprot.org/pub/databases/uniprot/uniref/uniref90/uniref90.fasta.gz
# GDTB数据库下载
wget https://data.gtdb.ecogenomic.org/releases/latest/auxillary_files/gtdbtk_data.tar.gz
***fastqc 质控
mkdir ./qc
singularity exec ../../software/MetaGenome.sif fastqc --outdir ./qc --threads 4 ../../dataFQ/A1_1.fq.gz ../../dataFQ/A1_2.fq.gz ../../dataFQ/A2_1.fq.gz ../../dataFQ/A2_2.fq.gz
out .html 质控报告 Per base sequence quality Q30
***fastp 质量过滤
mkdir -p clean_data
singularity exec ../../software/MetaGenome.sif fastp --thread 4 -i ../../dataFQ/A1_1.fq.gz -I ../../dataFQ/A1_2.fq.gz -o clean_data/A1_1.fq.gz -O clean_data/A1_2.fq.gz -j clean_data/A1.fastp.json -h clean_data/A1.fastp.html
singularity exec ../../software/MetaGenome.sif fastp --thread 4 -i ../../dataFQ/A2_1.fq.gz -I ../../dataFQ/A2_2.fq.gz -o clean_data/A2_1.fq.gz -O clean_data/A2_2.fq.gz -j clean_data/A2.fastp.json -h clean_data/A2.fastp.html
*** mutiqc 质控结果汇总
singularity exec MetaGenome.sif multiqc ./clean_data/
---去除宿主序列---
****** bowtie2 -构建index
ln -s ../../data/genome.fa
singularity exec ../../software/MetaGenome.sif bowtie2-build \
genome.fa \ # 基因组序列
genome.db # 输出index前缀
****** 比对
singularity exec ../../software/MetaGenome.sif bowtie2 \
--threads 4 \
-x ./genome.db \
-1 ../01.quality/clean_data/A1_1.fq.gz \
-2 ../01.quality/clean_data/A1_2.fq.gz \
-S A1.sam \
2>A1.map.log
****** 去除宿主数据
singularity exec ../../software/MetaGenome.sif samtools view \
-f 12 \ # 去除比对上的reads
A1.sam \ # 输入,sam文件
>A1.unmap.bam # 输出bam格式文件
****** bam转换回fq格式
singularity exec ../../software/MetaGenome.sif samtools fastq \
-1 A1_1.clean.fq.gz \ # 输出,fq1
-2 A1_2.clean.fq.gz \ # 输出,fq2
-s A1_singleton.clean.fq.gz \ # 输出,单端数据
A1.unmap.bam # 输入,bam文件
------------------
比对&去除宿主数据&bam转换回fq格式
singularity exec ../../software/MetaGenome.sif bowtie2 --threads 4 -x ./genome.db -1 ../01.quality/clean_data/A1_1.fq.gz -2 ../01.quality/clean_data/A1_2.fq.gz 2>A1.map.log | \
singularity exec ../../software/MetaGenome.sif samtools view -f 12 | \
singularity exec ../../software/MetaGenome.sif samtools fastq -1 A1_1.clean.fq.gz -2 A1_2.clean.fq.gz -s A1_singleton.clean.fq.gz


标签:fq,01,Metagenome,..,gz,A1,clean,data,质控
From: https://blog.51cto.com/u_15622529/5989237

相关文章

  • OpenHarmony坐牢开发01 —— 前期准备
    OpenHarmony坐牢开发——01前期准备写在前面老师让我把同学做的单片机换成openharmony操作系统,于是前来开发但我没学过openharmony!!!我也不懂单片机!!!我也不懂硬件!!!但是!答......
  • NC16697 [NOIP2001]Car的旅行路线
    题目链接题目题目描述又到暑假了,住在城市A的Car想和朋友一起去城市B旅游。她知道每个城市都有四个飞机场,分别位于一个矩形的四个顶点上,同一个城市中两个机场之间有一条......
  • S2-016 CVE-2013-2251
    漏洞名称S2-016(CVE-2013-2251)通过操作前缀为“action:”/“redirect:”/“redirectAction:”的参数引入的漏洞允许远程命令执行利用条件Struts2.0.0–Struts2.3.15......
  • L2-016 愿天下有情人都是失散多年的兄妹 (25 分)
    呵呵。大家都知道五服以内不得通婚,即两个人最近的共同祖先如果在五代以内(即本人、父母、祖父母、曾祖父母、高祖父母)则不可通婚。本题就请你帮助一对有情人判断一下,他们究竟......
  • 2023-01-04 云开发跳转小程序报错Permission denied
    问题描述:静态网页跳转小程序,报错Permissiondenied,还显示systemerror。原因:权限不足。解决方案:第一步,打开云开发控制台,找到设置==》权限设置,在【未登录用户访问云资源......
  • npm run serve 报错Error: error:0308010C:digital envelope routines::unsupported
    具体错误提示:Browserslist:caniuse-liteisoutdated.Pleaserun:npxbrowserslist@latest--update-dbWhyyoushoulddoitregularly:https://github.com/br......
  • 【230104-5】抛物线y=ax平方+bx+1经过点(2,6),且与直线y=x/2+1相交于A、B两点,点A在y轴上,过
    ......
  • POI2014
    Tourism容易想到跑出dfs树,这样只有返祖边,且每个点的深度不超过\(10\)。考虑状压祖先的状态,设\(f_{i,S}\)表示dfs到了\(i\)点,祖先的状态为\(S\)的最小值。\(S\)的每一位......
  • LOJ #2842. 「JOISC 2018 Day 4」野猪
    题面传送门考试的时候只想到处理\(O(1)\)的边没想到维护\(O(1)\)的路径。首先如果没有可以退一步的限制显然就是相邻两点的最短路之和。退一步的限制想到点边互换。与处......
  • 01- 下载和搭建环境
    Django的虚拟环境和简单搭建1.创建虚拟环境1.首先新建一个文件夹2.在PyCharm终端中切换到这个文件夹,输入python-mvenv环境名创建虚拟环境3.此时文件夹下出现......