首页 > 其他分享 >宏基因组实战之:公开数据下载

宏基因组实战之:公开数据下载

时间:2024-08-09 13:49:29浏览次数:7  
标签:实战 kneaddata -- 基因组 gz srr 数据 质控 下载

1、测序数据

数据来源于密歇根大学的一项研究,数据项目号为PRJNA389927。这个研究项目的包括正常、癌前病变和癌症病人样本共181例。项目对应的github地址:https://github.com/SchlossLab/Hannigan_CRCVirome_mBio_2018 ,也可以直接去ebi网站下载这个项目的原始测序数据,会给出下载用的shell脚本。

2、数据下载及质控

数据下载:
image

数据质控:
直接用fastp过滤
fastp -i $read1 -I $read2 -o ${srr}_1.fq.gz -O ${srr}_2.fq.gz

kneaddata:
集合了软件fastqc,trimmomatic数据过滤,bowtie2比对后去除宿主序列等功能,不指定软件参数安装路径则直接从环境变量中找。还自带数据库,包括人类的基因和转录组,小鼠基因组和silva核糖体数据库,具体信息见github:https://github.com/biobakery/kneaddata

kneaddata -i1 ${srr}_1.fq.gz -i2 ${srr}_2.fq.gz 
	--bypass-trim 
	--reorder 
	--bowtie2-options '--very-sensitive --dovetail' 
	--remove-intermediate-output 
	-v -t 3 
	-db $ref/GRCh38.p14
	--output-prefix pre_$srr 
	-o 2.kneaddata/$srr 

--bypass-trim:输入的是质控后的序列,不需要再次质控,参数指定后不调用trimmomatic数据过滤。
--remove-intermediate-output: 不保留中间文件,不指定默认保留
-db: 宿主基因组信息,这里为人类bowtie2预先构建索引,指定到索引前缀
--reorder:bowtie2的参数,保持输出read id顺序和输入一致
-t: 三个线程
-v: 日志冗余度控制
输出结果:
image
paired_[1/2].fastq就是质控的结果文件,自带模块kneaddata_read_count_table可以完成质控后各项指标汇总(log文件),前提是使用trimmomatic软件做过滤。

标签:实战,kneaddata,--,基因组,gz,srr,数据,质控,下载
From: https://www.cnblogs.com/mmtinfo/p/18350510

相关文章

  • Cisco Firepower 1000 Series FTD Software 7.4.2 & ASA Software 9.20.3 发布下载 -
    CiscoFirepower1000SeriesFTDSoftware7.4.2&ASASoftware9.20.3FirepowerThreatDefense(FTD)Software请访问原文链接:https://sysin.org/blog/cisco-firepower-1000/,查看最新版。原创作品,转载请保留出处。为什么选择CiscoSecure防火墙CiscoSecure防火墙为行......
  • CK-Composable Kernel 下载安装 (AMD-Rocm环境)
    CK-ComposableKernel下载安装AMD可组合内核库:只需几行代码即可为AI应用提供高效的融合内核CK库是为AMD-GPU所开发的,下载和使用都需要在AMD-Rocm环境/平台,如果你的GPU并非AMD的,是无法下载使用CK的。关于CK库下载从GitHub存储库下载CK源代码并开始构建。......
  • KubeSphere 部署 Kafka 集群实战指南
    本文档将详细阐述如何利用Helm这一强大的工具,快速而高效地在K8s集群上安装并配置一个Kafka集群。实战服务器配置(架构1:1复刻小规模生产环境,配置略有不同)主机名IPCPU内存系统盘数据盘用途ksp-registry192.168.9.904840200Harbor镜像仓库ksp-co......
  • Nginx教程(一):Windows环境下载Nginx和安装详细教程
    Nginx下载下载地址:nginx:download解压查看配置文件启动Nginx双击nginx.exe文件或者在CMD窗口输入 nginx.exe访问Nginx浏览器访问http://localhost:80,查看是否启动成功 看到Welcometonginx!说明已经启动......
  • nodejs语言,MySQL数据库;springboot的个性化资讯推荐系统66257(免费领源码)计算机毕业设计
    摘 要随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,个性化资讯推荐系统当然也不能排除在外。个性化资讯推荐系统是以实际运用为开发背景,运用软件工程原理和开发方法,采用springboot技术构建的一个管理系统。整......
  • c#语言,SQL server数据库;基于Web的社区人员管理系统的设计与实现36303(免费领源码)计算机
    目 录摘要1绪论1.1慨述1.2课题意义1.3B/S体系结构介绍1.4ASP.NET框架介绍2 社区人员管理系统分析2.1可行性分析2.2系统流程分析2.2.1数据增加流程2.2.2数据修改流程52.2.3数据删除流程52.3系统功能分析62.3.1功能性分析62.3.2非功能性......
  • OneKeyAdmin 后台任意文件下载
    侵权声明本文章中的所有内容(包括但不限于文字、图像和其他媒体)仅供教育和参考目的。如果在本文章中使用了任何受版权保护的材料,我们满怀敬意地承认该内容的版权归原作者所有。如果您是版权持有人,并且认为您的作品被侵犯,请通过以下方式与我们联系:[[email protected]]。我们将在确......
  • fpga图像处理实战-RGB转YCBCR(YUV)算法
    YCBCR        YCbCr是一种用于数字图像和视频的颜色空间。它将颜色分解为亮度(Y)和两个色度分量(Cb和Cr)。这种分解使得视频压缩和传输更加高效,因为人眼对亮度变化更敏感,而对色度变化较不敏感。        亮度(Y):亮度表示图像的灰度级别或光强度。它是RGB颜色空间中......
  • fpga图像处理实战-RGB与HSV互转
    HSV颜色模型        HSV(Hue,Saturation,Value)颜色模型是一种常用的色彩表示方式,特别适用于图像处理、计算机图形学和色彩选取工具中。它通过将颜色的表示从传统的RGB(红、绿、蓝)模型转换为更符合人类视觉感知的方式来描述颜色。以下是HSV模型的三个主要分   ......
  • fpga图像处理实战-YCBCR转RGB
    计算公式    R=Y+1.402*(V-128)=Y+1.402*CR-1.402*128  G=Y-0.344*(U-128)-0.714*(V-128)=Y-0.344*CB-0.714*CR+1.058*128   B=Y+1.772*(U-128)=Y+1.772*CB-1.772*128FPGA实现`timescale1ns/1ps////Company://......