首页 > 其他分享 >全基因组测序流程 | WGS pipeline

全基因组测序流程 | WGS pipeline

时间:2024-02-10 16:00:13浏览次数:23  
标签:pipeline bioconda install broad 测序 bwa conda WGS

 

创建conda环境,安装必要软件

conda create -n wgs

conda activate wgs

conda install bioconda::bwa

 

下载最佳ref fasta

gcloud storage cp gs://BUCKET_NAME/OBJECT_NAME SAVE_TO_LOCATION

gs://gcp-public-data--broad-references/hg38/v0/Homo_sapiens_assembly38.fasta

Resource bundle

https://console.cloud.google.com/storage/browser/genomics-public-data/resources/broad/hg38/v0/

 

构建索引【可以直接下载,broad有标准流程】

../refdata-gex-GRCh38-2020-A/fasta/genome.fa

bwa index -p GRCh38 hg38.fasta

/home/zz950/reference/bwa_wgs/resources_broad_hg38_v0_Homo_sapiens_assembly38.fasta.64

 

bwa标准比对

然后合并两个lane 

 

部分下载的数据以CRAM格式保存

How to convert CRAM back to BAM using samtools

It's the same command, just use the -b option instead of -C.

需要最新版samtools读取cram文件

conda install bioconda::samtools

  

 

下载GATk: https://github.com/broadinstitute/gatk/releases

下载Jar:https://gatk.broadinstitute.org/hc/en-us/community/posts/360073027611-Where-and-how-I-can-get-GenomeAnalysisTK-jar-script

 

 

 


 

 

还有配对的RNA-seq

但是使用的是hg19的参考基因组,用的STAR比对。

https://data.broadinstitute.org/snowman/hg19/annotation/ 

这个bam可以用htseq-count来计数

 

conda install -c bioconda htseq

conda install bioconda::htseq

 

参考流程:

 

标签:pipeline,bioconda,install,broad,测序,bwa,conda,WGS
From: https://www.cnblogs.com/leezx/p/18002449

相关文章

  • 如何给极狐GitLab 配置 webhook,自动触发 Pipeline?
    本文根据工作中的痛点来举例介绍如何使用极狐GitLab,让你的日常工作更高效。还在只使用极狐GitLab存放代码?那你就OUT啦。赶紧看看这篇文章,让你的日常工作更高效。使用GitlabWebhook触发Pipeline,打通工作消息通知关于A/B同学的问题,我想可以使用Webhook触发Pipe......
  • Run a tfx pipeline using kubeflow pipeline
    1.whatiskubeflowpipelinefortfxpipeline?kubeflowpipelineisanochetratoroftfxpipeline,whichrunsonakubernetescluster.LocalDagRunerisanorchetratoroftfxpipeline,whichrunslocal.#runatfxpipelineusgingLocalGagRunnertfx.orc......
  • ml-pipeline-ui of kubeflow pipeline
    1.Creatingapipelineonml-pipeline-uiwebpageissavingthepipelinetodatabasemlpipeline,deleteapipelineonml-ppeline-uiwebpageisdeletingtherecordofthepipelinefromdatabasemlpipeline.2.Createapipeline-runonml-pipeline-uiwebpage......
  • Pass Artifact between tfx compoents when running with kubeflow pipeline
    WhatisArtifact?AnArtifactisafileordirectoryproducedbyatfxcomponent,whichcanbepassedtoadownstreamcomponent,andthenthedownstreamcomponentcanuseit.HowdoestfxpassanArtifactbetweencomponents?tfxpipelinehasanargument......
  • 基因测序中碱基质量值的计算
    当使用k-means将碱基聚类后,可使用下面的方法计算碱基质量#include<stdio.h>#include<math.h>intmain(){doubleproba=0.0;//某点的概率值初始化为0.0doublesum_distances=0.0;//某点到所属质心的距离除以到每个质心距离的四次方总和初始化为0.0......
  • Unity:Couldn't open include file 'Packages/com.unity.render-pipelines.universal/S
    初学Shader,Unity报错↑,总之是找不到ulsl的Core文件,网上找的其他解决方案例如删除文件夹再生成或者改变shader的某些属性,但是根本找不到。最终找到原因是项目类型不同,要把传统3D升级成URP项目。解决办法:安装UniversalRP拓展1.在unity中打开需要升级的场景,SaveAs一份并打开该场......
  • 机器学习-概率图模型系列-隐含马尔科夫-观测序列的概率计算-35
    目录1.暴力求解法2.前向算法求HMM观测序列的概率3.从后往前推后向算法1.暴力求解法任意一条路径都有可能得到需要的观测结果:如果我们的隐藏状态数N非常多的那就麻烦了,此时我们预测状态有NT种组合,算法的时间复杂度是O(TNT)阶的2.前向算法求HMM观测序列的概率在前向算......
  • geoc_bd09towgs84 百度坐标转wgs84
    转自:https://zhuanlan.zhihu.com/p/612305027描述百度坐标系转wgs84坐标系"geoc_bd09towgs84"("geom""public"."geometry")示例selectgeoc_bd09towgs84(st_geometryfromtext('POINT(120.2338240008098530.38137624233871)'));-......
  • Apache Geode‘s Integration with Apache Kafka: Building HighThroughput, LowLaten
    1.背景介绍在当今的大数据时代,高性能、高吞吐量和低延迟的数据处理能力已经成为企业和组织的核心需求。ApacheGeode和ApacheKafka都是开源社区提供的强大工具,它们各自擅长于不同的数据处理场景。Geode是一个高性能的分布式缓存和计算引擎,它可以处理大量数据并提供低延迟的访......
  • 【转载】JAVA 百度坐标,火星坐标和WGS84之间互转
    原出处:https://www.cnblogs.com/Fooo/p/16986453.html/***a*/publicfinalstaticdoublea=6378245.0;/***ee*/publicfinalstaticdoubleee=0.00669342162296594323;//圆周率GCJ_02_To_WGS_84publicfinalstatic......