首页 > 其他分享 >gatk 实现基于染色体合并gvcf文件,并获取变异

gatk 实现基于染色体合并gvcf文件,并获取变异

时间:2023-10-07 10:51:23浏览次数:38  
标签:文件 vcf 变异 染色体 gatk chrN gvcf

 

001、基于染色体合并gvcf文件

gatk CombineGVCFs -R reference.fna -V gvcf.list -L chrN -O chrN.merged.g.vcf.gz

其中:

referen.fna 是参考基因组;

gvcf.list是将要合并的gvcf文件的列表文件,一行一个个体;格式如下:

ERR2985607.g.vcf
ERR2985608.g.vcf
ERR2985609.g.vcf
ERR2985610.g.vcf

chrN是染色体的名称:跟参考基因组中的染色体名称一致(不带>号)

-o指定输出文件。

 

002、获取单个染色体的vcf文件

 

 

 

003、最后合并所有染色体的vcf文件。

 

.

 

标签:文件,vcf,变异,染色体,gatk,chrN,gvcf
From: https://www.cnblogs.com/liujiaxin2018/p/17745758.html

相关文章

  • gatk线程数对标记重复速度的影响
     001、[b20223040323@admin1test]$lsSRR1770413.sorted.bamSRR1770413.sorted.markdup_metrics.txtSRR1770413.sorted.markdup.bamstep4.slurm[b20223040323@admin1test]$timegatk--java-options"-Xmx100g-XX:ParallelGCThreads=1"MarkDu......
  • 数组变异方法和非变异方法的总结
    区别:1.操作数组的方法中,分为变异方法和非变异方法。2.其中,变异方法意味着会改变原数组,而非变异方法则只会返回一个新数组,不会修改原始数组数组变异方法:push()//数组尾部追加一个元素pop()//数组尾部弹出一个元素shift()//数组头部弹出一个元素unshift()//数组头部插入一个......
  • 生信: 一起读官方文档 GATK2.1版本 篇
    一起读官方文档GATK2.1版本篇参考文章:GATK使用:https://www.plob.org/article/7070.htmlGATK介绍GATK做什么的?它主要用于从sequencing数据中进行variantcalling,包括SNP、INDEL。比如现在风行的exomesequencing找variant,一般通过BWA+GATK的pipeline进行数据分析。BWA......
  • 序列变异类型
     001、SV 002、CNV  。 ......
  • 三代测序数据从碱基识别、基因组组装、变异检测和甲基化修饰检测等方面的内容
    王院长的报告涵盖了针对三代测序数据从碱基识别、基因组组装、变异检测和甲基化修饰检测等方面的内容。在基因组组装算法方面,王院长分享了其团队在二代和三代测序数据基因组组装算法设计与分析方面的成果和突破。其中,针对长读长测序的高错误率以及错误分布不均匀等问题,王院长介绍......
  • 【Sword系列】第七届全国残疾人职业技能大赛样题-网络安全-变异凯撒
    前言在密码学中,凯撒密码是一种最简单且最广为人知的加密技术。它是一种替换加密的技术,明文中的所有字母都在字母表上向后(或向前)按照一个固定数目进行偏移后被替换成密文。例如,当偏移量是3的时候,所有的字母A将被替换成D,B变成E,以此类推。ROT13是凯撒密码的一种变体,即移位数为13。RO......
  • Sentieon实战:NGS肿瘤变异检测流程
      肿瘤基因突变检测是NGS的一个重要应用,其分析难点主要在于低频变异的准确性。不同于遗传病检测,肿瘤样本类型多样,测序方法和参数复杂,且缺乏对应各种场景的公共标准真集。再加上常用开源软件经常遇到的准确性低,稳定性差,速度慢等问题。这使得广大诊断公司在评估肿瘤变异检测工具......
  • mutate-joins {dplyr}:变异联接
    可变联接将列从y添加到x,并根据键值匹配行:inner_join():包括x和y中的所有行。left_join():包括x中的所有行。right_join():包括y中的所有行。full_join():包括x或y中的所有行。如果x中的一行与y中的多行匹配,则y中的所有行将针对x中的每个匹配行返回一次。......
  • 基于第三代测序数据的基因组结构变异检测方法研究
    基于第三代测序数据的基因组结构变异检测方法研究姜涛哈尔滨工业大学摘要:随着测序技术的不断成熟和广泛应用,以测序技术为驱动的基因组、转录组等多组学的研究得到了跨越式发展,推动了基因组科学、遗传学、临床医学等多学科的变革。基因组变异检测作为基因组研究中最为核心......
  • 基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究
    基于第三代测序技术的基因组SNP和Indel变异检测关键算法研究廖小青哈尔滨工业大学摘要:随着生活水平的提升,人们对于自身的好奇促使人们对基因进行研究。其中,变异是人类疾病的一个重要诱因,对变异进行研究可以推动基础生物学和医学的发展。相比于大区域基因组的结构变异,SNP......