• 2024-10-06GATK joint calling的逻辑、原理与优势
    GATK(GenomeAnalysisToolkit)中的jointcalling是一种变异检测策略,它允许同时对多个样本进行变异位点的分析,以提高变异检测的准确性和效率。以下是jointcalling的一些关键原理和优势:数据共享:在jointcalling过程中,信息在所有样本间共享。这意味着如果一个样本在某个位点的
  • 2024-06-12GATK不能多线程的问题
    问题:申请了多线程但是只能单线程 17:13:48.941INFOIntelPairHmm-Availablethreads:117:13:48.941INFOIntelPairHmm-Requestedthreads:417:13:48.941WARNIntelPairHmm-Using1availablethreads,but4wererequested 解决方法:exportOMP_N
  • 2023-10-27GLNexus进行joint calling时的"half-calls"(如./0, ./1)问题
    目录关于GLNexus由于重叠变异产生的half-callsGATKjointcalling对于half-calls的处理建议处理关于GLNexusGLnexus是由DNAnexus开发,用于可扩展的gVCF合并和联合变异(jointcalling)要求群体测序项目,GL即genotypelikelihood之意。GATK作为变异检测金标准软件,缺点在于速度很慢。尽管
  • 2023-10-10gatk UnifiedGenotyper
    使用UnifiedGenotyper注意如下:(1)输入:.recalibration.bam(2)输入:.recalibration.bai(3)dbSNP:vcfdbsnp,有头部;有与DNA一样的染色体顺序;有idx文件;UnifiedGenotyperUnabletoreadindexfile,forinputsource:vcf.idxSorryforthedelayedresponse.Itturnsoutthatthisisa
  • 2023-10-07gatk 实现基于染色体合并gvcf文件,并获取变异
     001、基于染色体合并gvcf文件gatkCombineGVCFs-Rreference.fna-Vgvcf.list-LchrN-OchrN.merged.g.vcf.gz其中:referen.fna是参考基因组;gvcf.list是将要合并的gvcf文件的列表文件,一行一个个体;格式如下:ERR2985607.g.vcfERR2985608.g.vcfERR2985609.g.vcfERR2
  • 2023-10-06gatk线程数对标记重复速度的影响
     001、[b20223040323@admin1test]$lsSRR1770413.sorted.bamSRR1770413.sorted.markdup_metrics.txtSRR1770413.sorted.markdup.bamstep4.slurm[b20223040323@admin1test]$timegatk--java-options"-Xmx100g-XX:ParallelGCThreads=1"MarkDu
  • 2023-09-22bam文件去重复
     建库过程PCA扩增过程中引入重复序列,会对变异检测结果产生影响,重复的DNA片段会比对到参考基因组的相同位置,根据这一特点来进行去重复。 001、gatk(picard标记重复)gatkMarkDuplicates-Isample01.sorted.bam-Osample01.sorted.markdup.bam-Msample01.sorted.markdup_m
  • 2023-08-29生信: 一起读官方文档 GATK2.1版本 篇
    一起读官方文档GATK2.1版本篇参考文章:GATK使用:https://www.plob.org/article/7070.htmlGATK介绍GATK做什么的?它主要用于从sequencing数据中进行variantcalling,包括SNP、INDEL。比如现在风行的exomesequencing找variant,一般通过BWA+GATK的pipeline进行数据分析。BWA
  • 2023-05-27GATK最佳实践之数据预处理SnakeMake流程
    <生信交流与合作请关注公众~号@生信探索>写的数据预处理snakemake流程其实包括在每个单独的分析中比如种系遗传变异和肿瘤变异流程中,这里单独拿出来做演示用,因为数据预处理是通用的,在call变异之前需要处理好数据。数据预处理过程包括,从fastq文件去接头、比对到基因组、去除重复
  • 2023-05-2701.GATK人种系变异最佳实践SnakeMake流程:WorkFlow简介
    <~生~信~交~流~与~合~作~请~关~注~公~众~号@生信探索>学习的第一个GATK找变异流程,人的种系变异的短序列变异,包括SNP和INDEL。写了一个SnakeMake分析流程,从fastq文件到最后的vep注释后的VCF文件,关于VCF的介绍可以参考上一篇推文基因序列变异信息VCF(VariantCallFormat)流程代
  • 2023-04-28/usr/bin/env: ‘python’: No such file or directory
     01、问题 02、解决方法a、root@DESKTOP-A31BQ38:/home/software/gatk-4.4.0.0#whichpython3##确定已经安装python;或者执行whichpython,输出python可调用路径/usr/bin/python3 b、root@DESKTOP-A31BQ38:/home/software/gatk-4.4.0.0#ln-s/usr/b
  • 2022-12-02gatk中的 GenomicsDBImport 模块
     官网:https://gatk.broadinstitute.org/hc/en-us/articles/5358869876891-GenomicsDBImport 001、一般用法,变异检测库gatk--java-options"-Xmx4g-Xms4g"Genomic
  • 2022-12-01gatk 实现对vcf文件的合并
     001、测试数据[root@PC1test]#ls##测试数据seg1_1.vcfseg1_2.vcfseg1_3.vcf[root@PC1test]#ll-htotal1.2G-rw-r--r--.1
  • 2022-10-29gatk 对多个样本的g.vcf文件进行合并、进行变异检测
     001、gatkCombineGVCFs-RGCF_000001735.4_TAIR10.1_genomic.fna--variantSRR21814498.g.vcf--variantSRR21814509.g.vcf--variantSRR21814514.g.vcf-Ocoho
  • 2022-10-21GATK源码解析(一)
    程序入口 org.broadinstitute.hellbender.Main类下的main函数publicstaticvoidmain(finalString[]args){newMain().mainEntry(args);}