• 2024-11-12变异等位基因频率VAF计算方法
    在生物信息学中,变异等位基因频率(Variant等位基因频率,VAF)是指在一个种群中,某个特定变异位点上变异等位基因出现的频率,常见的计算VAF的方法如下:1.基于测序深度的计算方法原理:通过统计变异位点的测序深度以及变异等位基因的支持reads数来计算VAF。测序深度是指在该位
  • 2024-11-06[使用整理-1] bamdst:统计覆盖度和测序深度
    BAMDSTBamdst是一个轻量级工具,用于统计bam文件中目标区域的测序深度、覆盖度。必须使用排序后的bam文件,bed文件和输出目录必须优先指定。1.下载安装gitclonehttps://github.com/shiquan/bamdst.gitcdbamdst/make或者使用conda:condainstallxdgene::bamdst
  • 2024-10-26samtools flagstat参数对比对的bam文件进行统计
     001、命令samtoolsflagstatsample_name.sorted.bam>sample_name.flagstat.txt##基本命令  a、生成的文件是一个包含16行的文本文件: 002、(base)[b20223040323@admin2workdir]$catAsiatic1.flagstat.txt##查看统计结果622520785+0intotal
  • 2024-10-17基因组质量评估mapping法
    将测序后的reads与组装好的基因组做alignment(校准),这个过程就被叫做mapping。Mapping之后生成的SAM/BAM文件,可以获取readsmapping回参考基因组的信息(比如mappingrate,coverage,depth),从而评估基因组组装的质量。1.Mapping工具readsmappingtoolsIlluminaDNA-seqreadsB
  • 2024-10-15测序数据质控软件
    测序数据质控是高通量测序(Next-GenerationSequencing,NGS)流程中的重要环节。测序数据的质量直接影响下游分析结果的准确性,因此在分析之前,必须对原始数据进行质控,确保数据可靠。测序数据质控的目标去除低质量数据:过滤掉碱基质量较差的reads,减少噪音。去除接头序列:避免接
  • 2024-07-17利用bwa将自己的数据与参考基因组比对与sam格式转换
    1.bwa的下载与安装https://www.jianshu.com/p/19f58a07e6f4主要参考这篇帖子,如果之前的步骤都走通了的话,依赖什么的不用特别安装,报错了再补也可以安好了之后,进到他的路径,输./bwa,就可以确认bwa有没有安装好了,环境设置好以后可以在其他地方输入bwa,也可以叫他出来。在正式开始
  • 2024-07-17全基因组DNA甲基化测序数据工作流程分析和性能评估 分析软件比较 | 生信专区
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。DNA甲基化与转录调控、基因组印记、干细胞分化、胚胎发育和炎症等过程有关。DNA甲基化异常可能揭示疾病状态,包括癌症和神经系统疾病。因此,人类基因组中5-甲基胞嘧啶(5mC)分布和位点是一个重要的研究方向。全基因组重亚
  • 2024-05-17ORACLE 物理读 逻辑读 一致性读 当前模式读区别
    转自:https://www.cnblogs.com/kerrycode/p/5940626.html在ORACLE数据库中有物理读(PhysicalReads)、逻辑读(LogicalReads)、一致性读(ConsistantGet)、当前模式读(DBBlockGets)等诸多概念,如果不理解或混淆这些概念的话,对你深入理解一些知识无疑是一个障碍,但是这些概念确实挺让让人犯
  • 2024-04-15易基因:ENCODE和modENCODE联盟的ChIP-seq实验设计指南和注意事项|干货
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。ChIP-seq(染色质免疫沉淀测序)实验指南和实践(ChIP-seqguidelinesandpracticesoftheENCODEandmodENCODEconsortia),由ENCODE(EncyclopediaofDNAElements)和modENCODE(ModelOrganismENCODE)联盟研究人员撰写。文
  • 2024-03-09DNA 突变可信度评估升级(支持捕获、扩增子、UMI三种类型 )
    2022-11-2012:09:06星期日目的原先写过DNAgermline变异可信度判定(证据项收集)和DNAgermline变异可信度判定,基于pysam对bam文件的解析,从突变相关的reads收集一些统计指标,再根据各指标人工划分阈值进行评分的增减,从最终得分的高低进而评估突变的可信度。这一年
  • 2024-01-29【MYSQL】4、mysql中的Innodb_buffer_pool_reads和Innodb_buffer_pool_read_requests
    原文链接:https://blog.csdn.net/qq_35462323/article/details/1318115931、Innodb_buffer_pool_reads和Innodb_buffer_pool_read_requests的含义?Innodb_buffer_pool_readsInnodb_buffer_pool_readsThenumberoflogicalreadsthatInnoDBcouldnotsatisfyfromthebuffer
  • 2023-12-27bwa比对
    GATKfastpbwa---产生sam文件bwa有三种算法,其中mem比较全面bwaindexref.fa先建立index,下载参考基因组的fasta文件。?不知道可不可以用压缩文件,教程是解压的。在操作的时候我也解压了bwamemref.faread1.fqread2.fq>aln-pe.sam#无参数R这里输入的.fq可以是压缩
  • 2023-12-06oracle 常用语句
    查找前十条性能差的sql语句:SELECT*FROM(selectPARSING_USER_ID,EXECUTIONS,SORTS,COMMAND_TYPE,DISK_READS,sql_textFROMv$sqlareaorderBYdisk_readsDESC)whereROWNUM<10; 查看占io较大的正在运行的session:SELECTse.sid,se.serial#,pr.SPID,se.username,se
  • 2023-11-03Oracle 性能检查SQL 语句 转载 https://blog.csdn.net/wan212000/article/details/133384545
    目录1.Oracle查询SQL语句1.1.性能查询常用SQL1.1.1.查询最慢的SQL1.1.2.列出使用频率最高的5个查询1.1.3.消耗磁盘读取最多的sqltop51.1.4.找出需要大量缓冲读取(逻辑读)操作的查询1.1.5.查询每天执行慢的SQL1.1.6.从V$SQLAREA中查询最占用资源的查询1.1.7.
  • 2023-10-15fqkit: 一个处理fastq序列的小工具 (一)
    一个用于处理fastq测序文件的命令行小工具,功能还在不断更新中,子命令也不多,支持gzip压缩文件的输入和输出(结果文件名以.gz结尾,结果会自动压缩)。reop:https://github.com/sharkLoc/fqkitinstall:cargoinstallfqkitusage:fqkit:asimpleprogramforfastqfilemanipulatio
  • 2023-10-15sra format SRA文件的格式
    http://www.ebi.ac.uk/ena/about/sra_formatReadmetadataformatMetadataisrepresentedusingXMLdocuments.FordetailedinformationaboutthemetadataXMLspleaserefertoSRAXML1.5metadataformat.ForexampleshowtopreparetheXMLspleasereferto
  • 2023-07-2865.oracle中查看缓存命中率
    DBBlockGets:请求的数据块在buffer能满足的个数当前模式块意思就是在操作中正好提取的块数目,而不是在一致性读的情况下而产生的块数。正常的情况下,一个查询提取的块是在查询开始的那个时间点上存在的数据块,当前块是在这个时刻存在的数据块,而不是在这个时间点之前或者之后的数据
  • 2023-07-031418 - This function has none of DETERMINISTIC, NO SQL, or READS SQL DATA in
    项目场景:mysql创建function报错误1418-ThisfunctionhasnoneofDETERMINISTIC,NOSQL,orREADSSQLDATAin问题描述:执行创建函数的sql语句时,提示:ThisfunctionhasnoneofDETERMINISTIC,NOSQL,orREADSSQLDATAinitsdeclarationandbinaryloggingisenab
  • 2023-06-24基于select机制的Socket服务端
    1、基于Select机制的服务端代码#include<stdio.h>#include<stdlib.h>#include<string.h>#include<unistd.h>#include<arpa/inet.h>#include<sys/socket.h>#include<sys/time.h>#include<sys/select.h>#defineBUF_SIZ
  • 2023-05-22NIPT检测流程
      NIPT检测流程 转自:https://pzweuj.github.io/2019/03/20/NIPT.htmlNIPT即非侵入性产前检测,适用于检测21、18、13号染色体的三体综合征。实际上,NIPT的分析流程与CNV的分析流程相似。主要的分析流程是先得到唯一比对的reads,再提取每条染色体的reads来做一个Z检验得到Z值
  • 2023-05-19CNA-seq
    检测cnv的范围:1KB~几M,中值100KB杂合性缺失,位于一对同源染色体上的相同基因座位的两个等位基因中的一个(或其中部分核苷酸片段)发生缺失,与之配对的染色体上仍然存在1:在有的文献中指出cfDNA长度一般在167bp,ctDNA一般在145bp.在脑脊液中发现(ctDNA)取代在血浆中。本文对13个病人进行了
  • 2023-05-11reads、contigs、k-mer之间的区别
    "Reads"(序列)是指从DNA测序技术中得到的短片段DNA序列。通常这些序列长度较短,可能只有几百个碱基对长。"Contigs"(连读)是通过将读取序列拼接在一起来形成更长的序列。Contigs相对较长,可能达到数千个碱基对长,但它们可能仍然缺少一些重要的信息,例如重复序列或缺失区域。"k-mers"(k个
  • 2023-05-10DNA测序中的reads mapping方向的信息
    在DNA测序中,readsmapping方向指的是描绘short-reads(短序列)对于参考基因组的比对方向,即将短读序列与参考基因组进行比对时匹配的方向。这个方向信息通常被编码为“+”或“-”,其中“+”表示reads的5'端与正向链的3'端相对应,“-”表示reads的5'端与负向链的3'端相对应。具体来说,在
  • 2023-05-02RNA-seq最强综述名词解释&思维导图|关于RNA-seq,你想知道的都在这(续)
    前言NGS系列文章包括NGS基础、转录组分析(Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析(ChIP-seq基本分析流程)、单细胞测序分析(重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程(原理、代码和评述))、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实
  • 2023-04-29ReadAlignChunk_processChunks.cpp:204:processChunks EXITING because of FATAL ERROR in input reads: wr
     001、star报错 002、解决方法fastq文件为压缩格式,运行时需添加该参数:--readFilesCommandzcat