• 2024-11-12变异等位基因频率VAF计算方法
    在生物信息学中,变异等位基因频率(Variant等位基因频率,VAF)是指在一个种群中,某个特定变异位点上变异等位基因出现的频率,常见的计算VAF的方法如下:1.基于测序深度的计算方法原理:通过统计变异位点的测序深度以及变异等位基因的支持reads数来计算VAF。测序深度是指在该位
  • 2024-11-05易基因: RNA-BS揭示动物不同发育阶段的mRNA m5C甲基化图谱和调控机制|Nat Commun
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。m5C是已知的RNA修饰之一,但其在mRNA中的发育动态、功能和进化仍然知之甚少。最初报道m5C在mRNA中普遍存在,但后来认识到许多最初被鉴定的位点可能假阳性。准确和系统地检测转录组范围mRNAm5C水平一直具有挑战性,缺乏对m
  • 2024-10-24AbMole|哺乳动物 DNA 中无碱基位点的复杂基因组模式研究
    DNA损伤在生物学和疾病中起着至关重要的作用,而无碱基(AP)位点作为一种常见的DNA损伤类型,其基因组学特征仍未被充分探索。来自华侨大学医学院基因组学研究所的YeCai,  1HuifenCao,  2FangWang等多名研究人员发表了题为《Complexgenomicpatternsofabasicsitesinm
  • 2024-10-06GATK joint calling的逻辑、原理与优势
    GATK(GenomeAnalysisToolkit)中的jointcalling是一种变异检测策略,它允许同时对多个样本进行变异位点的分析,以提高变异检测的准确性和效率。以下是jointcalling的一些关键原理和优势:数据共享:在jointcalling过程中,信息在所有样本间共享。这意味着如果一个样本在某个位点的
  • 2024-07-22基础概念
    NameServer:Broker的注册中心,负责Broker管理、路由信息管理(消息来了到哪个Broker)Broker:RocketMQ核心,负责接收生产者消息、消息持久化、消息过滤....Topic:主题,收发消息都要指明主题,生产者的消息往哪里发、消费者到哪里消费消息Queue:队列,每个Topic默认4个队列,真实存放
  • 2024-07-1769、Flink 的 DataStream Connector 之 Kafka 连接器详解
    1.概述Flink提供了Kafka连接器使用精确一次(Exactly-once)的语义在Kafkatopic中读取和写入数据。目前还没有Flink1.19可用的连接器。2.KafkaSourcea)使用方法KafkaSource提供了构建类来创建KafkaSource的实例。以下代码片段展示了如何构建KafkaSource来消
  • 2024-07-12librdkafka 常见问题FAQ
    1,++librdkafka一个消费者实例分配了所有分区不提交位点,在发生rebalance后,会重新从头消费数据吗在发生重新平衡(rebalance)后,消费者会从哪里开始消费数据取决于消费者组的配置,特别是auto.offset.reset配置项。关键配置项:auto.offset.resetauto.offset.reset决定了在没有有
  • 2024-07-10【基于R语言群体遗传学】-16-中性检验Tajima‘s D及连锁不平衡 linkage disequilibrium (LD)
    Tajima'sDTest已经开发了几种中性检验,用于识别模型假设的潜在偏差。在这里,我们将说明一种有影响力的中性检验,即Tajima'sD(Tajima1989)。Tajima'sD通过比较数据集中的两个
  • 2024-06-16尘封在文件夹中的GWAS和QTL定位的古老笔记
    longlongago,小野记录了关于重测序基因定位和GWAS相关的笔记。打开古老的文件夹,发现有些东西依然不过时,零零散散,随意发布。QTL定位策略:群体类型:作图群体,自然群体选材策略:全群个体分析,选择基因型分析,混合分组分析优点:适合稀有基因研究;群体可控,目的性和结果预期性强缺点:需
  • 2024-05-24Sap Hana 数据迁移同步优化(二)
    简述[CloudCanal](https://www.clougence.com?src=cc-doc-blog-hana-cdc-optimize_two?kw=cnblogs_20240524)近期对Hana源端链路做了新一轮优化,这篇文章简要做下分享。本轮优化主要包含:表级别CDC表表级别任务位点表级别触发器单CDC表的问题CloudCanal在实现Ha
  • 2024-04-07Kafka原理剖析之「位点提交」
    一、背景Kafka的位点提交一直是Consumer端非常重要的一部分,业务上我们经常遇到的消息丢失、消息重复也与其息息相关。位点提交说简单也简单,说复杂也确实复杂,没有人能用一段简短的话将其说清楚,最近团队生产环境便遇到一个小概率的报错“Offsetcommitfailedwitharetriablee
  • 2024-03-08如何避免MYSQL主从延迟带来的读写问题?
    在MYSQL部署架构选型上,许多公司都会用到主从读写分离的架构,如下是一个一主一从的架构,主库master负责写入,从库slave进行读取。但是既然是读写分离,必然会面临这样一个问题,当在主库上进行更新后,有可能数据还没来得及同步到从库,但是这个时候又有读数据的需求,为了能正确读取出数据,这
  • 2023-10-27GLNexus进行joint calling时的"half-calls"(如./0, ./1)问题
    目录关于GLNexus由于重叠变异产生的half-callsGATKjointcalling对于half-calls的处理建议处理关于GLNexusGLnexus是由DNAnexus开发,用于可扩展的gVCF合并和联合变异(jointcalling)要求群体测序项目,GL即genotypelikelihood之意。GATK作为变异检测金标准软件,缺点在于速度很慢。尽管
  • 2023-09-24Kafka 是如何管理消费位点的
    ApacheKafkahttps://kafka.apache.org/34/documentation.html#impl_offsettrackingConsumerOffsetTrackingKafkaconsumertracksthemaximumoffsetithasconsumedineachpartitionandhasthecapabilitytocommitoffsetssothatitcanresumefromthoseo
  • 2023-09-23Kafka 是如何管理消费位点的
    Kafka是如何管理消费位点的?https://mp.weixin.qq.com/s?__biz=MzI0NTIxNzE1Ng==&mid=2651220012&idx=2&sn=1d5623daaf327f0688995565901bd63d&chksm=f2a32ac7c5d4a3d1ffe6ebe3d2fbf37cf92320a08aa6f0531989c48b0a72b19f4e94e09ccd75&mpshare=1&scene=1&s
  • 2023-09-22Flink的Checkpoint状态和Kafka Broker上的提交位点一致
    Flink的Checkpoint状态和KafkaBroker上的提交位点一致消息队列Kafka连接器_实时计算Flink版-阿里云帮助中心https://help.aliyun.com/zh/flink/developer-reference/kafka-connector消息队列Kafka更新时间:2023-09-1910:33:27  本文为您介绍如何使用消息队列Kaf
  • 2023-08-14论文解读:《iRNA-PseU:鉴定RNA假尿苷位点》
    标题:iRNA-PseU:IdentifyingRNApseudouridinesites.DOI:10.1038/mtna.2016.37期刊:DOAJ:DirectoryofOpenAccessJournals-DOAJ作者:WeiChen;HuaTang;JingYe;HaoLin;Kuo-ChenChou出版日期:2016-01-01网址: https://doi.org/10.1038/mtna.2016.37老文章了,为
  • 2023-08-08论文解读:《基于深度多核学习的用于识别 DNA n4 -甲基胞嘧啶位点的高阶模糊推理系统》
    Title:Adeepmultiplekernellearning-basedhigher-orderfuzzyinferencesystemforidentifyingDNAN4-methylcytosinesites期刊:InformationSciences中科院分区:一区(计算机科学技术)影像因子:8.1↓0.133文章链接:https://doi.org/10.1016/j.ins.2023.01.149Websever:Github:
  • 2023-07-27NGS实验室质控-DNA污染控制方法篇(引用)
    NGS实验室质控-DNA污染控制方法篇 本篇主要和大家分享有关NGS检测体细胞突变时判断DNA污染的方法。  一、FDA产品-MSK-IMPACT的DNA污染控制方法 1)判断样本交叉污染(samplemix-up) 计算参考样本和待查样本间的“不一致比例”,即在参考样本中纯合基因
  • 2023-07-26如何快速简化vcf信息?
    目录需求描述可能存在错误的做法更靠谱的做法需求描述vcf是标准的基因型格式文件,其中包含的信息可多可少。主要在于INFO可无限扩展特征,以及每个样本的FORMAT信息,会大大增加vcf文件的大小。一般来说,GATK等软件得到的基因型都会有这些信息,初始变异我们最好保留它们,因为这是过滤位
  • 2023-07-10基因与基因型的关系
    基因(gene)是能够编码蛋白质或者RNA等具有特定功能产物的/负载遗传信息的基本单位,即有遗传效应的DNA片段一个基因上有很多个位点,即碱基对ATGC,有某些位点杂合或纯合会导致不同的蛋白功能,从而变现出不一样的表型或症状,杂合或纯合就是不同的基因型
  • 2023-07-04易基因: RRBS揭示基于DNA甲基化驱动基因的肾透明细胞癌预后模型的鉴定和验证|项目文章
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。肾细胞癌(RCC)是最常见的肾癌亚型,每年超400万例新发病例,是泌尿系统恶性肿瘤导致的第二大死因。2%-70%的RCC为透明细胞RCC(Clearcellrenalcellcarcinoma,ccRCC)。DNA甲基化(DNAmethylation,DNAm)是主要的表观遗传修饰之一
  • 2023-06-09关于多项技术在分子领域的应用
    王鑫炫:该文章介绍了一种基于R/Shiny的交互式生物学Web应用程序的开发方法和该方法的基本原理和实现细节,并提供了几个示例应用程序来演示该方法的功能和效果。该文章认为该方法可以帮助生物学家和研究人员更好地理解和分析生物学数据,并提供更好的数据可视化和交互性。生物学数据
  • 2023-04-26R语言实现GWAS结果显著SNP位点归类提取与变异类型转化
    GWAS结果显著SNP位点归类提取与变异类型转化根据GWAS得到的Rresult文件信息,能够找出每个snp位点对应的显著性情况和基因变异信息,接下来,需要根据表格中的信息进行归纳总结,对不同显著性层次进行区分,找出可能性最大的点,过程比较繁琐。这里笔者分享一个算法,使统计SNP和变异类型变的
  • 2023-04-01解决tabix建索引报错[E::hts_idx_push] Unsorted positions on sequence #
    当我对两个基因型文件位置取交集,并重新生成两个vcf:$bcftoolsview-Roverlap.lstvariant.filter.vcf.gz-Oz-o300.vcf.gz出现如下错误:$tabix300.vcf.gz[E::hts_idx_push]Unsortedpositionsonsequence#4:29013869followedby29013853tbx_index_buildfailed:300.