• 2024-06-16尘封在文件夹中的GWAS和QTL定位的古老笔记
    longlongago,小野记录了关于重测序基因定位和GWAS相关的笔记。打开古老的文件夹,发现有些东西依然不过时,零零散散,随意发布。QTL定位策略:群体类型:作图群体,自然群体选材策略:全群个体分析,选择基因型分析,混合分组分析优点:适合稀有基因研究;群体可控,目的性和结果预期性强缺点:需
  • 2024-05-24Sap Hana 数据迁移同步优化(二)
    简述[CloudCanal](https://www.clougence.com?src=cc-doc-blog-hana-cdc-optimize_two?kw=cnblogs_20240524)近期对Hana源端链路做了新一轮优化,这篇文章简要做下分享。本轮优化主要包含:表级别CDC表表级别任务位点表级别触发器单CDC表的问题CloudCanal在实现Ha
  • 2024-04-07Kafka原理剖析之「位点提交」
    一、背景Kafka的位点提交一直是Consumer端非常重要的一部分,业务上我们经常遇到的消息丢失、消息重复也与其息息相关。位点提交说简单也简单,说复杂也确实复杂,没有人能用一段简短的话将其说清楚,最近团队生产环境便遇到一个小概率的报错“Offsetcommitfailedwitharetriablee
  • 2024-03-08如何避免MYSQL主从延迟带来的读写问题?
    在MYSQL部署架构选型上,许多公司都会用到主从读写分离的架构,如下是一个一主一从的架构,主库master负责写入,从库slave进行读取。但是既然是读写分离,必然会面临这样一个问题,当在主库上进行更新后,有可能数据还没来得及同步到从库,但是这个时候又有读数据的需求,为了能正确读取出数据,这
  • 2023-10-27GLNexus进行joint calling时的"half-calls"(如./0, ./1)问题
    目录关于GLNexus由于重叠变异产生的half-callsGATKjointcalling对于half-calls的处理建议处理关于GLNexusGLnexus是由DNAnexus开发,用于可扩展的gVCF合并和联合变异(jointcalling)要求群体测序项目,GL即genotypelikelihood之意。GATK作为变异检测金标准软件,缺点在于速度很慢。尽管
  • 2023-09-24Kafka 是如何管理消费位点的
    ApacheKafkahttps://kafka.apache.org/34/documentation.html#impl_offsettrackingConsumerOffsetTrackingKafkaconsumertracksthemaximumoffsetithasconsumedineachpartitionandhasthecapabilitytocommitoffsetssothatitcanresumefromthoseo
  • 2023-09-23Kafka 是如何管理消费位点的
    Kafka是如何管理消费位点的?https://mp.weixin.qq.com/s?__biz=MzI0NTIxNzE1Ng==&mid=2651220012&idx=2&sn=1d5623daaf327f0688995565901bd63d&chksm=f2a32ac7c5d4a3d1ffe6ebe3d2fbf37cf92320a08aa6f0531989c48b0a72b19f4e94e09ccd75&mpshare=1&scene=1&s
  • 2023-09-22Flink的Checkpoint状态和Kafka Broker上的提交位点一致
    Flink的Checkpoint状态和KafkaBroker上的提交位点一致消息队列Kafka连接器_实时计算Flink版-阿里云帮助中心https://help.aliyun.com/zh/flink/developer-reference/kafka-connector消息队列Kafka更新时间:2023-09-1910:33:27  本文为您介绍如何使用消息队列Kaf
  • 2023-08-14论文解读:《iRNA-PseU:鉴定RNA假尿苷位点》
    标题:iRNA-PseU:IdentifyingRNApseudouridinesites.DOI:10.1038/mtna.2016.37期刊:DOAJ:DirectoryofOpenAccessJournals-DOAJ作者:WeiChen;HuaTang;JingYe;HaoLin;Kuo-ChenChou出版日期:2016-01-01网址: https://doi.org/10.1038/mtna.2016.37老文章了,为
  • 2023-08-08论文解读:《基于深度多核学习的用于识别 DNA n4 -甲基胞嘧啶位点的高阶模糊推理系统》
    Title:Adeepmultiplekernellearning-basedhigher-orderfuzzyinferencesystemforidentifyingDNAN4-methylcytosinesites期刊:InformationSciences中科院分区:一区(计算机科学技术)影像因子:8.1↓0.133文章链接:https://doi.org/10.1016/j.ins.2023.01.149Websever:Github:
  • 2023-07-27NGS实验室质控-DNA污染控制方法篇(引用)
    NGS实验室质控-DNA污染控制方法篇 本篇主要和大家分享有关NGS检测体细胞突变时判断DNA污染的方法。  一、FDA产品-MSK-IMPACT的DNA污染控制方法 1)判断样本交叉污染(samplemix-up) 计算参考样本和待查样本间的“不一致比例”,即在参考样本中纯合基因
  • 2023-07-26如何快速简化vcf信息?
    目录需求描述可能存在错误的做法更靠谱的做法需求描述vcf是标准的基因型格式文件,其中包含的信息可多可少。主要在于INFO可无限扩展特征,以及每个样本的FORMAT信息,会大大增加vcf文件的大小。一般来说,GATK等软件得到的基因型都会有这些信息,初始变异我们最好保留它们,因为这是过滤位
  • 2023-07-10基因与基因型的关系
    基因(gene)是能够编码蛋白质或者RNA等具有特定功能产物的/负载遗传信息的基本单位,即有遗传效应的DNA片段一个基因上有很多个位点,即碱基对ATGC,有某些位点杂合或纯合会导致不同的蛋白功能,从而变现出不一样的表型或症状,杂合或纯合就是不同的基因型
  • 2023-07-04易基因: RRBS揭示基于DNA甲基化驱动基因的肾透明细胞癌预后模型的鉴定和验证|项目文章
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。肾细胞癌(RCC)是最常见的肾癌亚型,每年超400万例新发病例,是泌尿系统恶性肿瘤导致的第二大死因。2%-70%的RCC为透明细胞RCC(Clearcellrenalcellcarcinoma,ccRCC)。DNA甲基化(DNAmethylation,DNAm)是主要的表观遗传修饰之一
  • 2023-06-09关于多项技术在分子领域的应用
    王鑫炫:该文章介绍了一种基于R/Shiny的交互式生物学Web应用程序的开发方法和该方法的基本原理和实现细节,并提供了几个示例应用程序来演示该方法的功能和效果。该文章认为该方法可以帮助生物学家和研究人员更好地理解和分析生物学数据,并提供更好的数据可视化和交互性。生物学数据
  • 2023-04-26R语言实现GWAS结果显著SNP位点归类提取与变异类型转化
    GWAS结果显著SNP位点归类提取与变异类型转化根据GWAS得到的Rresult文件信息,能够找出每个snp位点对应的显著性情况和基因变异信息,接下来,需要根据表格中的信息进行归纳总结,对不同显著性层次进行区分,找出可能性最大的点,过程比较繁琐。这里笔者分享一个算法,使统计SNP和变异类型变的
  • 2023-04-01解决tabix建索引报错[E::hts_idx_push] Unsorted positions on sequence #
    当我对两个基因型文件位置取交集,并重新生成两个vcf:$bcftoolsview-Roverlap.lstvariant.filter.vcf.gz-Oz-o300.vcf.gz出现如下错误:$tabix300.vcf.gz[E::hts_idx_push]Unsortedpositionsonsequence#4:29013869followedby29013853tbx_index_buildfailed:300.
  • 2023-03-27引用的: 本篇主要和大家分享有关NGS检测体细胞突变时判断DNA污染的方法。
     来自https://mp.weixin.qq.com/s?src=11&timestamp=1679887356&ver=4431&signature=FISeM4PGVyZ-AGQmG7Aib6zDiSV7B1TvaBgc41rLNE-ofmYD1pw2Nu46xLzgY5AsBI261SsCp*MlRJ
  • 2023-03-16kafka重置消费位点
    kafka重置消费位点一般分几种情况重置到最新的消费位点重置到最早的消费位点根据时间戳重置消费位点跟据指定偏移量重置消费位点基于kafka2.0.0packagecom.real
  • 2023-03-02RocketMQ - 消费者消费方式
    RocketMQ的消费方式包含Pull和Push两种Pull方式:用户主动Pull消息,自主管理位点,可以灵活地掌控消费进度和消费速度,适合流计算、消费特别耗时等特殊的消费场景。缺点也显而
  • 2023-03-01RocketMQ - 消费者进度保存机制
    RocketMQ设计了远程位点管理和本地位点管理两种位点管理方式。集群消费时,位点由客户端提交给Broker保存,具体实现代码在RemoteBrokerOffsetStore.java文件中;广播消费时,位点
  • 2023-02-24易基因|DNA甲基化研究的测序数据挖掘思路:干货分享
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。总体来说,DNA甲基化一般遵循三个步骤进行数据挖掘。首先,进行整体全基因组甲基化变化的分析,包括平均甲基
  • 2023-02-24RocketMQ - 消费者启动机制
    RocketMQ客户端中有两个独立的消费者实现类:org.apache.rocketmq.client.consumer.DefaultMQPullConsumer和org.apache.rocketmq.client.consumer.DefaultMQPushConsumer
  • 2023-02-23易基因|ChIP-seq等组学研究鉴定出结直肠癌的致癌超级增强子:Nature子刊
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。超级增强子(Superenhancer)是一类包含多个普通增强子的大簇,主要富集高密度的转录因子、辅助因子及增强子
  • 2023-01-18Apache RocketMQ 5.0 笔记
    RocketMQ5.0:云原生“消息、事件、流”实时数据处理平台,覆盖云边端一体化数据处理场景。核心特性云原生:生与云,长与云,无限弹性扩缩,K8s友好高吞吐:万亿级吞吐保证,同时满足