首页 > 其他分享 >单细胞测序 批次效应 batch effect

单细胞测序 批次效应 batch effect

时间:2023-10-31 15:01:36浏览次数:42  
标签:批次 不同 测序 effect 效应 batch 细胞 https

什么是批次效应
大型的单细胞测序项目一般都会产生许多细胞,这些样本制备过程很难保持时间一致、试剂一致,另外上机测序的时候也不一定在同一个测序仪上。

具体可以看这篇文章:

https://www.nature.com/articles/nrg2825

Batch effects are sub-groups of measurements that have qualitatively different behaviour across conditions and are unrelated to the biological or scientific variables in a study. For example, batch effects may occur if a subset of experiments was run on Monday and another set on Tuesday, if two technicians were responsible for different subsets of the experiments or if two different lots of reagents, chips or instruments were used.

简而言之,不同时间、不同操作者、不同试剂、不同仪器导致的实验误差,反映到细胞的表达量上就是批次效应,这个很难去除但可以缩小。如果效应比较小还可以接受,如果批次效应很严重,就可能会和真实的生物学差异相混淆,让结果难以捉摸。我们需要辨别到底存在多大程度的批次效应,对我们真实的生物学样本会不会产生影响。

校正批次效应的目的就是:减少batch之间的差异,尽量让多个batch的数据相一致,这样下游分析就可以只考虑生物学差异因素。

https://www.plob.org/article/20845.html

  ----------------------------------

单细胞测序 批次效应 batch effect

批次效应,顾名思义,不同批次带来的效应。

深层次造成批次效应的原因
宏观层面
1)对样本处理问题,2)细胞活性问题,3)试剂kit问题,4)测序问题,等

微观本质上
1)造成了样本间mRNA的相对不稳定,2)造成细胞破裂,其mRNA流出最后污染整个样本,3)造成样本间mRNA捕获率不一致,4)造成测序饱和度不一致,或者数据质量不一,等

不同项目中,面临的批次效应程度各有不同,有些可以不用特殊处理,有些甚至怎么处理都不管用。

 ----------------------------------

在数据分析的时候,我们的目标是找到样本之间真实的生物学差异。但是这种真实的生物学因素往往会受到各种因素影响,举几个场景

 

不同样本
同一样本的生物学重复
同一样本的技术重复
同一样本在同一个实验室由同一团队在不同时间点处理
同一细胞系/小鼠在不同实验室
不同建库策略,10X平台,Drop-seq, SMART2-seq
不同测序平台,BGI/Illumina
不同分析流程(甚至一个工具的多个版本,如salmon,CellRanger)

这些因素之间有些是生物学真实的差异,有些是抽样时的随机波动。有些是系统性因素,比如说批次效应(batch effect)。

 

我们没有足够的信息来判断此处是否存在批次效应。要做出决定,我们确实需要对每个簇所代表的细胞类型/状态有所了解。(https://zhuanlan.zhihu.com/p/354341992)

 ----------------------------------

做单细胞测序的时候,我们往往用到不同时期或者不同测序平台的数据,即使是同样的细胞类型,也可能完全不能聚类到一个类群中,如下所示,这两个数据是不同时期做的同一个细胞,几乎没有交集,因此,我们分析的时候需要去除批次效应。

去除批次效应之前

 

单细胞测序 批次效应 batch effect_ci

 去除批次效应之后

单细胞测序 批次效应 batch effect_ci_02

  

链接:https://www.jianshu.com/p/406ece042c26

 ----------------------------------

 代码示例:

https://www.plob.org/article/20845.html

数据:CEL-seq, GSE81076
数据是Grun et al. (2016) 利用CEL-seq方法,加入了UMI、ERCC,表达矩阵可以从GEO获取(https://www.ncbi.nlm.nih.gov//geo/query/acc.cgi?acc=GSE81076)

 

 

  ----------------------------------

14种单细胞测序去批次效应哪家强 

单细胞测序 批次效应 batch effect_ci_03

 

 https://www.sohu.com/a/393003790_120691808

----------------------------------

2020年5月11日,在《Nature Communications》有一篇名为“Deep learning enables accurate clustering with batch effect removal in single-cell RNA-seq analysis”的文章。文中介绍了一种深度学习算法——DESC,它是一种无监督的深度嵌入算法,通过迭代优化聚类目标函数对单细胞RNA测序的数据进行聚类,并且能够消除批次效应。通过全面的评估证明了DESC可以在群集精度和稳定性之间取得适当的平衡,并且内存占用空间很小,不需要批次信息就可以消除批次效应,同时还能利用GPU。随着单细胞研究规模的不断扩大,DESC能够成为在生物医学研究领域中一个十分有价值的工具。

https://zhuanlan.zhihu.com/p/140719429----------------------------------

当将细胞分组操作时可能会带来批次效应,比如不同芯片上的细胞、不同测序通道中的细胞或在不同时间点收集的细胞都归类于不同的组。实验操作过程中细胞所经历的不同环境可能会影响转录组的测量结果或甚至影响细胞自身的转录变化。所产生的影响存在多个层面:同一实验不同的细胞组、同一实验室的不同实验或不同实验室的数据集之间。在这里,我们把第一种情况与后面两种情况区分开。校正同一实验中样品或细胞之间的批次效应是bulk RNA测序批次效应的一种经典方案。我们将其与整合来自多个实验的数据(称为数据整合)区分开。通常批次效应校正使用线性方法,而非线性方法则用于数据整合。

https://www.embopress.org/doi/full/10.15252/msb.20188746

http://blog.sciencenet.cn/blog-118204-1220240.html

----------------------------------

https://www.bilibili.com/read/cv6412828/

https://zhuanlan.zhihu.com/p/354341992



标签:批次,不同,测序,effect,效应,batch,细胞,https
From: https://blog.51cto.com/emanlee/8105499

相关文章

  • 单细胞测序 doublet 二聚体
    Doublets及其形成的原因单细胞测序期望每个barcode标签下只有一个真实的细胞,但是实际数据中会有两个或多个细胞共用一个barcode的情况,业内称之为doublets或multiplets(后面统称为doublets)。Doublets形成的原因主要是高通量单细胞测序一般使用液滴微流控(dropletmicrofluidi......
  • 单细胞测序技术 概述
    单细胞测序技术是指在单个细胞水平上对转录组或基因组进行扩增并测序,以检测单细胞在基因组(结构变异-StructuralVariations-SVs;拷贝数变异-Copynumbervariants-CNVs;单核苷酸变异-Singlenucleotidevariants-SNVs等),转录组学(RNA表达水平;转录本的选择性剪接),表观组学(DNA甲基化等),蛋......
  • 单细胞测序 RNA velocity | RNA速率
    单细胞测序RNAvelocity|RNA速率RNAvelocity:thetimederivativeofthegeneexpressionstate—canbedirectlyestimatedbydistinguishingbetweenunsplicedandsplicedmRNAsincommonsingle-cellRNAsequencingprotocols.ahigh-dimensionalvectorthatpredic......
  • 【CVPR2023】Learning A Sparse Transformer Network for Effective Image Deraining
    论文:https://readpaper.com/paper/4736105248993591297代码:https://github.com/cschenxiang/DRSformerTransformer模型通常使用标准的QKV三件套进行计算,但是部分来自K的token与来自Q的token并不相关,如果仍然对这些token进行特征聚合计算会影响图像修复的性能。......
  • 生产者消费者模式下实现多batch延时推理
    生产者消费者模式下实现多batch延时推理需求分析在实际推理过程中为了实现较高的吞吐量和较高的资源利用率,往往会使用多线程来收集多次请求,并组合形成多batch下的模型推理,一种常见的实现便是生产者和消费者模式,其需求如下:生产者收集提交的请求,消费者对请求进行消费,并将结果返......
  • 发掘影像之魅:ON1 Effects 2023——您的mac照片纹理滤镜处理专家
    在照片后期处理的世界里,一款得心应手的工具往往能赋予照片无尽的可能。ON1Effects2023,这款专为mac用户打造的照片纹理滤镜处理软件,以其强大的功能和高效性能,将帮助您深度挖掘照片的潜在魅力。→→↓↓载ON1Effects2023macON1Effects2023为您提供了丰富多样的滤镜库,从经......
  • Water Pollution: The defination, types, causes, effects and meatures.
    Whatiswaterpollution?Waterpollutioncanbedefinedinmanyways.Usually,itmeansoneormoresubstanceshavebuiltupinwatertosuchanextentthattheycauseproblemsforanimalsorpeople.Oceans,lakes,rivers,andotherinlandwaterscannatu......
  • 【Azure Batch】在中国区批处理服务(Mooncake Batch Account)上实验自动池(Auto Pool)
    问题描述在AzureBatch的介绍文档中,提出了自动池的概念,它可以在任务完成后,自动删除Pool资源,详细介绍:https://docs.azure.cn/zh-cn/batch/nodes-and-pools#autopools& https://learn.microsoft.com/zh-cn/rest/api/batchservice/job/add?tabs=HTTP#autopoolspecification自动池是......
  • CocosCreator3.x 应用在UI(Sprite) 上的 shader(.effect) 的合批,通过自定义顶点参数(一
    前言为啥要合批减少DC什么是自定义顶点参数通过几何体实例化特性(GPUInstancing)可使GPU批量绘制模型相同且材质相同的渲染对象。如果我们想在不打破这一特性的情况下单独修改某个对象的显示效果,就需要通过自定义几何体实例化属性。参考文档UI(Sprite)怎么你了?按照文......
  • CocosCreator3.x 应用在UI(Sprite) 上的 shader(.effect) 的合批,通过自定义顶点参数(二
    具体操作步骤接下来以一个制造旋转效果的shader为例子,提供了这些参数的设置:旋转速度float旋转中心位置vec2逆时针/顺时针bool扭曲度float并在使用的贴图一致的前提下并且参数不同的值都能够合批。最终项目可以从GITHUB获取。CCC版本:3.8.0深入了解可以阅读后续......