首页 > 其他分享 >【楔子】单细胞测序-最佳的分析Pipeline

【楔子】单细胞测序-最佳的分析Pipeline

时间:2024-06-20 13:56:51浏览次数:25  
标签:本书 分析 Pipeline Python 测序 楔子 scanpy 单细胞

  • 作者:starlitnightly
  • 日期:2023.07.14

!!! note 楔子
从事单细胞分析也有一段时间了,国内大部分中文教程都是使用R语言进行分析,使用Python的还比较少,或者是直译scanpy的教程,不过scanpy可能已经比较旧了。在这里,我们参考了Single cell best practice,希望能给国内的从业者带来一个完善的教程指引以及分析。

简介

人体是一个复杂的机器,严重依赖于生命的基本单位——细胞。细胞可以分为不同类型,在发育过程中甚至会发生转变,在疾病或再生时也会如此。这种细胞的异质性在形态、功能和基因表达谱上都有所体现。强烈的干扰会导致细胞类型的紊乱,从而影响整个系统,甚至引发像癌症这样严重的疾病[Macaulay等人,2017]。因此,了解细胞在正常状态和干扰下的行为对于改善我们对整个细胞系统的理解至关重要。

这项庞大的任务可以通过不同的方式来解决,其中最有前途的方法是在个体水平上对细胞进行分析。到目前为止,每个细胞的转录组主要是通过一种称为单细胞RNA测序的过程来检测的。随着单细胞基因组学的最新进展,现在可以将转录组信息与空间、染色质可及性或蛋白质信息结合起来。这些进展不仅可以揭示复杂的调控机制,而且还增加了数据分析师的复杂性。

如今,数据分析师面临着一个庞大的分析工具领域,其中包含1000多种计算单细胞分析方法。在这个广泛的工具范围中导航以生成科学前沿的可靠结果变得越来越具有挑战性。

本书内容概述

本书的目标是教新手和专业人士单细胞测序分析的最佳实践,在Python中。本书将教您从预处理到可视化、统计评估等一系列常见的分析步骤,以及更深入的内容。通读本书将使您能够独立分析单模态和多模态单细胞测序数据。本书中的指南和建议不仅旨在教授您如何进行单细胞分析,而且着重于如何正确进行分析。我们的建议尽可能地基于外部基准和评价。最后,我们将本书视为单细胞数据分析师的一份实用资源,可以在推荐发生变化时轻松更新。

本书内容不涉及

本书不涵盖生物学或计算机科学的基础知识,包括编程。此外,本书也不是为特定任务设计的所有分析工具的完整集合。我们特别强调那些经过外部验证的工具,这些工具在处理手头的数据时效果最佳,或者是经过社区验证的最佳实践方法。如果不可能进行外部验证,我们只会基于自己广泛的经验推荐工作流程。

本书的结构

本书的每一章对应于典型单细胞数据分析项目的不同阶段。通常,分析工作流程会按照章节的顺序进行,但在下游分析目标方面可能存在一定的灵活性。我们的每一章都包含了大量的参考文献,我们鼓励读者查阅我们陈述观点的原始来源。尽管我们在可能的情况下试图提供所需的背景知识,但我们的总结并不能始终捕捉到我们推荐的全部理由。

学习前准备

生物信息学对于新手来说是一个具有挑战性的研究领域,因为它需要对生物学和计算机科学都有一定的了解。而单细胞分析则更加具有要求,因为它结合了许多子领域,而且数据集通常较大。本书无法涵盖计算单细胞分析的所有先决条件,因此我们建议您在下面对各种主题进行粗略的概述。以下链接可能会提升您在本书中的学习体验:

基本的Python编程。您应该熟悉控制流程(循环、条件语句等)、基本数据结构(列表、字典、集合)以及最常用库(如Pandas和Numpy)的核心功能。如果您对编程和Python还不熟悉,我们强烈推荐北京理工大学的嵩天老师的Python相关的mooc,包括Python基础学习Python数据处理与可视化两节。

了解AnnData和scanpy包的基础知识会有益,但不是绝对必需的。本书对AnnData的介绍足以让您跟上,并介绍了使用scanpy的工作流程。然而,我们无法在本书的过程中介绍scanpy的所有功能。如果您对scanpy还不熟悉,我们强烈建议您通过学习scanpy教程,并偶尔查看scanpy的API参考来学习。

如果您对多模态数据分析感兴趣,建议了解muon和MuData的基础知识。本书对MuData进行了更详细的介绍,但只是简要介绍了muon,类似于AnnData和scanpy。muon教程是学习使用muon进行多模态数据分析的很好入门资料。

生物学基础知识。虽然我们大致介绍了数据的产生过程,但我们不会涵盖DNA、RNA和蛋白质的基础知识。如果您对分子生物学完全不熟悉,建议阅读Bruce Alberts等人的《细胞分子生物学》(Molecular Biology of the Cell)。

License

知识共享许可协议

本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。在此再次感谢Single-cell best practices对单细胞教程的贡献,本书将基于Single-cell best practices结合作者自身的分析经验来完成。

标签:本书,分析,Pipeline,Python,测序,楔子,scanpy,单细胞
From: https://www.cnblogs.com/starlitnightly/p/18258515

相关文章

  • 【diffusers 极速入门(二)】如何得到扩散去噪的中间结果?Pipeline callbacks 管道回调函
    本文是对HuggingFaceDiffusers文档中关于回调函数的翻译与总结,:管道回调函数在管道的去噪循环中,可以使用callback_on_step_end参数添加自定义回调函数。该回调函数在每一步结束时执行,并修改管道属性和变量,以供下一步使用。这在动态调整某些管道属性或修改张量变量时非......
  • NC | 三代测序鉴定SV的方法权衡
    SV鉴定方法概述近日,范德堡大学发表一篇关于长读长鉴定SV比较的文章。Tradeoffsinalignmentandassembly-basedmethodsforstructuralvariantdetectionwithlong-readsequencingdata这类文章近几年来比较多,去年就有一篇类似的发表在NM上。Asurveyofalgorithmsf......
  • 比较第三代测序技术在不同基因组中的组装策略
    目录论文概述论文速读论文方法论文实验论文总结论文概述本文主要探讨了第三代测序技术在不同基因组中的组装策略比较。随着长读序列技术的发展,如PacificBiosciences和OxfordNanopore技术,组装精度和计算成本得到了显著提高。然而,从头组装仍然存在计算成本高、结果质量差等挑战......
  • 单细胞RNA测序(scRNA-seq) 理解Seurat对象存储信息含义和基本操作
    单细胞测序技术是在单个细胞水平上,对基因组、转录组和表观基因组水平进行分析测序技术。bulkRNA-seq获得的是组织或器官等大量细胞中表达信号的均值,无法获取细胞之间的差异信息(即丢失了细胞的异质性),而单细胞测序技术可以很好的弥补bulkRNA-seq这一不足,即获取混合样本中......
  • DockerCompose+Jenkins+Pipeline流水线打包Vue项目(解压安装配置Node)入门
    场景DockerCompose+Jenkins+Pipeline流水线打包SpringBoot项目(解压安装配置JDK、Maven等)入门:https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/139631755以上使用流水线配置和打包springboot后台项目,如果要使用流水线和配置node打包vue项目,可按如下步骤。注:博......
  • DockerCompose+Jenkins+Pipeline流水线打包SpringBoot项目(解压安装配置JDK、Maven等)
    场景DockerCompose中部署Jenkins(DockerDesktop在windows上数据卷映射):https://blog.csdn.net/BADAO_LIUMANG_QIZHI/article/details/139491855Docker+Jenkins+Gitee+Maven项目配置jdk、maven、gitee等拉取代码并自动构建以及遇到的那些坑:https://blog.csdn.net/BADAO_LIUMANG_......
  • 云原生时代:从 Jenkins 到 Argo Workflows,构建高效 CI Pipeline
    作者:蔡靖ArgoWorkflowsArgoWorkflows[1]是用于在Kubernetes上编排Job的开源的云原生工作流引擎。可以轻松自动化和管理Kubernetes上的复杂工作流程。适用于各种场景,包括定时任务、机器学习、ETL和数据分析、模型训练、数据流pipline、CI/CD等。KubernetesJobs......
  • DevOps生命周期的8个阶段和DevOps pipeline 详解
    您可能也在探索DevOpspipeline或工作流的概念,这些术语可能会根据不同的解释者而有所交替使用。尽管如此,DevOps生命周期和DevOpspipeline这两个术语更常被提及。本文将首先阐述DevOps生命周期的概念,然后深入介绍DevOpspipeline。DevOps生命周期和DevOpspipeline的概述DevOps......
  • 易基因:RNA免疫共沉淀测序 (RIP-seq) 技术介绍
    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。RIP-seq是将RNA免疫共沉淀(RNAImmunoprecipitation,RIP)与二代测序技术(NGS)相结合以研究细胞内RNA与蛋白互作的技术,RIP利用目标蛋白抗体把相应的RNA-蛋白复合物(RNABindingProtein,RBP)沉淀下来,然后经过富集和纯化就可以......
  • python 通过 subprocess 运行的代码 exit(1) 不能使得pipeline fail
    在使用Python的subprocess模块运行外部命令时,如果你希望子进程的退出状态码能够影响Python脚本的执行结果,尤其是在使用管道(pipeline)时,你需要手动检查子进程的返回码并采取相应的措施。简单地使用subprocess.run或subprocess.call运行子进程并不会自动使Python脚......