• 2024-09-11scanpy计算n_genes_by_counts和total_counts等质量控制指标
    利用scanpy计算adata的obs中的质量控制指标(n_genes_by_counts,total_counts等参数指标)⚠️注意:只是计算相关质量控制指标,并不会筛选/过滤数据。需要用的包:scanpy和anndata导入包和读取adata数据importanndataimportscanpyasscimportpandasaspdimportnumpyasnpa
  • 2024-06-21使用国产大模型完成单细胞自动注释
    作者按我们在Python的scverse生态中,重新实现了GPTCelltype的函数,并加入了更多大模型的扩展,同时我们并将其封装进OmicVerse框架中全文字数|预计阅读时间:2000|5min——Starlitnightly(星夜)GPT-4是一种专为语音理解和生成而设计的大型语言模型。哥伦比亚大学梅尔曼公共卫生
  • 2024-06-20单细胞测序最好的教程(十三):你真的做对过干预后细胞分析吗?
    作者按本章节主要讲解了干预(不同处理)的单细胞数据的正确分析方法,讲解了干预分析与差异表达分析,细胞组成分析的区别,并介绍了查找受扰动影响最大的细胞类型以及预测单细胞对扰动的转录反应的干预分析方法。本教程首发于单细胞最好的中文教程,未经授权许可,禁止转载。全文字数|预计
  • 2024-06-20单细胞测序最好的教程(十五):最具代表性的拟时序计算模型合集
    作者按本章节主要讲解了不基于RNA速率的三种拟时序模型的代表算法,包括扩散时间,Slingshot,Palantir,VIA等,并简单介绍了细胞的状态转移。本教程首发于单细胞最好的中文教程,未经授权许可,禁止转载。全文字数|预计阅读时间:5000|10min——Starlitnightly(星夜)1.背景单细胞测序技
  • 2024-06-20单细胞测序最好的教程:(六)细胞类型注释|或许是全网最详细的注释教程
    作者按本教程将是本系列教程中最重要的一章,我们后续所有的单细胞分析,都要基于准确的细胞类型注释。本系列教程首发于“[单细胞最好的中文教程](single_cell_tutorialReadthedocs)”,未经授权许可,禁止转载。全文字数|预计阅读时间:4500|5min——Starlitnightly1.背景我们
  • 2024-06-20单细胞测序最好的教程(五):聚类
    我们前面四次教程,已经完成单细胞数据的预处理了,包括质控,归一化,高可变基因筛选,降维。现在,我们就要开始单细胞测序的正式分析了,细胞类型注释等,在开始介绍细胞类型注释前,我们先来了解一下聚类。对于生物学家而言,聚类一词可能有点晦涩,因为这个词是机器学习领域里的概念。所以本章将详
  • 2024-06-20单细胞测序最好的教程(九): 细胞类型自动注释|发表在Science的注释算法
    作者按本章节主要讲解了基于大模型的自动注释方法,包括CellTypist(发表在Science)和MetaTiME(发表在Naturecommunication),一个通用,一个泛癌专用。本教程首发于单细胞最好的中文教程,未经授权许可,禁止转载。全文字数|预计阅读时间:3000|3min——Starlitnightly(星夜)1.背景我
  • 2024-06-20单细胞测序最好的教程(七): 数据整合与批次效应校正
    作者按本教程将是本系列教程中比较有趣的一章,对于大型的单细胞测序项目来说,数据整合也是不可或缺的一个步骤。本教程首发于单细胞最好的中文教程,未经授权许可,禁止转载。全文字数|预计阅读时间:5000|5min——Starlitnightly区别于我们以往所学的数据整合,在单细胞测序领域,数
  • 2024-06-20单细胞测序最好的教程(十二):你真的做对了细胞比例分析吗?
    作者按本章节主要讲解了单细胞数据的细胞组成(比例)的分析方法,讲解了为什么直接分析比例不行的原因与例子,并介绍了“有标签”,“有标签有层次”,“无标签”三个维度的细胞组成分析方法。本教程首发于单细胞最好的中文教程,未经授权许可,禁止转载。全文字数|预计阅读时间:5000|10min
  • 2024-06-20单细胞测序最好的教程(十一):差异表达基因分析
    作者按本章节主要讲解了单细胞数据的差异表达基因分析方法,详细对比了ttest与DEseq2在所有细胞进行差异表达分析的异同,以及为什么要使用元细胞分析的原因。本教程首发于单细胞最好的中文教程,未经授权许可,禁止转载。全文字数|预计阅读时间:3000|5min——Starlitnightly(星夜)1.
  • 2024-06-20单细胞测序最好的教程(十):细胞类型注释迁移|万能的Transformer
    作者按本章节主要讲解了基于transformer的迁移注释方法TOSICA,该算法在迁移注释上达到了SOTA的水平,在注释这么卷的赛道愣是杀出了一条血路。本教程首发于单细胞最好的中文教程,未经授权许可,禁止转载。全文字数|预计阅读时间:3000|3min——Starlitnightly(星夜)1.背景迁移注释
  • 2024-06-20单细胞测序最好的教程(十六):关于RNA速率你想知道的都在这
    作者按本章节详细讲解了基于RNA速率的三种拟时序模型,包括稳态模型,EM模型和深度学习模型,并对比了不同模型的适用场景与计算特点。本教程首发于单细胞最好的中文教程,未经授权许可,禁止转载。全文字数|预计阅读时间:5000|10min——Starlitnightly(星夜)5.2RNA速率1.背景单细
  • 2024-06-20单细胞最好的教程(二):归一化
    1.背景在前面的教程中,我们从数据集中删除了低质量的细胞,包括计数较差以及双细胞,并将数据存放在anndata文件中。由于单细胞测序技术的限制,我们在样本中获得RNA的时候,经过了分子捕获,逆转录还有测序。这些步骤会影响同一种细胞的细胞间的测序计数深度的变异性,故单细胞测序数据中的
  • 2024-06-20单细胞最好的教程(三):特征基因选择
    前言提到,在过去两天的教程中,我们讲解了使用omicverse进行单细胞测序数据的质控以及归一化的一些思想。关于omicverse的使用文档与安装教程可以参考我们的readthedocs.就是,本系列教程是我带本科生所用到的,所以概念会尽可能地通俗,详细,但对于急于求成的人,可能不是一个很好的教程。1
  • 2024-06-20单细胞分析最好的教程(一):质量控制
    目前,国内对于单细胞测序分析的教程五花八门,百花齐放,一个合适且准确的pipeline对于分析是很有价值的。2023年在NatRevGenet上发表的一篇论文Bestpracticesforsingle-cellanalysisacrossmodalities,详细介绍了单细胞最佳实践的流程。但是,其在国内的推广有两个不足:(一)全英文教
  • 2024-06-16课前准备-单细胞velocity分析(贝叶斯模型)
    作者,EvilGenius速率ProbabilisticmodelingofRNAvelocityDirectmodelingofrawsplicedandunsplicedreadcountMultipleuncertaintydiagnosticsanalysisandvisualizationsSynchronizedcelltimeestimationacrossgenesMultivariatedenoisedgeneexpress
  • 2023-11-22学习mongo和go
    mongo:moduleData,ok:=result.Lookup("context1","context2").DocumentOK() result.Lookup("context1","context2") 用于检索名为"content1"的字段,并且该字段的值又是一个嵌套的文档,我们希望进一步获取其中名为"content2"的字段。.Docum
  • 2023-07-06scanpy 去批次pipeline
    1.脚本主要内容*批量读取下机数据*计算双细胞比例*BBKNN去除批次效应*去除细胞周期的影响*转换为seurat对象2.脚本点击查看代码importscanpyasscimportanndataasanimportpandasaspdimportnumpyasnpimportmatplotlibasmplimport
  • 2023-07-03hotspot
    点击查看代码importargparseimportscanpyasscimporthotspotimportnumpyasnpimportmplscienceimportmatplotlibimportmatplotlib.pyplotaspltimportpdbdefParserInput():parser=argparse.ArgumentParser(description='hotspot.space')
  • 2023-04-16CytoTRACE推测细胞分化状态
    <生信交流与合作请关注公众~号@生信探索>python环境CytoTRACE的iCytoTRACE函数需要调用python去除批次效应,因此需要先设置好python环境mambacreate-nSC&&mambaactivateSCmambainstall-y-cconda-forgepython=3.10notebookipywidgetspandasnumpyseabornmatpl
  • 2023-02-12单细胞转录组实战04: infercnvpy识别恶性细胞
    Infercnvisascalablepythonlibrarytoinfercopynumbervariation(CNV)eventsfromsinglecelltranscriptomicsdata.Inputdataadata.X数据需要标准化和lo
  • 2023-02-10单细胞转录组实战03: 使用celltypist注释细胞
    上一步得到了质控和整合后的数据,这一步需要聚类分群和细胞注释frompathlibimportPathimportrefromioimportStringIOimportmatplotlib.pyplotaspltimportn
  • 2022-12-15Post-GWAS: single-cell disease relevance score (scDRS) 分析
    1、scDRS的计算原理如下所示:图片来源:ZhangMJ,HouK,DeyKK,etal.Polygenicenrichmentdistinguishesdiseaseassociationsofindividualcellsinsingle-ce
  • 2022-10-27单细胞测序数据分析流程与去批次效应总结
    最近在实习,第一个工作是这个,现在这里记录一些随笔,之后会系统总结不同方法的其他流程部分怎么分析可以看20年综述怎么处理这部分。答:   对于Seurat2、Harmony、MNN
  • 2022-10-20如何将一个h5ad文件内部添加一个csv文件作为属性obsm
    问题展开学习生物信息的时候发现,需要将一个M*N的csv文件作为anndata文件的.X部分,一个M*2的csv文件作为anndata文件的空间位置信息标识。首先先读M*N的文件mydata=