CellCharter 能够自动识别空间域,并提供一套用于集群表征和比较的方法。最近用它来做空间邻域分析还挺方便的。
算法流程:
1. 输入数据:包括mRNA或蛋白表达的特征矩阵及细胞/spot的空间坐标。
2. 降维和批次效应校正:利用变分自编码器(VAE)对特征矩阵进行降维,同时校正因技术或批次引起的效应。不同类型的组学数据采用专门设计的VAE模型处理。
3. 构建空间网络:基于空间邻近性为每个细胞/spot构建空间网络。
4. 特征聚合:对每个细胞/spot,将其自身的特征与其l邻域的特征(按距离逐层聚合)进行拼接,生成新的特征向量。
5. 聚类分析:使用高斯混合模型(GMM)对拼接后的特征向量进行聚类。通过Fowlkes-Mallows指数(FMI)评估每种聚类方案的稳定性,选择最稳定的聚类数。
6. 下游分析
• 簇特征:计算每个样本的簇比例及簇中特定细胞类型的富集情况。
• 簇邻域富集分析(Cluster NE):识别簇之间的空间相邻关系,包括对称和非对称富集关系。
• 簇形态学特征:测量簇的边界、面积、周长、主要和次要轴,计算弯曲度(curl)、拉长度(elongation)、线性度(linearity)和纯度(purity)。
优势:
1. 多样本间的空间域识别:
2. 可扩展性:能够处理包含数百万个细胞和数千个特征的大型数据集。
3. 兼容多种数据类型,包括 空间转录组学、蛋白质组学、表观遗传组学和多组学数据。
4. 最佳空间域数量候选:提供方法基于多次运行结果的稳定性,推荐多个最佳的空间域数量候选值。
5. 提供一系列工具,用于表征和比较空间域,包括域比例、细胞类型富集、(差异)邻域富集和域形状表征等
适用范围:
• 处理大规模空间组学数据(如多样本、多细胞类型)。
• 跨技术平台整合数据(成像 vs. 测序,单模态 vs. 多模态)。
• 研究细胞空间分布、簇的空间关系和形态学特征(如癌症微环境中的细胞群落)。
• 分析不同组织类型或病理条件下的簇分布和交互差异。
后续会分享具体用法!
参考文献:Nature Genetics volume 56, pages74–84 (2024)
标签:富集,组学,邻域,细胞,特征,空间,CellCharter,工具,生态 From: https://blog.csdn.net/qq_43022495/article/details/144660546