首页 > 其他分享 >空间组学邻域分析方法更新之BANKSY

空间组学邻域分析方法更新之BANKSY

时间:2024-05-29 09:30:05浏览次数:29  
标签:组学 邻域 矩阵 BANKSY 转录 单细胞 空间 突变

作者,Evil Genius
最近分享了一些关于多组学的内容,其实就有人问我单细胞的数据能call snp么?这个问题的答案是看情况,我们都知道单细胞数据的捕获原理,那么3‘数据是几乎不能call snp的,唯有5'在某些情况下是可以的,例如前面分享的KRAS的G12D突变,就在单细胞5’数据的测序范围之内,就可以检测到,超出98bp的突变则无法检测。但是大家也要明白,突变通常是在外显子(WES)数据中分析的,是基因组,所以一般会补充WES的突变数据,转录组全长在检测融合的时候有优势,所以大家单细胞想研究突变就看运气了,如果肿瘤刚好有一些靶向突变位于5‘测序范围内,那就相当于多了一个组学,发的文章又能提高10分了。
这个地方10X建库的时候有人选择不打断,而是测转录组的全长,但是这样的话一般需要三代测序,错误率太高,虽然可以同时检测转录组、融合、突变、和基因多态性,但几乎还是没人做这个,成本也非常高。
好了,今天补充一个好的分析内容,关于空间生态位分析的BANKSY,其实之前分享过,文章在
空间转录组数据分析之生态位聚类(Banksy)
空间系列的视频也讲过,链接在空转第十一课空间污染spotclean和生态位基因模块banksy,但是这个方法直到2024年2月27日才见刊,发表于Nature Genetics,IF 30.8分,往往这些厉害的分析软件都是国外人或者团队开发的,国内的人要加油啦。
软件目标:使研究人员能够更深入地理解细胞间的相互作用和组织构造。
该算法作为一种创新的空间组学数据分析工具,其主要功能是将空间组学数据中的细胞根据类型和组织域进行有效分类。通过结合细胞自身的转录组数据和其在微环境中的空间关系,有效地提高了细胞分类的准确性和效率。
我们看一下下面的示意图:

BANKSY’s neighborhood-based feature augmentation strategy for clustering

大家还记得我上课说起的空间三大矩阵么?
  • 分子矩阵 gene X Barcode,就是直接拿到的空间矩阵
  • 细胞矩阵 celltype X Barcode(单细胞空间联合分析后的矩阵)
  • 生态位表达矩阵 gene(每个位点环境中的表达信息) X Barocde
其中BANKSY的方法就是为了我们的生态位表达矩阵专门开发的。
这里要补充第四个矩阵,那就是空间邻域细胞矩阵,celltype X Barcode。
很明显,空间聚类要有邻域基因表达的信息。
另外,这个方法实现了对不同样本相同细胞类型的生态位基因表达差异的分析,这也是分析空间微环境最重要的一环。
BANKSY is a method for clustering spatial omics data by augmenting the features of each cell with both an average of the features of its spatial neighbors along with neighborhood feature gradients(这里面已经很明显说明问题了)。
其实这个平台原本是为了10X的Xenium开发的,因为Xenium是可以做到的空间单细胞级别的。
但是这个软件几乎完美契合了寻因的空间平台,因为寻因平台的抽核原理,理论上是可以真正达到空间单细胞级别的,这样的话,空间四大矩阵,都可以完美的拿到了,就看寻因给不给力了。
简单看一些示例

这个软件真的是生态分析的一把利器,专门为了高精度平台开发的,华大的、10X HD都可以很好的运用。
高精度平台华大出来的最早,要是这个方法是华大开发的就好了。
代码之前分享过了,在空间转录组数据分析之生态位聚类(Banksy)
官网示例在Spatial transcriptomic clustering • Banksy
生活很好,有你更好

标签:组学,邻域,矩阵,BANKSY,转录,单细胞,空间,突变
From: https://blog.csdn.net/weixin_53637133/article/details/139283811

相关文章

  • 树上求一个点邻域信息的一种简单求法
    有人说,直接点分树,力大砖飞,非常不错!实际上这种做法非常的垃圾,很多时候我们使用点分树,一定是不得不使用点分树,比如模板题,强制在线,非常的恶心,所以我们使用点分树。而点分树是否必要呢?既然你能看到这篇blog,他肯定是不必要的!我们今天来发掘dsuontree的美妙性质,让他求解这个问题!然......
  • 39.C语言数组学习的有关整理
    首先还是关于这两个东西sizeof()用于计算所占空间大小strlen()只用于求字符串长度/***sizeof计算所占空间大小\0也会计算*strlen只能用来求字符串长度直到找到字符串结束标志\0**/chararr1[]={'a','b','c'};//abcchararr2[]="abc";//abc\0......
  • 后缀数组学习笔记
    定义后缀数组是什么?(下文用\(Suf_S[i]\)表示\(S[i,i+1,\cdots,|S|]\),对\(Suf_T\)同理。并用\(S[l,r]\)表示\(S[l,l+1,\cdots,r]\),对\(T[l,r]\)同理)后缀数组包含两个数组\(rk,sa\)。\(rk[i]\)表示后缀\(Suf_S[i]\)排序后的排名。\(sa[i]\)表示排......
  • 后缀数组学习笔记
    定义后缀从字符串某个位置i到字符串末尾的子串,定义s的第i个字符为第一个元素的后缀为suf(i)。后缀数组把s的每一个后缀按照字典序排序,后缀数组sa[i]表示排名为i的后缀的起始位置的下标。rk[i]数组代表起始位置为i的后缀的排名。rk[]和sa[]是一一对应关系,互为逆运算,可以相互......
  • 使用机器学习进行多组学分析的 3+2 个挑战(2024年3月30日组会报告)
    利用机器学习进行多组学数据分析使用机器学习进行多组学分析的3+2个挑战3.1异质性、稀疏性和异常值来自不同高通量来源的多组学数据通常是异构的(Bersanellietal.,2016)。例如,转录组学和蛋白质组学在组学分析之前使用不同的标准化和缩放技术。这导致不同的动态范围和数据分......
  • 【进阶五】Python实现SDVRP(需求拆分)常见求解算法——自适应大邻域算法(ALNS)
    基于python语言,采用经典自适应大邻域算法(ALNS)对需求拆分车辆路径规划问题(SDVRP)进行求解。目录往期优质资源1.适用场景2.代码调整3.求解结果4.代码片段参考往期优质资源经过一年多的创作,目前已经成熟的代码列举如下,如有需求可私信联系,表明需要的问题与算法......
  • 后缀数组学习笔记(未完成
    后缀数组定义与实现定义后缀从字符串某个位置i到字符串末尾的子串,定义s的第i个字符为第一个元素的后缀为suf(i)。后缀数组把s的每一个后缀按照字典序排序,后缀数组sa[i]表示排名为i的后缀的起始位置的下标。rk[i]数组代表起始位置为i的后缀的排名。rk[]和sa[]是一一对应关系......
  • 后缀数组学习笔记
    后缀数组学习笔记定义所谓后缀,指的是对于一个字符串\(s\),如果它的下标从\(1\)到\(n\),那么对于\(s\)的一个后缀\(i=s[i\dotsn]\)。所谓后缀数组sa[],就是按照这些后缀的字典序排序后得到的数组。更具体的,后缀数组sa[i]中存储的是字符串\(s\)中排名为\(i\)的后缀的......
  • 树状数组学习笔记
    目录原理(结构)建树应用单点修改,区间求和区间修改,单点求值区间修改,区间求和单点修改,区间求最值求逆序对个数二维树状数组trick:树状数组上倍增权值树状数组正文1.原理引用日报图片。设黑色框内数组为\(a_1\toa_8\).可以推得\(c_i=a_......
  • 后缀数组学习笔记 应用篇
    一些后缀数组的应用。利用\(sa\)和\(rk\)数组这类题目通常需要发掘一些性质,转化为求串的字典序最小/大后缀或长度固定的子串。P3809【模板】后缀排序后缀数组板子。P6095[JSOI2015]串分割二分答案串的排名。CF1923FShrink-Reverse转化为求长度为\(len\)的字典......