首页 > 其他分享 >单细胞数据 存储方式汇总

单细胞数据 存储方式汇总

时间:2024-09-19 17:47:08浏览次数:1  
标签:存储 matrix 汇总 gz 单细胞 tsv Gene Expression mtx

(单细胞下游分析——不同类型的数据读入,与部分数据类型的转化)

.h5ad(anndata 数据格式)

10x_mtx(cell ranger输出,三个文件)

就是cell ranger上游比对分析产生的3个文件:
├── xxx_feature_bc_matrix
│ ├── barcodes.tsv.gz:细胞标签(barcode)
│ ├── features.tsv.gz:基因ID(feature)
│ └── matrix.mtx.gz:表达数据(matrix)

具体文件格式如下:

>barcodes.tsv.gz
AAACCCAAGAAACCCA-1
AAACCCAAGAAAGTCT-1
AAACCCAAGAAATTGC-1
AAACCCAAGAACAAGG-1

============
>features.tsv.gz
ENSG00000243485	MIR1302-2HG	Gene Expression
ENSG00000237613	FAM138A	Gene Expression
ENSG00000186092	OR4F5	Gene Expression
ENSG00000238009	AL627309.1	Gene Expression

============
>matrix.mtx.gz
%%MatrixMarket matrix coordinate integer general
%metadata_json: {"software_version": "Cell Ranger cellranger-8.0.1", "format_version": 2}
36601 643092 12843054
19846 1 1
8208 2 1
31505 3 1
22399 4 1

一般先使用read10X()对这三个文件进行整合,得到行为基因、列为细胞的表达矩阵(为稀疏矩阵dgCMatrix格式,节约内存);然后再配合CreateSeuratObject()函数创建Seurat对象

counts.matrix.tsv.gz(一个文件)

counts.matrix.tsv.gz格式的文件里面包含了转成10x_mtx 格式的所有信息:
image

  • 第一行是条形码(基因序列)(barcodes.tsv.gz)
  • 第一列是基因(features.tsv.gz)
  • 其余就是0/1矩阵(reads 计数)(matrix.mtx.gz)

标签:存储,matrix,汇总,gz,单细胞,tsv,Gene,Expression,mtx
From: https://www.cnblogs.com/kingwz/p/18421064

相关文章

  • 支持 128TB 超大存储,GaussDB (for MySQL) 如何轻松应对海量数据挑战
    本文分享自华为云社区《【选择GaussDB(forMySQL)的十大理由】之二:128TB超大存储》,作者:GaussDB数据库。大数据时代的挑战随着互联网、大数据等行业的迅猛发展,企业的数据流量呈现爆炸式增长,数据库作为数据存储的核心,其承载的数据量越来越大。近十年,企业数据量从GB发展到TB,甚......
  • 分布式存储技术如何强化企业数字化转型的可靠性与速度?附技术原理及特点
    在信息化、数字化和智能化快速发展的今天,数据已经成为推动经济社会发展的重要资源。随着5G、云计算、大数据、人工智能等技术的不断进步,数据量呈现爆炸式增长。与此同时,企业对数据的需求也日益增加,无论是用于业务分析、决策支持还是创新服务,数据都是不可或缺的。然而数据的快速增长......
  • 解决 AI 算法开发和存储难题,华为云 DTSE 助力文华云技术架构升级
    本文分享自华为云社区《文华云全面技术架构升级,引领智慧教育新未来》,作者:HuaweiCloudDeveloper。本文介绍了华为云DTSE通过AI开发平台ModelArts助力四川文华云教育类应用系统改造上云的案例,DTSE帮助文华云完成了技术架构的全面优化升级,为其在智慧教育领域的数字化和智能化......
  • whiz学习资料汇总 - 终端命令行助手工具Whiz安装使用方法隐私贡献Github开源项目
    whiz学习资料汇总-终端命令行助手工具whiz是一个基于人工智能的终端命令行助手工具,可以帮助用户更高效地使用命令行。本文汇总了whiz的相关学习资料,帮助读者快速上手和深入了解这个强大的工具。1.安装方法可以通过npm安装whiz:npminstall-gwhiz_cli安装完成后,......
  • 支持128TB超大存储,GaussDB(for MySQL)如何轻松应对海量数据挑战
    摘要:华为云数据库GaussDB(forMySQL)基于华为最新一代DFV存储,采用计算存储分离架构,最多支持128TB的海量存储。本文分享自华为云社区《【选择GaussDB(forMySQL)的十大理由】之二:128TB超大存储》,作者:GaussDB数据库。大数据时代的挑战随着互联网、大数据等行业的迅猛发展,企业的数据......
  • EvalGPT学习资料汇总 - 基于大语言模型的代码解释器框架
    EvalGPT简介EvalGPT是一个基于大语言模型的代码解释器框架,它能够自动化代码编写和执行过程,为用户定义的任务提供精确结果。该框架利用GPT-4、CodeLlama和Claude2等先进的大语言模型,让用户只需描述任务,EvalGPT就能协助编写代码、执行代码并交付结果。核心特性自动化代码编......
  • DeepSeek-Free-API 学习资料汇总 - 免费接入DeepSeek大语言模型的API服务
    DeepSeek-Free-API学习资料汇总DeepSeek-Free-API是一个让开发者可以免费接入DeepSeek大语言模型的开源项目。本文将为大家介绍这个项目的相关学习资料,帮助开发者快速上手使用。项目简介DeepSeek-Free-API是由LLM-Red-Team开发的一个开源项目,它提供了一个API服务,......
  • 汇总区间
    给定一个有序的list,需要根据数据的连续性进行区间的汇总实例如下: 解决方法:设置左右指针,固定左指针,当右指针对应的数+1=右指针+1对应的数and 右指针不要越界,就移动右指针,直到跳出while,并更新左指针=右指针+1classSolution(object):defsummaryRange......
  • 【C1N短网址】短链接API接口汇总
    C1N短网址(c1n.cn)提供了多个短链接API接口,对于有开发能力的用户或者企业来说,简直是一大福音。只需进行简单的代码编辑,就能将稳定好用的短链接系统接入到自己的产品中,极大地降低了开发成本。接下来看看都有哪些接口吧~1、生成短链API调用这个接口,可以将原始链接轻松生成短......
  • 9月京东云云服务器CVM价格配置表汇总-金秋上云!
    轻量云主机是面向中小企业、开发者打造的预装精选软件、开箱即用的主机产品,快速搭建网站、电商、企业低代码工具箱,云盘、共享文档、知识库、开发测试环境等,相对普通云主机,按套餐购买更优惠、控制台可视化管理,运维更简单,提供更便捷上云体验。轻量云主机这个专区是本次活动的主要专区......