组装整合 salmon 定量结果

前言

在转录组分析的过程中在使用 salmon 转录本定量的后的结果一般是一个样本一个结果，但后续需要进行差异分析的时候需要的是整合所有的样本的基因表达量矩阵。

下面是我初步处理后的 salmon 文件结构：

需要对 *.salmon.gene.count.tab 进行处理

下面是取自 AL_N_3.salmon.gene.count.tab 的部分内容

Name	AL_N_3
ENSB:ZIylNmwJIYiC6LP	192
ENSB:HqOAmBAR83g0PLg	138
ENSB:ERheWX891cGy65u	0
ENSB:raa7hF97OToBe8J	56
ENSB:u45AeqxTVafqDib	128
ENSB:OStRz_ugGCnhpRm	1755
ENSB:g5esewjaDF2sjFP	486

代码针对上面描述的文件目录进行处理。

代码

import pandas as pd
import os

metadata = pd.read_csv('metadata.txt', sep = '\t')

id_list = metadata['SampleID'].tolist()

# 初始化一个列表来保存所有的数据框
dfs = []

# 需要读取id列表中的所有文件夹中的.salmon.gene.count.tab结尾的文件并将他们全连接merge

# 读取每个文件并加入到列表中
for sample_id in id_list:
    file_path = os.path.join(sample_id, f"{sample_id}.salmon.gene.count.tab")
    if os.path.exists(file_path):
        df = pd.read_csv(file_path, sep='\t')
        dfs.append(df)
    else:
        print(f"File {file_path} does not exist!")

# 检查是否读取了数据框
if dfs:
    # 用第一个数据框作为基础开始合并
    merged_df = dfs[0]

    # 与其他数据框进行合并
    for df in dfs[1:]:
        merged_df = pd.merge(merged_df, df, on=merged_df.columns[0])

# 保存合并后的数据框
merged_df.to_csv("merged_output.csv", index=False, sep='\t')

标签：定量,df,组装,salmon,ENSB,path,id,merged
From： https://www.cnblogs.com/honeyShi/p/17755856.html

centos7中组装软件 MaSuRCA 的安装
001、下载最新安装包下载地址：https://github.com/alekseyzimin/masurca/releases 002、解压，进入安装目录tar-xzvfMaSuRCA-4.1.0.tar.gzcdMaSuRCA-4.1.0/ 003、安装依赖(base)[root@pc1MaSuRCA-4.1.0]#yum-yinstallboostboost-develgcc-c++.x86_64gp......
工业显示器原装屏和组装翻新屏的鉴别方法分享
工业显示器现在已经很常见，它被广泛应用于智能制造、智慧安防、城市交通、医疗、商业金融、人工智能、物联网等各行各业，对国民经济特别是工业经济的发展起到非常积极的促进作用，我们日常生活中都深受其发展而得到诸多方面的便利。工业显示器由液晶显示屏、功能主板、外壳三......
《安富莱嵌入式周报》第312期：开源磁场照相机，仿生神经元PCB，开源无线耳机，手机系统PalmOS
更新一期视频教程：BSP视频教程第26期：CAN/CANFD/CANopen专题，CANFD整个运行机制精讲，图文并茂，配合综合实战演练（2023-05-15）视频版：https://www.bilibili.com/video/BV1zL41167Ti 1、基于开放系统组装协议OSAP实现的简化硬件设计项目软件开源：https://github.com/modular-things/modular-t......
直线导轨中高组装和低组装有什么不同？
直线导轨组合高度类型首要有高组装型和低组装型这2类，顾名思义，高组装型的组合高度(滑轨的底面到滑块的顶面)要高一些，而低组装型要低一些，视规范大小差异在2~7mm之间，造成这个差异的原因是滑块高度规范不同，一般与滑轨无关。高组装直线导轨是一种四列式单圆弧齿形接触直线导轨，也是一种结......
易基因：De novo组装和转录组表征：东方田鼠原发性卵巢癌机制新见解｜项目文章
大家好，这里是专注表观组学十余年，领跑多组学科研服务的易基因。2022年，中南大学湘雅医学院周智君教授团队在MolMedRep发表了题为" Denovoassemblyandtranscriptomecharacterization:NovelinsightsintothemechanismsofprimaryovariancancerinMicrotusfortis......
IPC-7093A-CN 中文 2020底部端子元器件（BTCs）设计和组装工艺的实施
IPC-7093A标准为实施底部端子元器件(BTCs)提供了基本的设计和组装指南。具体而言，IPC-7093A提供了与BTCs相关的关键设计、材料、组装、检查、维修、质量和可靠性问题的指南。https://pan.baidu.com/s/1Xs3iAvQa_HmhefazZb_3fwhttps://share.weiyun.com/94N9Vxcd 底部端子......
树莓派二驱动智能小车组装
复现up主：杨坤树莓派爱好者基地的https://www.bilibili.com/video/BV1pW411J7WG?vd_source=7f1982c56a437c7b00c3695687b7086d树莓派小车，稍微调整了一下连接的方式，做成后发现跟自己最终要实现的目标效果有很大的偏差，所以打算升级车型，但是这个形状的小车的已经做出来了，不记录一下有......
基因组组装质量的评价
001、。 reference祝光涛,黄三文.360度群体遗传变异扫描——大豆泛基因组研究[J].[2023-08-16].DOI:10.11983/CBB20096.......
基因组组装技术的发展
001、注：01、Pacific Bio-sciences(PacBio)和OxfordNanopore)：长片段单分子测序技术02、BioNanogenomemapping：辅助组装技术03、High-throughputchromosomeconformationcapture(Hi-C)：高通量染色体构象捕获04、ONT：OxfordNanoporeTechnology refere......
三代测序数据从碱基识别、基因组组装、变异检测和甲基化修饰检测等方面的内容
王院长的报告涵盖了针对三代测序数据从碱基识别、基因组组装、变异检测和甲基化修饰检测等方面的内容。在基因组组装算法方面，王院长分享了其团队在二代和三代测序数据基因组组装算法设计与分析方面的成果和突破。其中，针对长读长测序的高错误率以及错误分布不均匀等问题，王院长介绍......

组装整合 salmon 定量结果

组装整合 salmon 定量结果

前言

代码

相关文章

赞助商

阅读排行