搜库过程是理论谱图和实际谱图的匹配过程
本期继续介绍蛋白质组学搜库软件之 MaxQuant
1.参考文献
The MaxQuant computational platform for mass spectrometry–based shotgun proteomics (值得细细的阅读)
2.推荐理由
Free and easy
3.简介
- MaxQuant是基于质谱(Ms)的蛋白质组学数据分析最常用的平台之一,目前认可度相对较高,可针对多种质谱数据。拥有自己的肽段搜索引擎- Andromeda。对于碰撞诱导离解(CID)、高能碰撞离解(HCD)和电子转移离解(ETD)所产生的串联光谱可以很容易地用MaxQuant进行分析。针对每种方法,采用自定义的多级评分方案,对每种特定的碎片化技术的多肽鉴定进行优化。MaxQuant使用target-decoy搜索策略以估计和控制假阳性。
a) 原理
- 1 Controlling FDRs 控制假阳性: 从复杂的自底向上的蛋白质组学实验中得到可靠的蛋白质鉴定需要严格的统计分析和对错误鉴定的严格控制。
- 关键点:target-decoy 反向数据库
- 方法:
- 采用相同的条件检索反相数据库,或者将两个数据库合并检索,用来模拟随机匹配的过程。FDR=decoy/target 调整阈值,使FDR在1%以内。
- 将原数据库(target database)中的所有蛋白序列逐条反转,或随机打乱顺序, 得到 反相数据库 (decoy database)
- 反相数据库 (decoy database) 中的蛋白数目,长度,酶切后获得的多肽的数目,氨基酸组成均与原数据库相同。
- 与原始数据库不同的是,这些多肽序列是虚构的,不可能在样品中存在
- 判断
b) 质控参数:
- Andromeda score :理论谱图与实际谱图的匹配程度。
- PSM : 肽谱匹配,也就是被软件认为实际谱图与理论谱图可以匹配上的那些谱图
- PEP:是一张匹配谱的被错误的匹配的概率
- PSM FDR :以 target-decoy 控制假阳性的原理为基础,在PSM水平监测假阳性,PSM FDR 在 1%以内。
- Protein groups :有些蛋白质非常相似,在MaxQuant中,为了避免蛋白质水平上的识别计数过高,并使定量信息明确。通常这些蛋白含有特定蛋白的异构体,也可能是来自不同基因座的同源蛋白质。这个蛋白被归为Protein groups
- Razor peptides :某一个肽段是存在于多个protein group 中。这种肽被分配具有较多得分的protein group上。肽只能对这个protein group的得分做出贡献,确保光谱不被用于多个protein group使用。
c) 定量参数
- Peptide intensity: 每一个肽段的相对丰度,也就是相对含量,可以理解为含量或者丰度,值越大,丰度越高。
- Protein intensity :对于 Protein groups,是该group 内所有肽段强度(Peptide intensity)的总和
- Protein ratio :在标记定量中出现,指感兴趣的蛋白的所有肽段的同位素丰度比值的中位数。
- LFQ intensity :LFQ intensity 非标定量 所得的蛋白的相对丰度
- iBAQ protein intensity :某一个蛋白所鉴定的所有肽段丰度的总和 除以这一蛋白中 肽段的数量
- 定量策略,根据样本和样本之间,载同一洗脱时间里的平行丰度计算定量值
d) . 搜库标准化流程
- 添加样本
- 添加实验设计信息
- 设置参数(质控等)
- 选择消化酶,设置漏切
- 选择修饰
- 如果是无标定量选择LFQ
- 添加数据库
- 开始搜库