首页 > 其他分享 >消融实验

消融实验

时间:2025-01-04 20:33:56浏览次数:1  
标签:嵌入 模型 消融 实验 模块 移除 残基

这个表格展示了 Igformer 模型在不同消融实验条件下的性能变化。消融实验的核心在于移除或修改模型的某些关键组件,观察其对模型性能的影响,以评估这些组件的重要性。

表格消融项解释:

  1. - Residue-level only
    移除内容:移除了原子级嵌入,仅保留残基级别嵌入
    解释:Igformer 的嵌入包括两层次的特征表示:残基级和原子级。消融原子级嵌入意味着模型不再使用更精细的原子信息,仅依赖较粗略的残基表示。
    影响:模型在生成和对接任务中的性能下降,表明原子级嵌入对提升精度至关重要。

  2. - Atom embeddings
    移除内容:移除了所有原子嵌入,只保留残基位置嵌入
    解释:这个实验进一步剥离了模型的细粒度原子特征,使模型仅依赖残基的类型和位置嵌入。
    影响:性能大幅下降,说明原子嵌入在提升结构预测和对接任务方面起到了重要作用。

  3. - Triangle passing
    移除内容:移除了三角消息传递模块 (Triangle Message Passing Module)
    解释:三角消息传递模块是模型用于捕捉残基与其他残基之间关系的重要组件。它通过三角几何关系来增强模型的特征传递和交互建模能力。消融这个模块后,模型无法有效学习复杂的残基交互。
    影响:模型对局部和全局结构的预测精度下降,表明三角模块在建模配体和抗体残基关系方面至关重要。


其他消融项解释:

  1. - Axial attention
    移除内容:移除了轴向注意力机制 (Axial Attention Module)
    解释:轴向注意力负责沿不同轴(如行和列)对模型输入进行注意力计算,帮助模型学习全局特征。移除后,模型无法有效捕捉序列间的长程依赖。
    影响:性能略有下降,说明轴向注意力在全局特征捕捉方面起到一定作用。

  2. - APPNP
    移除内容:移除了APPNP (Approximate Personalized Propagation of Neural Predictions) 模块。
    解释:APPNP 负责将局部嵌入传播到全局,同时保留初始嵌入,确保信息在模型中均匀传播。
    影响:移除后,模型的 DockQ 和 RMSD 表现下降,表明 APPNP 在局部和全局特征融合方面非常重要。

  3. - SGFormer
    移除内容:移除了SGFormer 自注意力机制
    解释:SGFormer 允许模型动态计算残基之间的重要性,帮助模型学习复杂残基交互。
    影响:移除后模型性能下降,证明 SGFormer 对提升模型复杂关系建模起到了积极作用。

  4. - Graph separation
    移除内容:合并了内部图 (Intra-graph)外部图 (Inter-graph),不再分离抗体内部和抗原-抗体交互的学习过程。
    解释:Igformer 采用分离图结构分别学习抗体内部和抗体-抗原间的交互。此消融实验验证了分离图与合并图的性能差异。
    影响:模型性能下降,说明分离图机制对抗原-抗体交互建模有积极作用。


结论:

  • 消融实验验证了 原子级嵌入三角消息传递多层交互机制对模型性能的关键作用。
  • 表格中的每个消融项对应 Igformer 模型不同模块的移除或修改,实验结果表明,这些模块在提升抗体生成与对接精度方面不可或缺。

其他可参考的地方

在这个表格中,我们进行了多种消融实验,以评估 Igformer 模型中不同组件对模型性能的影响。消融实验的目标是通过移除或替代关键模块,观察模型在抗体-抗原复合物预测和抗体设计任务中的表现变化,找出哪些模块对最终性能至关重要。

1. 实验任务与指标

  • 任务1:CDR-H3 设计 – 生成抗体的重链第三互补决定区(CDR-H3),这是决定抗体特异性和亲和力的重要部分。
  • 任务2:复合结构预测 – 预测抗体和抗原复合物的三维结构。

实验指标

  • AAR (Amino Acid Recovery, 氨基酸恢复率, %):生成的氨基酸序列与真实序列的匹配度,越高越好。
  • TMscore (Template Modeling score):评估模型预测结构与真实结构的相似性,越接近1表示结构预测越准确。
  • lDDT (Local Distance Difference Test):用于测量局部结构的精度,值越高表示预测模型在局部原子级结构上的表现越好。
  • CAAR (Correctly Aligned Antibody Residues, %):正确对齐的抗体残基比例,越高表示更准确的抗体对接。
  • RMSD (Root Mean Square Deviation):预测结构与真实结构之间的均方根偏差,越低表示预测精度越高。
  • DockQ:用于量化分子对接结果的评分,综合考虑对接精度、界面接触和原子间距离,越高表示对接质量越好。

2. 消融实验内容

1. 残基和原子级嵌入

  • 实验目的:分析模型在仅使用残基级嵌入或同时结合原子级嵌入时的表现差异。
  • 消融方法
    • 移除原子级嵌入,仅保留残基级嵌入,以观察模型对更精细原子级信息的依赖性。
    • 移除位置嵌入或原子位置嵌入,以检查坐标信息对最终预测精度的影响。
    • 结果:移除原子级嵌入后,模型在生成任务和对接任务中的性能下降,说明原子级信息在提升精度方面发挥了重要作用。

2. 三角消息传递模块 (Triangle Message Passing)

  • 实验目的:验证三角消息传递模块在建模配体和抗体残基关系中的重要性。
  • 消融方法
    • 移除三角消息传递模块,仅保留轴向注意力机制
    • 用简单的多层感知机 (MLP) 或其他基本聚合方法替代三角消息传递模块。
    • 分别消融 outgoing 和 ingoing 方向的三角模块,评估单个方向的贡献。
    • 结果:移除该模块导致 lDDT 和 DockQ 下降,说明三角消息传递在捕获残基-残基相互作用方面至关重要。

3. 轴向注意力模块 (Axial Attention)

  • 实验目的:评估轴向注意力在捕捉全局特征中的作用。
  • 消融方法
    • 移除轴向注意力,仅保留三角消息传递模块
    • 将轴向注意力替换为多头自注意力机制 (Multi-head Self-attention),比较模型性能差异。
    • 结果:消融轴向注意力后,模型在生成和复合结构预测任务中表现略有下降,说明轴向注意力在整合全局信息方面有一定作用。

4. APPNP 和 SGFormer 组件

  • 实验目的:分析局部和全局信息传播机制(APPNP 和 SGFormer)在模型中的重要性。
  • 消融方法
    • 分别移除 APPNP 或 SGFormer,仅保留其中一个组件,观察局部或全局信息传播的重要性。
    • 用 GCN (Graph Convolutional Network) 或 GAT (Graph Attention Network) 替换 SGFormer,以验证 SGFormer 的有效性。
    • 结果:移除 APPNP 或 SGFormer 后,DockQ 和 RMSD 表现下降,说明两个模块互补,缺一不可。

5. 内部图 (Intra-graph) 和外部图 (Inter-graph) 分离机制

  • 实验目的:分析分离抗体内部交互和抗原-抗体交互图的必要性。
  • 消融方法
    • 合并 Intra-graph 和 Inter-graph,使用一个联合图进行学习,比较模型效果。
    • 在 Intra-graph 和 Inter-graph 之间共享坐标,不分开更新,分析空间信息分离的重要性。
    • 结果:合并图后,模型对抗体与抗原的对接精度有所下降,说明分离机制可以更有效地捕捉不同层次的信息交互。

3. 消融实验结果分析

  • 消融实验结果表明,每个模块都对模型最终性能有一定贡献。尤其是:
    • 原子级嵌入和位置嵌入 对 lDDT 和 DockQ 的提升至关重要,表明更细粒度的特征对抗体结构预测精度有显著影响。
    • 三角消息传递模块 是提升模型捕捉残基关系和配体交互的关键,缺失后模型性能明显下降。
    • APPNP 和 SGFormer 组合使用 提供了全局和局部的信息传播机制,二者缺一不可。
    • 分离内部图与外部图 的方法有效提高了抗原-抗体对接精度,验证了不同层次关系建模的重要性。

这些消融实验为模型设计提供了深入的洞察,并明确了 Igformer 模型中各组件的必要性和独特作用。

标签:嵌入,模型,消融,实验,模块,移除,残基
From: https://www.cnblogs.com/GraphL/p/18652372

相关文章

  • Transformer学习与基础实验1——注意力机制
    前置概念    自然语言处理(NLP)中,根据任务内容的不同,句子、段落等文本中需要更加关注的部分(不同的词语、句子等)也会不同。    在判断词在句子中的重要性时便使用了注意力机制,可以通过注意力分数来表达某个词在句子中的重要性,分数越高,说明该词对完成该任务的重......
  • Linux实验报告10-作业管理
    目录一:实验目的二:实验内容(1)启动两个vim编辑器在后台执行,然后查看当前有哪些作业正在执行。(2)打开ls命令的帮助手册后,先暂停执行,再转出到前台重新执行,最后退出手册。 (3)利用at命令向系统所有用户在当前时间之后的3分钟广播“hello"信息。 (4)请定制如下一次性......
  • Linux实验报告14-Linux内存管理实验
    目录一:实验目的二:实验内容1、编辑模块的源代码mm_viraddr.c2、编译模块 3、编写测试程序mm_test.c 4、编译测试程序mm_test.c  5、在后台运行mm_test6、验证mm_viraddr模块一:实验目的(1)掌握内核空间、用户空间,虚拟地址空间的概念;(2)掌握linux内核中内存管理......
  • 微机原理与接口技术——期末笔记 实验总结 侧重Win32汇编代码实现
    微机原理与接口技术声明:本篇文章是在复习期末考试的过程中根据教材与实验所总结的复习资料,参考书目为*《微机原理与接口技术(第2版)——Win汇编、接口及设备驱动》郭兰英赵祥模编著*。文章只重点总结了前两章、第五章、五大芯片、键盘、AD转换的具体代码示例。所有代码均来......
  • (免费源码)计算机毕业设计必学必看 万套实战教程 java、python、php、node.js、c#、APP
    摘要信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题。针对高校课程实验系统等问题,对面向过程性考核的高校课程实验系统进行研究分析,然后开发设计出面向过......
  • 中国海洋大学-软件工程理论基础coq实验2
    软件工程理论基础实验2:Coq中的命题和证明实验目的学习Coq中命题和证明的表示方法以及证明方法。实验内容根据课件及给定Coq文件(CoqCode2.v)学习Coq中命题和证明的表示方法及证明方法。掌握intros,apply等证明策略的使用方法。学会在Coq中对命题进行定义和声明及证明命题......
  • MySQL综合实验 图书管理系统
    目录第一章题目第二章整体思路与数据库设计2.1功能与数据表的对应关系2.2表之间的主外键关系2.3完整性及约束设计2.4数据库对象设计第三章数据库和数据表的创建3.1创建数据库3.2创建登陆表(user_login)3.3创建图书信息表(book_info)3.4创建读者信息......
  • ShellShock 攻击实验
    ShellShock攻击实验实验简介2014年9月24日,Bash中发现了一个严重漏洞shellshock,该漏洞可用于许多系统,并且既可以远程也可以在本地触发。在本实验中,学生需要亲手重现攻击来理解该漏洞,并回答一些问题。预备知识什么是ShellShock?Shellshock,又称Bashdoor,是在Unix中广泛使用的Bash......
  • 《DNK210使用指南 -CanMV版 V1.0》第四十八章 自学习分类实验
    第四十八章自学习分类实验1)实验平台:正点原子DNK210开发板2)章节摘自【正点原子】DNK210使用指南-CanMV版V1.03)购买链接:https://detail.tmall.com/item.htm?&id=7828013987504)全套实验源码+手册+视频下载地址:http://www.openedv.com/docs/boards/k210/ATK-DNK210.html5)正点......
  • 用仓颉完成编译原理实验-消除左递归和左公共因子,求FIRST集和FOLLOW集
    目录实验目的实验内容实现消去上下文无关文法中所有左递归的算法实现从上下文无关文法中提取左公共因子的算法实现求解上下文无关文法的FIRST集和FOLLOW集的算法设计方案与算法描述设计文法的数据结构实现消去上下文无关文法中所有左递归的算法实现从上下文无关文法中......