这篇文章是2023年AAAI会议上的一篇论文, 主要是利用分子图和 DDI 图嵌入来提供上下文感知信息,从而进行安全药物推荐。链接Context-Aware Safe Medication Recommendations with Molecular Graph and DDI Graph Embedding| Proceedings of the AAAI Conference on Artificial Intelligence
背景
药物分子结构和DDI是引导药物推荐任务的重要知识,医学概念嵌入已经被用于增强这些任务的表现。DDI的建模有利于药物推荐的安全性。
动机
现有模型仍然存在缺陷:
1)不能区分分子相似但功能不同的药物——将分子转化为图,不可避免地会导致信息丢失,因为相似的分子可能会转化为相同的图结构;
睾酮和雌二醇,为同分异构体,导致药物的功能不同。vanilla GNN对其编码会使得其具有几乎相同的表示,这可能会误导药物推荐模块将它们等同起来,并错误地将它们推荐给患者。
2) 不能正确捕获嵌入空间中药物之间的意外反应——利用传统的基于消息传递的图嵌入来模拟药物相互作用,它们直接或间接地应用了“传递性”特征。
作者认为,DDI 图当中这种传递性不适用,比如DDI并没有说明雌激素和甲状腺制剂具有相互作用,但是消息传递会使其连通认为具有相互作用,而实际上同时服用雌激素和甲状腺制剂是无害的。
应对策略
由于具有不同功能的药物在 EHR 中表现出不同的共现行为,因此正确利用每种药物的共现医学概念(构建药物-诊断, 药物-手术, 药物-药物共现矩阵, 并且对这些信息进行融合)作为其上下文信息有利于表示学习;
关闭“传递性”功能,采用改进的消息消除方法对 DDI 进行编码。
提出了 Carmen——基于图嵌入的 药物推荐(MR)框架,由四个部分组成,包括患者表示学习、上下文信息提取、上下文感知 GNN 和 DDI 编码。Carmen 将访问历史纳入分子图的表示学习中,以区分具有相似拓扑但不同活性的分子。DDI编码模块是专门为非传递交互DDI图设计的。
目标任务
药物推荐, 患者表征与学习到的药物表征做内积,然后经过sigmoid函数得到相似性分数进行推荐.
方法技术
GRU, GNN, 注意力机制
Carmen模型
符号说明
第一部分 患者表征学习
给定一个表示第t次访问的多热向量(dt, pt, mt)三元组,通过将嵌入矩阵Ed/Ep与原始多热向量d t /pt相乘,将dt /pt t转换为低维(l维)向量 。类似于医生总是参考患者的病史进行诊断的医疗场景,作者使用两个GRU来处理诊断序列和手术序列,依次获取诊断视图和过程视图的纵向信息。
第二部分 上下文信息提取
原始GNN
AGG函数收集 GNN 第 k 层的邻居信息,UPD函数用其相应的聚合邻域信息更新节点嵌入. 但是其对具有相似分子结构的药物的区分能力不足,导致药物表征固有缺陷。
由于不同的药物在EHR数据集中会表现出不同的共现行为,首先从训练集构建三个共现矩阵:药物-诊断共现矩阵,药物-手术共现矩阵,药物-药物共现矩阵。每个矩阵的行用L1范数归一化。
每种药物用 和进行初步表示,其中Cd, Cp可以认为是两种视图下的初步药物上下文表示,然后由将Cd与Cp拼接成共现信息。组合信息由Cmm = AmmCdp捕获,并由C = Cdp + tanh(Cdp·Ws)⊙Cmm与共现信息Cdp集成。(第二项相当于一个注意力机制, 用于自适应选择Cmm当中重要的特征)
第三部分 上下文感知GNN
由于现有方法受到GNN区分能力的限制,作者设计了一种新的分子图原子聚集形式,其中每个原子由其邻域信息和附加的图级药物上下文信息编码。将每个原子的邻域信息和药物Cm的上下文嵌入汇总,然后,将其与单个自连接表示结合,推导出原子v在第k层中的表示
为了将原子表示总结为图级药物表示,利用读出函数 R(·):
第四部分 DDI 编码
DDI图是无向图Gddi = (Vddi, Eddi),其中Vddi和Eddi分别表示其节点和边。每个节点表示一种药物,每个边表示两种药物之间存在DDI。对于DDI图,采用注意力机制进行聚合。由于DDI图中连接的药物实际上是相互排斥的,因此它们在低维嵌入空间中的表示应该相差很大。
最后将DDI嵌入模块学习到的药物嵌入与从药物分子结构图当中学习到的药物嵌入结合起来,便于推荐。
预测和目标函数
每种药物的匹配分数是患者表示和药物表示之间的相似度:
将药物推荐看作多标签分类任务, 采用二元交叉损失和多标签合页损失作为联合损失函数:
合页损失要求分类边界尽可能大。
实验
- 数据集:MIMIC-III、MIMC-IV
- baseline:
- LR、ECC、RETAIN、LEAP、GAMENet、SafeDrug
- Carmen w/o (context & ddi-enc) 即用最原始的GNN编码分子结构来表征药物
- Carmen w/ ddi-loss 使用SafeDrug里边的DDI损失
- Carmen w/ ddi-agg 使用传统消息传递来编码DDI
- Carmen w/o ddi-enc
- 评估指标:Jaccard相似性,F1分数,Precision-Recall AUC
- 结果表明 Carmen 及其变体始终优于基线。Carmen w/o ddi-enc 和 Carmen w/o (context & ddi-enc) 之间的比较表明,主要的性能增益来自于 GNN 前向过程中涉及的上下文信息。虽然 Carmen w/o (context & ddi-enc) 和 SafeDrug 都使用普通的 GNN 来编码分子,但它们的图编码器的设计细节明显不同,并且 SafeDrug 有一个额外的局部二分编码器。具体来说,节点的度数已被证明是编码图的判别信息 ,但在 SafeDrug 中被忽略。
- DDI编码保证了安全性. DDI知识可以通过两种方式包含,DDI编码 和 DDI损失。对于 DDI 损失,它对 Carmen 有微不足道的改进(Carmen w/ ddi-loss 与 Carmen w/o ddi-enc),对 GAMENet 显着升级,并且对 SafeDrug 几乎没有影响。原因是DDI知识不仅由分子决定,而且还隐含在医生开具的就诊记录中.
- SafeDrug 倾向于提出保守的建议来拟合 DDI 损失函数,但由于 DDI 知识并不总是与就诊记录一致,因此会影响准确性。
Carmen不推荐任何不安全的药物组合。相反,Carmen w/ ddi-loss 未能减少不安全的药物组合。同样,Carmen w/ ddi-agg 不能保证不推荐任何不利的 DDI。这些结果证明我们的 DDI 编码模块可以处理非传递 DDI 图的固有属性并捕获药物之间的关系以确保药物使用的安全性和可靠性,但不可避免地会降低准确性,因为某些 DDI 位于 EHR 测试集中。
- Carmen 提高了 GNN 的区分能力。为了衡量分子相似性对预测的影响,引入“混淆指数” ,它表明第 i 种药物由于其他与其相似的药物而产生的混淆程度:
nj 和 ni 表示训练数据中第 j 种和第 i 种药物的出现次数。 sij 表示第 i 个药物和第 j 个药物之间的分子相似性. 当药物的分子结构独特时,混淆指数达到最小值(0)。
总结
提出了一种新颖的上下文感知 GNN(Carmen)用于药物推荐。Carmen 提取每种药物的上下文信息并将其注入 GNN 前向过程中,提高了普通 GNN 对相似分子的区分能力。开发的 DDI 编码模块能够正确嵌入药物,弥补了非传递 DDI 图中应用的传统消息传递的缺陷。
代码链接
https://github.com/bit1029public/Carmen
标签:编码,Medication,药物,Graph,ddi,DDI,Embedding,GNN,Carmen From: https://blog.csdn.net/m0_61691772/article/details/140880840