首页 > 其他分享 >Context-Aware Safe Medication Recommendations with Molecular Graph and DDI Graph Embedding文献阅读记录

Context-Aware Safe Medication Recommendations with Molecular Graph and DDI Graph Embedding文献阅读记录

时间:2024-08-02 22:27:39浏览次数:17  
标签:编码 Medication 药物 Graph ddi DDI Embedding GNN Carmen

这篇文章是2023年AAAI会议上的一篇论文, 主要是利用分子图和 DDI 图嵌入来提供上下文感知信息,从而进行安全药物推荐。链接Context-Aware Safe Medication Recommendations with Molecular Graph and DDI Graph Embedding| Proceedings of the AAAI Conference on Artificial Intelligence

背景

药物分子结构和DDI是引导药物推荐任务的重要知识,医学概念嵌入已经被用于增强这些任务的表现。DDI的建模有利于药物推荐的安全性。

动机

现有模型仍然存在缺陷:

        1)不能区分分子相似但功能不同的药物——将分子转化为图,不可避免地会导致信息丢失,因为相似的分子可能会转化为相同的图结构;

睾酮和雌二醇,为同分异构体,导致药物的功能不同。vanilla GNN对其编码会使得其具有几乎相同的表示,这可能会误导药物推荐模块将它们等同起来,并错误地将它们推荐给患者。

         2) 不能正确捕获嵌入空间中药物之间的意外反应——利用传统的基于消息传递的图嵌入来模拟药物相互作用,它们直接或间接地应用了“传递性”特征。

作者认为,DDI 图当中这种传递性不适用,比如DDI并没有说明雌激素和甲状腺制剂具有相互作用,但是消息传递会使其连通认为具有相互作用,而实际上同时服用雌激素和甲状腺制剂是无害的。

应对策略

由于具有不同功能的药物在 EHR 中表现出不同的共现行为,因此正确利用每种药物的共现医学概念(构建药物-诊断, 药物-手术, 药物-药物共现矩阵, 并且对这些信息进行融合)作为其上下文信息有利于表示学习;

关闭“传递性”功能,采用改进的消息消除方法对 DDI 进行编码。

提出了 Carmen——基于图嵌入的 药物推荐(MR)框架,由四个部分组成,包括患者表示学习、上下文信息提取、上下文感知 GNN 和 DDI 编码。Carmen 将访问历史纳入分子图的表示学习中,以区分具有相似拓扑但不同活性的分子。DDI编码模块是专门为非传递交互DDI图设计的。

目标任务

药物推荐, 患者表征与学习到的药物表征做内积,然后经过sigmoid函数得到相似性分数进行推荐.

方法技术

GRU, GNN, 注意力机制

Carmen模型

        符号说明

                

        第一部分 患者表征学习

        给定一个表示第t次访问的多热向量(dt, pt, mt)三元组,通过将嵌入矩阵Ed/Ep与原始多热向量d t /pt相乘,将dt /pt t转换为低维(l维)向量 d^t_e /p^t_e。类似于医生总是参考患者的病史进行诊断的医疗场景,作者使用两个GRU来处理诊断序列和手术序列,依次获取诊断视图和过程视图的纵向信息。

       

        第二部分 上下文信息提取

                原始GNN

                AGG函数收集 GNN 第 k 层的邻居信息,UPD函数用其相应的聚合邻域信息更新节点嵌入. 但是其对具有相似分子结构的药物的区分能力不足,导致药物表征固有缺陷。

 

        由于不同的药物在EHR数据集中会表现出不同的共现行为,首先从训练集构建三个共现矩阵:药物-诊断共现矩阵$A_{md}$,药物-手术共现矩阵$A_{mp}$,药物-药物共现矩阵$A_{mm}$。每个矩阵的行用L1范数归一化。

        每种药物用 C_d=A_{md}E_dC_p=A_{mp}E_p进行初步表示,其中Cd, Cp可以认为是两种视图下的初步药物上下文表示,然后由将Cd与Cp拼接成共现信息。组合信息由Cmm = AmmCdp捕获,并由C = Cdp + tanh(Cdp·Ws)⊙Cmm与共现信息Cdp集成。(第二项相当于一个注意力机制, 用于自适应选择Cmm当中重要的特征)

        第三部分 上下文感知GNN

        由于现有方法受到GNN区分能力的限制,作者设计了一种新的分子图原子聚集形式,其中每个原子由其邻域信息和附加的图级药物上下文信息编码。将每个原子的邻域信息和药物Cm的上下文嵌入汇总,然后,将其与单个自连接表示结合,推导出原子v在第k层中的表示

 为了将原子表示总结为图级药物表示,利用读出函数 R(·):

        

        第四部分  DDI 编码

        DDI图是无向图Gddi = (Vddi, Eddi),其中Vddi和Eddi分别表示其节点和边。每个节点表示一种药物,每个边表示两种药物之间存在DDI。对于DDI图,采用注意力机制进行聚合。由于DDI图中连接的药物实际上是相互排斥的,因此它们在低维嵌入空间中的表示应该相差很大。

         最后将DDI嵌入模块学习到的药物嵌入与从药物分子结构图当中学习到的药物嵌入结合起来,便于推荐。

        预测和目标函数

每种药物的匹配分数是患者表示和药物表示之间的相似度:

 将药物推荐看作多标签分类任务, 采用二元交叉损失和多标签合页损失作为联合损失函数:

 合页损失要求分类边界尽可能大。

实验

  1. 数据集:MIMIC-III、MIMC-IV
  2. baseline:
    • LR、ECC、RETAIN、LEAP、GAMENet、SafeDrug
    • Carmen w/o (context & ddi-enc) 即用最原始的GNN编码分子结构来表征药物
    • Carmen w/ ddi-loss 使用SafeDrug里边的DDI损失
    • Carmen w/ ddi-agg 使用传统消息传递来编码DDI
    • Carmen w/o ddi-enc
  3. 评估指标:Jaccard相似性,F1分数,Precision-Recall AUC

 

  • 结果表明 Carmen 及其变体始终优于基线。Carmen w/o ddi-enc 和 Carmen w/o (context & ddi-enc) 之间的比较表明,主要的性能增益来自于 GNN 前向过程中涉及的上下文信息。虽然 Carmen w/o (context & ddi-enc) 和 SafeDrug 都使用普通的 GNN 来编码分子,但它们的图编码器的设计细节明显不同,并且 SafeDrug 有一个额外的局部二分编码器。具体来说,节点的度数已被证明是编码图的判别信息 ,但在 SafeDrug 中被忽略。
  • DDI编码保证了安全性. DDI知识可以通过两种方式包含,DDI编码DDI损失。对于 DDI 损失,它对 Carmen 有微不足道的改进(Carmen w/ ddi-loss 与 Carmen w/o ddi-enc),对 GAMENet 显着升级,并且对 SafeDrug 几乎没有影响。原因是DDI知识不仅由分子决定,而且还隐含在医生开具的就诊记录中.
  • SafeDrug 倾向于提出保守的建议来拟合 DDI 损失函数,但由于 DDI 知识并不总是与就诊记录一致,因此会影响准确性。
  • Carmen不推荐任何不安全的药物组合。相反,Carmen w/ ddi-loss 未能减少不安全的药物组合。同样,Carmen w/ ddi-agg 不能保证不推荐任何不利的 DDI。这些结果证明我们的 DDI 编码模块可以处理非传递 DDI 图的固有属性并捕获药物之间的关系以确保药物使用的安全性和可靠性,但不可避免地会降低准确性,因为某些 DDI 位于 EHR 测试集中。

  • Carmen 提高了 GNN 的区分能力。为了衡量分子相似性对预测的影响,引入“混淆指数” \eta _i,它表明第 i 种药物由于其他与其相似的药物而产生的混淆程度:
  • nj 和 ni 表示训练数据中第 j 种和第 i 种药物的出现次数。 sij 表示第 i 个药物和第 j 个药物之间的分子相似性. 当药物的分子结构独特时,混淆指数达到最小值(0)。

总结

        提出了一种新颖的上下文感知 GNN(Carmen)用于药物推荐。Carmen 提取每种药物的上下文信息并将其注入 GNN 前向过程中,提高了普通 GNN 对相似分子的区分能力。开发的 DDI 编码模块能够正确嵌入药物,弥补了非传递 DDI 图中应用的传统消息传递的缺陷。

代码链接

https://github.com/bit1029public/Carmen

标签:编码,Medication,药物,Graph,ddi,DDI,Embedding,GNN,Carmen
From: https://blog.csdn.net/m0_61691772/article/details/140880840

相关文章

  • Apache COC闪电演讲总结【OSGraph】
     大家能看到我最近一直在折腾与OSGraph这个产品相关的事情,之前在文章《妙用OSGraph:发掘GitHub知识图谱上的开源故事》中向大家阐述过这个产品的设计理念和应用价值。比方说以下问题就可以在OSGraph上找到明确的答案。 从技术角度说,我们是用GitHub开放数据结合图技术(TuGrap......
  • 论文阅读:Scalable Algorithms for Densest Subgraph Discovery
    摘要密集子图发现(DSD)作为图数据挖掘的基础问题,旨在从图中找到密度最高的子图。虽然已有许多DSD算法,但它们在处理大规模图时往往不可扩展或效率低下。本文提出了在无向图和有向图上求解DSD问题的高效并行算法,通过优化迭代过程和减少迭代次数来计算核心数。同时引入了新的子......
  • 微软GraphRAG框架源码解读(LLMs)
    1.引言这几天微软开源了一个新的基于知识图谱构建的检索增强生成(RAG)系统:GraphRAG。该框架旨在利用大型语言模型(LLMs)从非结构化文本中提取结构化数据,构建具有标签的知识图谱,以支持数据集问题生成、摘要问答等多种应用场景。GraphRAG的一大特色是利用图机器学习算法针对数据......
  • 我用Awesome-Graphs看论文:解读Naiad
    Naiad论文:《Naiad:ATimelyDataflowSystem》前面通过文章《论文图谱当如是:Awesome-Graphs用200篇图系统论文打个样》向大家介绍了论文图谱项目Awesome-Graphs,并分享了Google的Pregel、OSDI'12的PowerGraph、SOSP'13的X-Stream。这次向大家分享Microsoft发表在SOSP'13的另一......
  • 了解GraphRAG
    了解GraphRAG转载:从零实现大模型-GraphRAG,构建LLM中的关系数据库开源地址:https://github.com/microsoft/graphrag论文:FromLocaltoGlobal:AGraphRAGApproachtoQuery-FocusedSummarization博客介绍:https://microsoft.github.io/graphrag/传统RAGLLM预训练和......
  • graphrag api调用
    """参考:https://microsoft.github.io/graphrag/posts/get_started/1.初始化家目录:python-mgraphrag.index--init--root./ragtest2.初始化索引:python-mgraphrag.index--root./ragtest脚本需要放置在ragtest目录下运行"""importosimportrefromp......
  • 我用Awesome-Graphs看论文:解读PowerGraph
    PowerGraph论文:《PowerGraph:DistributedGraph-ParallelComputationonNaturalGraphs》上次通过文章《论文图谱当如是:Awesome-Graphs用200篇图系统论文打个样》向大家介绍了论文图谱项目Awesome-Graphs,并从Google的Pregel开始解读图计算系统关键论文。这次向大家分享发表......
  • 无法在 Llama Index 中加载 HuggingFace Embeddings llama3.1
    我有一个非常简单的代码,如下所示:fromllama_index.embeddings.huggingfaceimportHuggingFaceEmbeddingembed_model=HuggingFaceEmbedding(model_name="meta-llama/Meta-Llama-3-8B")我看到这个模型,meta-llama/Meta-Llama-3-8B,只有4.5GB,而我有16GBRAM,最多只使用20......
  • 论文摘要:Efficient Algorithms for Densest Subgraph Discovery on Large Directed Gr
    背景在很多应用中,例如欺诈检测、社区挖掘和图压缩等,需要从有向图中找到密度最高的子图,这被称为有向最密子图问题(DirectedDensestSubgraph,DDS)。DDS问题在社交网络、Web图和知识图谱等领域有着广泛的应用。例如,在社交网络中,可以用来检测假粉丝,在Web图中,可以用来发现网络......
  • CompressGraph: 基于规则的高效并行图分析压缩方法
    背景随着数据爆炸式增长,图数据分析在社交网络、科学计算和数据挖掘等领域变得越来越重要。然而,处理大规模图数据面临着存储和计算资源的挑战。传统的图压缩方法可能会丢失重要信息,影响分析结果的准确性。CompressGraph框架旨在通过规则基压缩技术,在有效压缩图数据的同......