首页 > 编程语言 >多模态学习之论文阅读:《Multi-modal Learning with Missing Modality in Predicting Axillary Lymph Node Metastasis

多模态学习之论文阅读:《Multi-modal Learning with Missing Modality in Predicting Axillary Lymph Node Metastasis

时间:2024-08-09 14:29:18浏览次数:12  
标签:Node 模态 Multi WSI 模型 Predicting 临床 缺失 分支

《Multi-modal Learning with Missing Modality in Predicting Axillary Lymph Node Metastasis 》

(一)要点

  1. 研究背景:多模态学习在医学图像分析中的重要性,尤其是乳腺癌早期患者的腋窝淋巴结转移(ALNM)诊断。
  2. 问题陈述:临床信息的收集困难,导致多模态模型在实际应用中受限。
  3. 研究目标:提出一种新的多模态学习框架,解决在预测腋窝淋巴结转移时临床信息可能缺失的问题,提高模型在实际临床环境中的可用性。
  4. 概述:提出一个双向蒸馏(Bidirectional Distillation, BD)框架,该框架由单模态分支和多模态分支组成。单模态分支能够从多模态分支获取完整的多模态知识,而多模态分支则从单模态分支学习WSI(全切片图像)的鲁棒特征,两个分支通过知识蒸馏相互交流,以提高模型对缺失模态的鲁棒性,并与Filling、AE、Ensemble这三种处理多模态学习中缺失模态问题的方法进行了对比。
  5. 灵活性:能够在测试时根据模态的完整性灵活地开启或关闭单模态分支。
  6. 知识蒸馏:通过引入可学习的提示(learnable prompt)在多模态分支和单模态分支之间进行知识转移。
  7. 鲁棒性:即使在临床信息大量缺失的情况下,也能保持较高的性能。

(二)步骤

  1. 问题定义:识别在测试阶段可能缺失的临床信息模态,并定义训练集和测试集。
  2. 方法设计:开发双向蒸馏(BD)框架,包含单模态和多模态分支,通过知识蒸馏实现模态间的信息传递。
  3. 网络结构设计:

3.1 多模态分支(Multi-modal Branch)

  • 输入:接收全切片图像(WSI)和临床数据
  • WSI处理:WSI被分割成多个小区域(patches),输入到编码器中提取深度特征
  • 临床表格数据处理:通过映射转换为相应的特征表示
  • 融合:使用注意力机制将不同区域的WSI特征融合为单一的深度特征表示,并通过一个可学习的非线性投影函数 H(⋅)进行聚合,生成融合特征

  • 分类器:融合后的特征输入到分类器中,进行最终的分类任务。

3.2 单模态分支(Single-modal Branch)

  • 输入:仅接收全切片图像(WSI)
  • 处理:类似于多模态分支,提取WSI的深度特征
  • 知识蒸馏:通过引入可学习的提示(prompt)模拟临床数据的缺失,并从多模态分支接收相关知识

3.3 可学习的提示(prompt):

作用:在单模态分支中,当临床数据缺失时,提示用于模拟这部分数据的缺失,并帮助模型记住相关信息

实现:通过非线性函数,将提示向量转换为与临床数据特征维度相同的特征表示,并与WSI的深度特征结合,参与模型的预测

3.4 知识蒸馏机制

  • 目的:确保单模态分支在缺失临床数据时,仍能获得多模态分支的知识
  • 实现:通过定义蒸馏损失函数,将多模态分支的输出与单模态分支的输出进行比较,引导单模态分支学习
  • 从多模态到单模态:将多模态分支学到的临床数据知识传递给单模态分支,帮助单模态分支在缺失临床数据时也能做出准确的预测
  • 从单模态到多模态:将单模态分支学到的鲁棒特征传递给多模态分支,增强多模态分支对WSI的表示能力

3.5 损失函数设计

  • 分类损失:使用交叉熵损失(Cross-Entropy Loss)来衡量模型预测与实际标签之间的差距。

  • 蒸馏损失:用于知识从多模态分支到单模态分支的传递,以及反过来从单模态分支到多模态分支的鲁棒特征提取。使用均方误差(MSE)或散度(KL)等度量方法,来衡量两个分支输出之间的差异。

  • 多模态分支的总体损失函数:结合了分类损失Lc蒸馏损失Lf,用于同时优化模型的分类能力和知识传递能力。

  • 单模态分支的总体损失函数:结合了分类损失Lc蒸馏损失Lf,但重点在于使用单模态数据模拟多模态情况,并从多模态分支中学习。

  1. 模型训练与测试

训练:两个分支同时训练,利用随机梯度下降等优化算法调整模型参数。

测试:根据模态的完整性,灵活选择使用单模态分支或多模态分支进行预测。

  1. 性能评估:通过AUC和F1分数评估模型在不同临床信息缺失率下的性能。
  2. 对比:

论文展示了Filling、AE、Ensemble共三种处理多模态学习中缺失模态问题的方法。

6.1 Filling(填充):在用零向量填充缺失的临床数据。这种方法假设缺失的数据值为零,从而保持模型输入的维度一致性。

  • 原理:在模态完整时,这种方法与LNMP模型相同;在测试时模态缺失的情况下,使用零向量替代缺失的临床数据。
  • 局限性:这种方法简单直接,但可能不会提供有关缺失数据的有价值信息,导致性能下降。

6.2 AE(自编码器):是一种生成模型,用于自动生成缺失的深度特征。

  • 原理:该模型分为两个阶段训练。首先,训练一个LNMP模型,该模型在模态完整的训练集上学习。然后,训练一个自编码器来生成缺失的特征,自编码器的输入和输出分别是WSI的特征和临床数据的特征。
  • 优势:能够学习如何从存在的数据中生成缺失的临床数据的表示。

6.3 Ensemble(集成方法):两个独立的网络,一个是WSI识别网络,另一个是临床数据的分类网络。

  • 原理:WSI识别网络输出预测概率,临床数据的分类网络也输出预测概率,最终通过融合这两个概率得到最终的预测结果。如果没有临床数据输入,只使用WSI识别网络。
  • 优势:在模态完整或不完整的情况下,通过集成两个网络的预测来提高性能。

这三种方法在论文中被用来与提出的双向蒸馏(BD)框架进行比较,以展示在处理临床数据缺失时的不同性能。通过实验结果,作者证明了BD框架在不同缺失率下的性能优于Filling、AE和Ensemble方法。

(三)提升

  1. 知识蒸馏:通过从多模态分支到单模态分支的知识传递,增强了模型对缺失数据的鲁棒性。
  2. 灵活性:BD框架能够根据测试数据的模态完整性灵活调整,提高了模型的实用性。
  3. 性能:在临床信息大量缺失的情况下,模型仍能保持较高的诊断性能。

(四)不足

  1. 泛化能力:论文未详细讨论模型在不同类型的医学图像和临床数据上的泛化能力。
  2. 临床验证:缺乏实际临床环境中的验证,模型的临床适用性尚未得到充分证实。
  3. 计算效率:论文未讨论模型的计算效率和在实际医疗系统中的部署问题。

(五)心得

多模态学习的重要性:理解了多模态数据融合在提高医学图像分析准确性方面的重要性。

知识蒸馏的应用:学习了知识蒸馏作为一种提高模型鲁棒性的有效技术

标签:Node,模态,Multi,WSI,模型,Predicting,临床,缺失,分支
From: https://www.cnblogs.com/wkang/p/18350686

相关文章

  • 多模态学习之论文阅读:《Multi-modal global- and local- feature interaction with at
    《Multi-modalglobal-andlocal-featureinteractionwithattention-basedmechanismfordiagnosisofAlzheimer’sdisease》-2024.9本文提出了一种新的多模态学习框架,用于提高阿尔茨海默病(Alzheimer'sdisease,AD)的诊断准确性。该框架旨在通过结合临床表格数据和大脑......
  • 多模态学习之论文阅读:《PREDICTING AXILLARY LYMPH NODE METASTASIS IN EARLY BREAST
    《PREDICTINGAXILLARYLYMPHNODEMETASTASISINEARLYBREASTCANCERUSINGDEEPLEARNINGONPRIMARYTUMORBIOPSYSLIDES》(一)要点提出一个基于注意力机制的多实例学习框架,构建了一个深度学习模型。该模型利用WSIs和临床数据预测早期乳腺癌(EBC)患者的腋窝淋巴结(ALN)转移状态......
  • 【前端】NodeJS:HTTP协议
    文章目录HTTP协议1概念2请求报文的组成3HTTP的请求行4请求头5HTTP的请求体6响应报文的组成7创建HTTP服务7.1操作步骤7.2测试7.3注意事项8浏览器查看HTTP报文8.1查看请求行和请求头8.2查看请求体8.3查看URL查询字符串8.4查看响应行与响应头8.5查看响应体......
  • 【前端】NodeJS:NodeJS模块化
    文章目录1NodeJS模块化1.1模块化与模块1.2模块化项目1.3模块化好处2模块暴露数据2.1模块初体验2.2暴露数据3导入(引入)模块4导入模块的基本流程5CommonJS规范1NodeJS模块化1.1模块化与模块将一个复杂的程序文件依据一定规则(规范)拆分成多个文件的过程称......
  • node安装
    下载Node.js:首先,访问Node.js的官方网站(https:odejs.org/),选择适合你操作系统的版本进行下载。对于‌Windows用户,可以选择.msi安装包进行安装。安装Node.js:下载完成后,运行安装包,按照提示进行安装。在安装过程中,你可以选择自定义安装选项,但通常情况下,直接点击“下一步”即可完成......
  • nodejs语言,MySQL数据库;springboot的个性化资讯推荐系统66257(免费领源码)计算机毕业设计
    摘 要随着科学技术的飞速发展,社会的方方面面、各行各业都在努力与现代的先进技术接轨,通过科技手段来提高自身的优势,个性化资讯推荐系统当然也不能排除在外。个性化资讯推荐系统是以实际运用为开发背景,运用软件工程原理和开发方法,采用springboot技术构建的一个管理系统。整......
  • c#语言,SQL server数据库;基于Web的社区人员管理系统的设计与实现36303(免费领源码)计算机
    目 录摘要1绪论1.1慨述1.2课题意义1.3B/S体系结构介绍1.4ASP.NET框架介绍2 社区人员管理系统分析2.1可行性分析2.2系统流程分析2.2.1数据增加流程2.2.2数据修改流程52.2.3数据删除流程52.3系统功能分析62.3.1功能性分析62.3.2非功能性......
  • node.js: mysql sequelize es6 ORM in vscode
    mysql:select*fromtutorials;#CREATETABLEIFNOTEXISTS`tutorials`(`id`INTEGERNOTNULLauto_increment,`title`VARCHAR(255),`description`VARCHAR(255),`published`TINYINT(1),`createdAt`DATETIMENOTNULL,`updatedAt`DATETIMENOTNULL,PRIMA......
  • git前端上传项目忽略本地node_modules文件
    要在Git上传前端代码时忽略node_modules文件夹在项目根目录下查找或创建.gitignore文件:如果你的项目中已经存在.gitignore文件,则打开它进行编辑。如果不存在,就在项目根目录下创建一个新的.gitignore文件。在.gitignore文件中添加node_modules/:打开.gitignore文件,并添加......
  • 计算机毕业设计项目推荐,院系资料分类管理平台 84184(开题答辩+程序定制+全套文案 )上万
    目 录摘要1绪论1.1研究背景1.2研究意义1.3论文结构与章节安排2 院系资料分类管理平台系统分析2.1可行性分析2.2系统流程分析2.2.1数据增加流程2.2.2数据修改流程2.2.3数据删除流程2.3系统功能分析2.3.1功能性分析2.3.2非功能性分析......