多模态学习之论文阅读：《Multi-modal Learning with Missing Modality in Predicting Axillary Lymph Node Metastasis

标签：Node 模态 Multi WSI 模型 Predicting 临床缺失分支

《Multi-modal Learning with Missing Modality in Predicting Axillary Lymph Node Metastasis 》

（一）要点

研究背景：多模态学习在医学图像分析中的重要性，尤其是乳腺癌早期患者的腋窝淋巴结转移(ALNM)诊断。
问题陈述：临床信息的收集困难，导致多模态模型在实际应用中受限。
研究目标：提出一种新的多模态学习框架，解决在预测腋窝淋巴结转移时临床信息可能缺失的问题，提高模型在实际临床环境中的可用性。
概述：提出一个双向蒸馏（Bidirectional Distillation, BD）框架，该框架由单模态分支和多模态分支组成。单模态分支能够从多模态分支获取完整的多模态知识，而多模态分支则从单模态分支学习WSI（全切片图像）的鲁棒特征，两个分支通过知识蒸馏相互交流，以提高模型对缺失模态的鲁棒性，并与Filling、AE、Ensemble这三种处理多模态学习中缺失模态问题的方法进行了对比。
灵活性：能够在测试时根据模态的完整性灵活地开启或关闭单模态分支。
知识蒸馏：通过引入可学习的提示（learnable prompt）在多模态分支和单模态分支之间进行知识转移。
鲁棒性：即使在临床信息大量缺失的情况下，也能保持较高的性能。

（二）步骤

3.1 多模态分支（Multi-modal Branch）

3.2 单模态分支（Single-modal Branch）

3.3 可学习的提示（prompt）:

作用：在单模态分支中，当临床数据缺失时，提示用于模拟这部分数据的缺失，并帮助模型记住相关信息

实现：通过非线性函数，将提示向量转换为与临床数据特征维度相同的特征表示，并与WSI的深度特征结合，参与模型的预测

3.4 知识蒸馏机制

3.5 损失函数设计

蒸馏损失：用于知识从多模态分支到单模态分支的传递，以及反过来从单模态分支到多模态分支的鲁棒特征提取。使用均方误差（MSE）或散度（KL）等度量方法，来衡量两个分支输出之间的差异。

训练：两个分支同时训练，利用随机梯度下降等优化算法调整模型参数。

测试：根据模态的完整性，灵活选择使用单模态分支或多模态分支进行预测。

论文展示了Filling、AE、Ensemble共三种处理多模态学习中缺失模态问题的方法。

6.1 Filling（填充）：在用零向量填充缺失的临床数据。这种方法假设缺失的数据值为零，从而保持模型输入的维度一致性。

6.2 AE（自编码器）：是一种生成模型，用于自动生成缺失的深度特征。

原理：该模型分为两个阶段训练。首先，训练一个LNMP模型，该模型在模态完整的训练集上学习。然后，训练一个自编码器来生成缺失的特征，自编码器的输入和输出分别是WSI的特征和临床数据的特征。
优势：能够学习如何从存在的数据中生成缺失的临床数据的表示。

6.3 Ensemble（集成方法）：两个独立的网络，一个是WSI识别网络，另一个是临床数据的分类网络。

这三种方法在论文中被用来与提出的双向蒸馏（BD）框架进行比较，以展示在处理临床数据缺失时的不同性能。通过实验结果，作者证明了BD框架在不同缺失率下的性能优于Filling、AE和Ensemble方法。

（三）提升

（四）不足

（五）心得

多模态学习的重要性：理解了多模态数据融合在提高医学图像分析准确性方面的重要性。

知识蒸馏的应用：学习了知识蒸馏作为一种提高模型鲁棒性的有效技术。

标签：Node,模态,Multi,WSI,模型,Predicting,临床,缺失,分支
From： https://www.cnblogs.com/wkang/p/18350686