2024深度学习发论文&模型涨点之——迁移学习+多模态
迁移学习是指将一个领域或任务中获得的知识应用到另一个相关领域或任务中的方法。其主要优势在于可以减少对大量训练数据的需求,并提高模型在新任务上的性能。多模态学习是指在不同类型的数据(如图像、文本、音频等)之间共享知识的过程。其目标是学习一个通用的表示空间,使得不同类型的数据在这个空间中具有相似的结构。
迁移学习+多模态学习,可以在不同模态之间实现更有效的知识传递和信息融合,从而提高模型在新任务上的准确率。未来,迁移学习和多模态学习的结合将继续在各个领域中发挥重要作用,特别是在需要处理多种数据类型和跨领域知识迁移的复杂任务中。研究者们将继续探索如何更好地融合不同模态的数据,提高模型的泛化能力和性能。
如果有同学想发表相关论文,小编整理了一些迁移学习+多模态【论文】合集,以下放出部分,全部论文PDF版
需要的同学公众号【AI智界先锋】回复“迁移学习+多模态”即可全部领取
论文精选
论文1:
Audio-visual cross-modality knowledge transfer for machine learning-based in-situ monitoring in laser additive manufacturing
用于激光增材制造中基于机器学习的原位监测的视听跨模态知识转移
方法
-
跨模态知识转移(CMKT)方法论:提出了一种从源模态向目标模态转移知识的方法,以增强目标模态在训练阶段提取的特征的有用性,并在预测阶段移除源模态的传感器。
-
语义对齐:通过建立共享编码空间来促进知识转移,使用语义对齐损失来对齐相同类别的分布,并使用分离损失来区分不同类别的分布。
-
全监督映射和半监督映射:通过完全监督和半监督学习从一种模态派生另一种模态的特征,实现知识转移。
创新点
-
跨模态知识转移(CMKT):提出了一种新的方法论,通过在训练阶段整合视觉和听觉数据,然后在预测阶段仅使用目标模态,从而减少了硬件、计算和运营成本。
-
语义对齐:提出了一种新的语义对齐方法,通过对比相同和不同类别的分布对齐,增强了模型对异常检测的准确性。
-
映射方法:提出了两种新的跨模态映射方法,可以在完全监督和半监督学习框架下,从一个模态派生另一个模态的特征,提高了模型的泛化能力。
-
实际应用:将提出的CMKT方法应用于激光粉末床熔化(LPBF)缺陷检测和质量预测,展示了在实际工业应用中的有效性。
论文2:
Cross-Modal Dynamic Transfer Learning for Multimodal Emotion Recognition
用于多模态情感识别的跨模态动态迁移学习
方法
-
跨模态动态迁移学习(CDaT):提出了一种表示学习方法,动态过滤低置信度模态,并使用单模态掩蔽和跨模态表示迁移学习来补充高置信度模态。
-
辅助网络:训练一个辅助网络来学习模型置信度分数,以确定哪个模态是低置信度的,以及应该从其他模态转移多少知识。
-
概率知识转移损失:利用转移之间的低级单模态信息,通过概率知识转移损失实现模态间的迁移。
创新点
-
动态模态调整:提出了一种新的方法,通过动态调整来解决多模态融合学习中语义不对齐的问题。
-
模态置信度评估:引入了一种新的方法来评估模态置信度,通过比较掩蔽特定模态和融合所有模态时的情感标签概率分布。
-
跨模态表示迁移:提出了一种新的方法,通过比较两种模态的结果概率值,选择性地学习低置信度模态的特征遵循高置信度模态的特征分布。
-
模型无关性:CDaT方法与任何融合模型兼容,因为它利用了通过概率知识转移损失实现的模态间迁移,不需要额外的参数。
论文3:
Cross-Subject Emotion Classification based on Dual-Attention Mechanism and Meta-Transfer Learning
基于双注意力机制和元迁移学习的跨个体情感分类
方法
-
双注意力网络:通过通道注意力块和时间注意力块提取EEG特征。
-
元迁移学习(MTL)策略:训练模型学习跨个体的共有和个体特征。
-
k-means聚类基础的元任务采样方法:自适应地对源域样本进行分组,从不同组中采样支持集和查询集,增强模型的泛化能力。
创新点
-
双注意力机制:有效地从EEG信号中提取区分情绪的关键通道和时间片段,提高特征提取的准确性。
-
元迁移学习策略:使模型能够快速适应新个体的数据分布,减少对目标域数据的依赖。
-
DG采样器:基于k-means聚类的创新采样方法,增强了支持集和查询集之间的分布差异,进一步提升模型的泛化能力。
论文4:
A Novel Transfer Learning Framework for Multimodal Skin Lesion Analysis
用于多模态皮肤病变分析的新型迁移学习框架
方法
-
视觉Transformer模型:结合迁移学习和通道注意力机制,以及ROI,用于准确检测皮肤状况,包括皮肤癌。
-
多模态数据融合:结合宏观皮肤图像和患者元数据,提高诊断的准确性和效率。
-
迁移学习:通过在较小样本上微调现有模型来提高性能。
创新点
-
多模态融合:提出了一个结合视觉Transformer模型、迁移学习、通道注意力和ROI的创新框架,实现对皮肤病变的精确检测。
-
临床影响和实际应用:展示了该方法在敏感性、特异性和精确性方面的显著改进,并在实际数据集上表现出色,准确率达到99%,超过了现有方法。
-
效率和自动化:通过自动化和简化皮肤病变分析,提高了皮肤科的效率和准确性,减轻了皮肤科医生的工作负担。
如果有同学想发表相关论文,小编整理了一些迁移学习+多模态【论文】合集。
需要的同学公众号【AI智界先锋】回复“迁移学习+多模态”即可全部领取
标签:模态,置信度,模型,学习,极限,迁移,方法 From: https://blog.csdn.net/AIzhijie001/article/details/143617977