使用基于注意力的编码器-解码器实现医学图像描述

时间：2022-10-16 12:55:08浏览次数：94

什么是图像描述

图像描述是生成图像文本描述的过程。它使用自然语言处理和计算机视觉来为图像生成描述的文本字幕。一幅图像可以有很多个不同的描述，但是只要它正确地描述了图像，并且描述涵盖了图像中的大部分信息就可以说是没问题的。下面是示例图片和生成的描述文字。

放射学中的图像描述

放射学也称为诊断成像，是一系列通过拍摄身体部位的照片或图像来诊断和治疗疾病的测试。虽然有几种不同的成像检查，但最常见的包括 X 射线、MRI、超声波、CT 扫描和 PET 扫描。

放射科医生将查看这些成像测试的结果，找到评估和支持诊断的相关图像。患者完成影像学检查后，放射科医生将向临床医生提供他们的解释报告。典型的放射学报告包括以下部分：检查名称或类型、检查日期、MeSH（医学主题词库）、解释放射科医师详细信息、临床病史等，

借助深度学习和自然语言处理，我们可以通过描述 X 射线来减少放射科医生的工作量，因此在本案例研究中，我们将从 X 射线中提取结果，将相同的概念扩展到其他部分例如MeSH等，

为什么这个问题很重要？

根据美国放射学杂志和 BMJ：英国医学杂志，与特定地区的人口相比，放射科医生很少，特别是在农村和较小的社区环境中，因此医学图像解释和编目存在巨大延迟，从而影响到医疗诊断，并使患者护理面临风险。

医学图像由专业医学专业人员（放射科医师）阅读和解释，他们对每个检查区域的发现通过书面医学报告（放射学报告）进行记录和传达。撰写医疗报告的过程通常需要 5-10 分钟左右。一天之内，医生必须编写数以百计的医学报告，这可能会花费他们很多时间。如果我们开发的模型可以在没有放射科医生和编目员的任何干预的情况下加快医学图像解释和编目，这将有效地解决了这些问题。

用深度学习来解决这个问题!

图像和文本句子是序列信息，因此我们将在编码器-解码器等设置中使用像 LSTM 或 GRU 这样的 RNN（循环神经网络），并添加注意力机制来提高我们的模型性能。当然使用Transformers 理论上来说会更好。

如何评价我的模特的表现呢？BLEU: Bilingual Evaluation Understudy

BLEU 是一种用于评估机器翻译文本质量的算法。BLEU 背后的中心思想是机器翻译越接近专业的人工翻译越好，它也是最早声称与人工质量判断具有高度相关性的指标之一，并且到现在仍然是最受欢迎的指标之一。

BLEU 的输出始终是一个介于 0 和 1 之间的数字。该值表示候选文本与参考文本的相似程度，接近 1 的值表示更相似。本文使用的 BLEU 是基于n-gram 精度改进的，因为它使用 n-gram 来比较和评价生成文本的质量并给出分数，它计算快速简单并且被广泛使用。

BLEU 的工作方式很简单。给定一个句子和一组参考句子的一些候选翻译，我们使用词袋方法来查看在翻译和参考句子中同时出现了多少 BOW。 BOW 是一种简单而高效的方法，可确保机器翻译包含参考翻译也包含的关键短语或单词。换句话说，BLEU 将候选翻译与人工生成的带注释的参考翻译进行比较，并比较候选句子中有多少命中。 BOW 出现次数越多，翻译效果就越好。

完整文章：

https://avoid.overfit.cn/post/ccf35d78cb23425686d61c53aa404b76

标签：BLEU,编码器,文本,放射科,解码器,图像,放射学,注意力,描述
From： https://www.cnblogs.com/deephub/p/16796009.html

【自然语言处理（NLP）】基于注意力机制的中-英机器翻译
【自然语言处理（NLP）】基于注意力机制的中-英机器翻译作者简介：在校大学生一枚，华为云享专家，阿里云专家博主，腾云先锋（TDP）成员，云曦智划项目总负责人，全国高等学校计算机教学与产......
自注意力中的不同的掩码介绍以及他们是如何工作的?
在研究自注意力时，有很多的名词需要我们着重的关注，比如填充掩码，前瞻掩码等等，但网上没有太多注意力掩码的教程和它是如何工作的信息，另外还有以下的细节需要详细的解释：为什......
【每周CV论文推荐】初学视觉注意力机制有哪些值得阅读的论文？
欢迎来到《每周CV论文推荐》。在这个专栏里，还是本着有三AI一贯的原则，专注于让大家能够系统性完成学习，所以我们推荐的文章也必定是同一主题的。注意力机制是当下计算机视觉和......
ICRA 2022 | 基于多模态变分自编码器的任意时刻三维物体重建
论文题目：Anytime3DObjectReconstructionUsingMulti-ModalVariationalAutoencoder论文地址：https://arxiv.org/abs/2101.10391论文来源：IEEERoboticsandAuto......
CVPR21小目标检测：上下文和注意力机制提升小目标检测（附论文下载）
计算机视觉研究院专栏作者：Edison_GCVPR21文章我们也分享了很多最佳的框架，在现实场景中，目标检测依然是最基础最热门的研究课题，尤其目前针对小目标的检测，更加吸引了更多的研究......
NLP之基于Seq2Seq和注意力机制的句子翻译
Seq2Seq(Attention)@目录Seq2Seq(Attention)1.理论1.1机器翻译1.1.1模型输出结果处理1.1.2BLEU得分1.2注意力模型1.2.1Attention模型1.2.2Seq2Seq(Attention)模型结......
带掩码的自编码器（MAE）最新的相关论文推荐
1、HeterogeneousGraphMaskedAutoencodersYijunTian,KaiwenDong,ChunhuiZhang,ChuxuZhang,NiteshV.Chawlahttps://arxiv.org/pdf/2208.09957生......
谷歌自己的坑自己添 | 大改Transformer注意力，最终速度、内存利用率都大幅度提升（附源代
”计算机视觉研究院专栏作者：Edison_G长按扫描二维码关注我回复“谷歌”获取源代码简述：Google介绍了Performance，Transformer体系结构，它可以估计具有可证明精度的正则(Softmax......
CVPR2020最佳检测 | 带有注意力RPN和多关系检测器的小样本目标检测网络（提供源码和数据
computerVision计算机视觉研究院1概要传统的目标检测方法通常需要大量的训练数据，并且准备这样高质量的训练数据是劳动密集型的（工作）。在本文中，我们提出了少量样本的目标检测......
一种基于注意力的Few-Shot目标检测统一框架（附论文下载）
公众号ID｜ComputerVisionGzq学习群｜扫码在主页获取加入方式论文地址：https://arxiv.org/pdf/2201.02052.pdf计算机视觉研究院专栏作者：Edison_GFew-Shot目标检测(FSOD)......

使用基于注意力的编码器-解码器实现医学图像描述

什么是图像描述

放射学中的图像描述

为什么这个问题很重要？

用深度学习来解决这个问题!

相关文章

赞助商

阅读排行