首页 > 其他分享 >[GAN][图片异常检测]Unsupervised Anomaly Detection withGenerative Adversarial Networks to GuideMarker Disco

[GAN][图片异常检测]Unsupervised Anomaly Detection withGenerative Adversarial Networks to GuideMarker Disco

时间:2024-09-29 19:52:44浏览次数:3  
标签:withGenerative 判别 Unsupervised 异常 生成器 生成 图像 健康 Anomaly

论文背景与目标:

        本文旨在将GAN运用到图片异常检测中,并取得了一定的效果,该模型不仅能够检测已知的异常,还能够发现未曾标注的新异常。

    • 提出了结合GAN的生成和判别功能的新型异常评分方法。
    • 在无监督的前提下实现了异常图像的分割。
    • 通过利用GAN的潜在空间,提出了新的图像映射和特征匹配方法,使得异常检测更加准确。

论文核心思想

        本文主要通过GAN学习正常样本,获得正常样本的分布特征。在预测阶段,模型将图片还原重构,因为系统中缺少异常样本的信息,所以当异常样本进入系统时,不能被正常重构,因而被鉴定为异常,同时因为只有异常区域会被错误重构,我们也可以借此定位异常区域,实现图片分割,本论文实质上也是经典的A reconstructive and discriminative anomaly detection model,通过重建图片来实现异常检测。

网络架构:

1. 生成器(Generator)

  • 生成器的任务是从**潜在空间(latent space)中的随机噪声向量 zzz 生成逼真的健康图像。生成器是一个卷积解码器,它通过一系列反卷积层(fractionally-strided convolutional layers)**将噪声向量逐步转换为高维图像。
  • 具体的层次结构包括四层反卷积层,每一层都使用5x5大小的卷积核,并逐层减少通道数:
    • 第一层:512个通道
    • 第二层:256个通道
    • 第三层:128个通道
    • 第四层:64个通道
  • 最终输出的图像大小为 64×64 像素,是一个灰度图像。

2. 判别器(Discriminator)

  • 判别器的任务是区分输入图像是来自真实数据集的健康图像,还是生成器生成的图像。它是一个标准的卷积神经网络(CNN),通过一系列卷积层提取特征,并最终输出一个标量,表示输入图像是“真实”的概率。
  • 判别器同样由四层卷积层组成,每层的卷积核大小也是5x5:
    • 第一层:64个通道
    • 第二层:128个通道
    • 第三层:256个通道
    • 第四层:512个通道
  • 判别器通过对生成图像和真实图像进行分类,不断提升自身的判别能力,同时也迫使生成器生成更加逼真的图像。

3. 映射机制(Mapping from Image to Latent Space)

  • GAN模型生成的是从潜在空间到图像空间的映射,但论文中额外提出了一种将图像映射回潜在空间的方法。这种映射机制通过反向传播调整潜在向量 zzz,使生成的图像与输入图像尽可能相似。映射过程通过残差损失判别器损失来优化:
    • 残差损失:衡量生成图像与输入图像在像素级别的差异。
    • 判别器损失:衡量生成图像在判别器中与真实图像的特征差异。

4. 网络训练与优化

  • 网络的训练使用Adam优化器,生成器和判别器通过两人零和博弈(minimax game)共同训练。
  • 判别器的目标是最大化区分真实图像和生成图像的概率,而生成器的目标是欺骗判别器,使其无法区分生成图像和真实图像。

任务描述:

假设我们有大量健康视网膜的光学相干断层扫描(OCT)图像,这些图像显示了正常视网膜的结构。我们的目标是使用 AnoGAN 来检测视网膜图像中是否存在异常,比如视网膜液体或病变区域。

步骤 1:模型训练

在训练阶段,AnoGAN 仅使用健康视网膜图像(无任何异常标记的数据)进行训练。

  1. 生成器(Generator)训练

    • 生成器从潜在空间中采样一个随机向量 zzz,通过生成器网络生成健康视网膜图像。
    • 生成器的目标是尽量生成逼真的健康图像,使判别器难以区分它们是真实的还是生成的。
  2. 判别器(Discriminator)训练

    • 判别器接受真实的健康视网膜图像和生成器生成的图像,学习如何区分这两者。
    • 判别器的目标是最大化识别真实图像和生成图像之间的差异,从而帮助生成器提高生成图像的质量。
  3. 对抗训练(Adversarial Training)

    • 生成器和判别器通过对抗训练,逐渐提高各自的能力。生成器生成的图像越来越逼真,判别器也不断学习如何更好地区分真实图像和伪造图像。
  4. 健康图像的潜在表示学习

    • 最终,生成器学会了从潜在空间中的点 zzz 生成符合健康图像分布的视网膜图像。
    • 判别器同时作为特征提取器,学习到了健康图像的特征表示。

步骤 2:测试阶段(异常检测)

在测试阶段,AnoGAN 被用于检测输入的视网膜图像是否含有异常(如液体或病变区域)。

  1. 输入测试图像

    • 假设现在我们有一张未标注的视网膜图像,这张图像可能是健康的,也可能包含异常(如视网膜液体)。
    • 我们的目标是判断这张图像是否与训练阶段的健康图像分布相符,即是否存在异常。
  2. 映射到潜在空间

    • 为了判断这张图像是否异常,AnoGAN 需要将输入的测试图像映射回训练时使用的潜在空间。
    • 具体来说,模型通过一个优化过程来找到潜在空间中的一个点 zzz,使得生成器生成的图像 G(z)G(z)G(z) 与输入的测试图像尽可能相似。
    • 这个过程通过残差损失(衡量生成图像与输入图像在像素上的差异)和判别器损失(衡量生成图像与健康图像分布的差异)来完成。
  3. 计算异常评分

    • 当找到最接近的潜在空间点 zzz 后,模型计算异常评分。异常评分由两部分组成:
      • 残差分数:生成图像与输入图像的像素差异。
      • 判别器分数:生成图像与健康图像在判别器特征空间中的差异。
    • 如果这个评分较低,意味着输入图像非常符合健康图像的分布,说明它可能是健康的;如果评分较高,说明图像与健康图像有较大差异,可能存在异常。
  4. 异常检测结果

    • 根据异常评分,模型可以判断输入图像是否异常。如果分数高,说明输入图像与生成的健康图像差异较大,模型会标记该图像为异常。
    • 此外,AnoGAN 还可以通过残差图(即输入图像与生成图像的差异)来定位异常区域,例如视网膜液体或病变的具体位置。

总结

        该论文展示了GAN在医学图像异常检测中的潜力,通过无监督学习方法,有效地检测已知和未知的异常结构,有助于推动标记发现和疾病诊断。

标签:withGenerative,判别,Unsupervised,异常,生成器,生成,图像,健康,Anomaly
From: https://blog.csdn.net/wwwwwsssllll/article/details/142640476

相关文章

  • [对比学习][何凯明]Momentum Contrast for Unsupervised Visual Representation Learn
    论文背景:    本文由何凯明先生主笔,在原先的对比学习模型---如SIMCLR中,需要大量的负样本以供系统学习其特征分布,但是在多数场景下,样本空间中往往负样本不足或过大,比如在一个百万用户量级的推荐系统中,若将与目标用户不像关系的用户视为负样本,则时间计算度会非常大,基本......
  • Paper Reading(1)-VarietySound: Timbre-Controllable Video to Sound Generation via U
    VarietySound:Timbre-ControllableVideotoSoundGenerationviaUnsupervisedInformationDisentanglement来源:https://doi.org/10.48550/arXiv.2211.10666https://conferencedemos.github.io/icassp23/主要贡献:1)定义了一个新的任务,称为timbre-controlledvideo-to-audi......
  • 论文阅读:Unsupervised Representation Learning with Deep Convolutional Generative
    Abstract背景:希望能缩小CNN在监督学习和无监督学习之间成功应用的差距。贡献:引入了一类称为深度卷积生成对抗网络(DCGAN)的CNN。结果:DCGAN在生成器和判别器中都能从对象到场景学习表示层次结构。1.Introduction贡献:提出DCGAN用于图像分类任务,展示其性能对滤波器......
  • AnomalyLLM: Few-shot Anomaly Edge Detection for Dynamic Graphs using Large Langu
    本文是LLM系列文章,针对《AnomalyLLM:Few-shotAnomalyEdgeDetectionforDynamicGraphsusingLargeLanguageModels》的翻译。AnomalyLLM:使用大型语言模型对动态图进行少量异常边缘检测摘要1引言2相关工作3前言4方法5实验6结论摘要检测动态图的......
  • 3D异常检测最新论文《Complementary Pseudo Multimodal Feature for Point Cloud Anom
        本文是曹云康24年投稿至《PattenRecognition》的文章,是目前在MVTec3D-AD数据集上的3D异常检测SOTA。之所以被分类到3D异常检测类别,是因为这篇文章中仅使用了点云数据进行检测,未使用RGB模态。同样,文章中也指出了它所使用的多模态其实是“伪模态”,是将点云投影到2......
  • openGauss-Anomaly_detection_数据库指标采集_预测与异常监控
    Anomaly-detection:数据库指标采集、预测与异常监控可获得性本特性自openGauss1.1.0版本开始引入。特性简介anomaly_detection是openGauss集成的、可以用于数据库指标采集、预测以及异常监控与诊断的AI工具,是dbmind套间中的一个组件。支持采集的信息包括IO_Read、IO_Write、CPU......
  • 论文解读Multi-Prompt Alignment for Multi-Source Unsupervised Domain Adaptation
    Multi-PromptAlignmentforMulti-SourceUnsupervisedDomainAdaptationNeurlIPS2023摘要大多数现有的无监督域适应(UDA)方法依赖于共享网络来提取领域不变特征。无论如何,当面对多个源域时,优化这样的网络涉及更新整个网络的参数,这样既昂贵又有挑战性,特别是与最小最大......
  • 异常检测(Anomaly Detection) 原理与代码实例讲解
    异常检测(AnomalyDetection)-原理与代码实例讲解关键词:异常检测、离群值检测、异常值识别、异常模式检测、异常行为识别、统计方法、机器学习方法、深度学习方法、时间序列分析、数据挖掘、实时监控、故障预警、安全性提升、工业自动化、医疗健康、金融风控1.背景介......
  • MCM: Masked Cell Modeling for Anomaly Detection in Tabular Data(论文研读)
    Notice:此篇文章为论文精读。Paper来源:点我跳转Abstract解决了表格数据(即结构化数据)中的异常检测问题——通常由one-class分类(只有一个类别或类别的样本集用于训练模型。通常,这个类别包含所谓的正常或良性样本,而异常样本或异常类别是未知的或未在训练数据中包含的)设置实现......
  • 阅读笔记:DualGAN: Unsupervised Dual Learning for Image-to-Image Translation
    以下是原论文分析,欢迎指正~DualGAN:用于图像转换的无监督双向学习作者:ZiliYi、Hao(Richard)Zhang、PingTan和MinglunGong纽芬兰纪念大学西蒙弗雷泽大学摘要  使用条件生成对抗网络(conditionalGAN)进行跨域图像转换在过去一年中取得了重大改进.根据任务的复杂程度......