工业上的质检领域,是AI的一个重要应用方向,主要是计算机视觉CV的主攻方向。
图1描述了深度学习技术路线的发展简图,AI质检领域主要使用卷积神经网络(CNN)提取工业场景下的视频或图像特征,然后做分类、检测、分割、目标追踪等任务。
图1 深度学习技术发展简图
在工业场景下的分类、检测任务,其数据集特点往往是良率很高,要定位缺陷位置及种类,经常面临缺少缺陷数据的困境,而CV技术发展到目前的YOLOv8阶段,检测技术其实已经非常成熟和稳定,因此工业场景下的视觉任务,基本等价于小样本处理任务,也基本等价于数据增强手段的增加缺陷样本,因为数据的质量,决定了模型性能的上限。
为了提高缺陷样本的数量,业内的尝试大概经历了三个阶段:
1) 第一个阶段,对原始缺陷样本随机添加噪声、随机调整亮度/对比度/饱和度等图像参数、随机旋转/裁减图片等手段,人为地增加了一些缺陷样本,这种方式也达到了一定的效果,但其实际增加的缺陷样本数量,还是非常有限的,因此后面有人提出用GAN、VAE加随机噪声的方式。
2) 通过GAN、VAE生成式的方式,产生缺陷样本的思路,也达到了一定的效果,但这种方式会产生一定概率的样本失真问题,况且GAN/VAE倾向于生成和原样本“一样”的图片,由于其原理所导致,因此GAN/VAE对增加缺陷样本的效果,也是有限的。
3) Diffusion技术应用阶段,基于Markov链的扩散模型,为创意型图像的生成,以及可控条件下的图像生成等任务,提供了可能,从DDPM发展到LDM,再进一步发展到Stable Diffusion,进入到了CV大模型阶段,为更逼真地生成特定任务下的缺陷样本,提供了技术支持。Diffusion技术结合VAE、UNet、Vit等技术,可结合多模态数据,可控地生成指定风格的图像。
作为深度学习之父们中的LeCun在《Gradient-Based Learning Applied to Document Recognition》中告诉我们,无论什么样的机器学习模型,无外乎图2中的机器学习模型范式,第一步是提取输入数据的特征,俗称特征工程,第二步是训练分类器或回归器,
图2 机器学习模型范式
图3是对图2机器学习模型流程的细化,输入数据需先经过数据预处理阶段,将缺失的值该补充的补充,该统一量纲的统一量纲,该归一化/标准化的,就归一化/标准化,以使输入数据满足模型的要求。然后数据流进入特征工程阶段,通过人为手工挑选、组合原始特征,或模型自己学习如何挑选及组合特征,然后将特征工程的处理结果,输入给模型做训练或推理计算,并得到最终结果。而成像处理,属于特征工程阶段的人为干预产生更利于模型计算的特征。
图3 机器学习数据处理流程
关注更多安卓开发、AI技术、股票分析技术及个股诊断等理财、生活分享等资讯信息,请关注本人公众号(木圭龙的知识小屋)
标签:AI,模型,样本,VAE,学习,概况,质检,缺陷 From: https://www.cnblogs.com/tgltt/p/18516212