基于CNN卷积神经网络迁移学习的图像识别实现

标签：图像识别训练卷积模型 torch train CNN ft model

基于CNN卷积神经网络迁移学习的图像识别实现

基于CNN卷积神经网络迁移学习的图像识别实现

基于CNN卷积神经网络迁移学习的图像识别实现

写在前面

笔者是一名ADAS底层软件工程师。在繁忙的嵌入式软件开发工作之余，我对新技术的保持浓厚兴趣。
近年来，深度学习特别是卷积神经网络（CNN）的迅猛发展。
尽管我的主要工作集中在车载系统和嵌入式应用，但我深知新技术对未来的巨大潜力。
因此，我自学CNN及其在迁移学习中的应用，并希望将自己的学习经验整理成文。
这篇博客不仅是我个人学习的总结，也是希望为那些对CNN迁移学习感兴趣的同学提供实用的参考。
通过这篇笔记，我将分享一些关键概念和部署经验，包括如何进行模型微调、固定特征提取器的使用方法，以及如何利用训练好的模型进行实际预测。
我真诚希望这篇博客能对大家有所帮助，欢迎大家在评论区留言交流，共同探讨和学习！

一，原理介绍

们常常将迁移学习和神经网络的训练上存在误区将其混为一谈。实际上，这两个概念最初是独立的。迁移学习是机器学习的一个分支，其中有许多方法并不依赖于神经网络。然而，随着神经网络的快速发展、强大能力和广泛应用，迁移学习的研究逐渐与神经网络紧密联系起来。

迁移学习(transfer learning)通俗来讲，就是运用已有的知识来学习新的知识，核心是找到已有知识
和新知识之间的相似性，用成语来说就是举一反三。由于直接对目标域从头开始学习成本太高，我
们故而转向运用已有的相关知识来辅助尽快地学习新知识。比如，已经会下中国象棋，就可以类比
着来学习国际象棋:已经会编写Java程序，就可以类比着来学习C#;已经学会英语，就可以类比着
来学习法语;等等。世间万事万物皆有共性，如何合理地找寻它们之间的相似性，进而利用这个桥
梁来帮助学习新知识，是迁移学习的核心问题。

迁移学习的基本方法

1.样本迁移（Instance based TL）

在源域中找到与目标域相似的数据，把这个数据的权值进行调整，使得新的数据与目标域的数据进行匹配。下图的例子就是找到源域的例子3，然后加重该样本的权值，使得在预测目标域时的比重加大。优点是方法简单，实现容易。缺点在于权重的选择与相似度的度量依赖经验，且源域与目标域的数据分布往往不同。
在这里插入图片描述

2.特征迁移（Feature based TL）

假设源域和目标域含有一些共同的交叉特征，通过特征变换，将源域和目标域的特征变换到相同空间，使得该空间中源域数据与目标域数据具有相同分布的数据分布，然后进行传统的机器学习。优点是对大多数方法适用，效果较好。缺点在于难于求解，容易发生过适配。

在这里插入图片描述

3.模型迁移（Parameter based TL）

假设源域和目标域共享模型参数，是指将之前在源域中通过大量数据训练好的模型应用到目标域上进行预测，比如利用上千万的图象来训练好一个图象识别的系统，当我们遇到一个新的图象领域问题的时候，就不用再去找几千万个图象来训练了，只需把原来训练好的模型迁移到新的领域，在新的领域往往只需几万张图片就够，同样可以得到很高的精度。优点是可以充分利用模型之间存在的相似性。缺点在于模型参数不易收敛。

在这里插入图片描述

4.关系迁移（Relation based TL）

假设两个域是相似的，那么它们之间会共享某种相似关系，将源域中逻辑网络关系应用到目标域上来进行迁移，比方说生物病毒传播到计算机病毒传播的迁移。

在这里插入图片描述

对于CNN的迁移学习网上有很多大神的讲解都非常精彩，笔者只是简单介绍基本的概念，只要呢让大家明白为什么要进行迁移学习足以，我们还是着手实践，格物致知。

文章推荐：
链接: 微软亚洲研究院对迁移学习问题的回答

二. 准备工作

关于开发环境笔者是用Anaconda+PyCharm，个人认为这样包管理和开发都比较方便，当然因人而异，适合自己就好

1.依赖库安装

我将CondaList打出来，各位对照着版本安装就可以conda list

# Name                    Version                   Build  Channel
ca-certificates           2024.7.2             haa95532_0    defaults
contourpy                 1.1.1                    pypi_0    pypi
cycler                    0.12.1                   pypi_0    pypi
filelock                  3.15.4                   pypi_0    pypi
fonttools                 4.53.1                   pypi_0    pypi
fsspec                    2024.6.1                 pypi_0    pypi
importlib-resources       6.4.4                    pypi_0    pypi
kiwisolver                1.4.5                    pypi_0    pypi
libffi                    3.4.4                hd77b12b_1    defaults
matplotlib                3.7.5                    pypi_0    pypi
mpmath                    1.3.0                    pypi_0    pypi
networkx                  3.1                      pypi_0    pypi
numpy                     1.24.4                   pypi_0    pypi
openssl                   3.0.14               h827c3e9_0    defaults
pillow                    10.4.0                   pypi_0    pypi
pip                       24.2             py38haa95532_0    defaults
pyparsing                 3.1.4                    pypi_0    pypi
python                    3.8.19               h1aa4202_0    defaults
python-dateutil           2.9.0.post0              pypi_0    pypi
setuptools                72.1.0           py38haa95532_0    defaults
six                       1.16.0                   pypi_0    pypi
sqlite                    3.45.3               h2bbff1b_0    defaults
sympy                     1.13.2                   pypi_0    pypi
torchvision               0.19.0                   pypi_0    pypi
typing-extensions         4.12.2                   pypi_0    pypi
vc                        14.40                h2eaa2aa_0    defaults
vs2015_runtime            14.40.33807          h98bb1dd_0    defaults
wheel                     0.43.0           py38haa95532_0    defaults

2.IDE设置

其实这就是Anaconda+PyCharm开发的方便之处了，直接新建项目并选择刚刚创建的conda环境就可以愉快的编写代码了。
在这里插入图片描述

下面是文件结构，所有的代码都写在main.py里了，所以创建python工程时直接生成一个mian文件就可以
这里是数据集下载链接

标签：图像识别,训练,卷积,模型,torch,train,CNN,ft,model
From： https://blog.csdn.net/weixin_43798715/article/details/141891533

基于CNN卷积神经网络迁移学习的图像识别实现

基于CNN卷积神经网络迁移学习的图像识别实现