采用 ResNet50 与 ResNet152 深 度学习模型作为基础架构,通过层叠多个卷积层、池化层和全连接层来实现特征提取和分类任务。并利用 蔬果图像数据集进行模型训练,并采用数据增强技术 来扩充训练数据并减少过拟合问题。再通过 VGG19 模型处理结果作为参考。 经过实验证明,所提出的基于 ResNet50 深度学 习模型的蔬果识别处理小批量数据集上准确性和鲁棒性方面表现良好。
本项目中采用蔬果数据集大小为 2909,共 36 个 蔬果类别,分别是苹果、杏子、姜、葡萄柚、梨子、 辣椒、鳄梨、葡萄、草药、菠萝、火龙果、李子、香 蕉、豆子、刺角瓜、白菜、杨桃、奇异果、石榴、金 桔、韭菜、土豆、胡萝卜、南瓜、萝卜、花椰菜、柠 檬、芹菜、青柠、红甜菜、菌子、芒果、沙拉菜、樱 桃、圣女果、山竹、甜瓜、小柑橘、番茄、椰子、蘑 菇、萝卜、黄瓜、油桃、西葫芦、李子、洋葱、茄子、 茴香、橘子、百香果、大蒜、桃子。按照 8:2 的比 例划分数据集和测试集,通过测试集来验证模型的准 确度,如图 1 所示。
2 数据预处理 本实验中的数据预处理主要包括了图像的加载和 转换操作。代码通过 torchvision 库中的 transforms 模 块定义了一个 data_transform 的数据转换操作,其中包括了对图像的预处理步骤: 1)图像的缩放和裁剪:使 transforms.Resize(256) 将图像大小调整为 256x256,然后再使用 transforms. CenterCrop(224)对图像进行中心裁剪,将其裁剪为 224x224 的大小。 2)图像数据转换:使用 transforms.ToTensor()将 图像数据转换为张量形式,并使 transforms.Normalize()对图像进行标准化处理,其中 给定了均值和标准差。 本项目的数据预处理主要是针对图像数据的预处 理,包括了缩放、裁剪和标准化等操作,以便于输入到深度学习模型进行预测。
项目获取:
链接:https://pan.quark.cn/s/dae75d09b1da
提取码:cE5K