在使用基于Pytorch的DeeplabV3+模型（Bubbliiiing）训练以及预测时遇到的问题

时间：2024-07-03 19:02:08浏览次数：3

标签：name json value label Pytorch DeeplabV3 像素 path Bubbliiiing

原博：憨批的语义分割重制版9——Pytorch 搭建自己的DeeplabV3+语义分割平台-CSDN博客

github：https://github.com/bubbliiiing/deeplabv3-plus-pytorch

最近在使用Bubbliiing的deeplabv3+模型对自己的数据集进行训练时，使用博主提供的json_to_dataset.py对labelme标注的数据进行转换后，训练完的模型在预测结果时没有拉框的情况，原博的评论区下也有很多同学有这种情况，具体如下：

json_to_dataset.py代码：

import base64
import json
import os
import os.path as osp

import numpy as np
import PIL.Image
from labelme import utils


if __name__ == '__main__':
    # jpg原图路径
    jpgs_path   = "datasets/JPEGImages"
    # 标签图片输出路径
    pngs_path   = "datasets/SegmentationClass"
    classes     = ["_background_", "xxx"]

    # json文件路径
    count = os.listdir(r".\xml")
    for i in range(0, len(count)):
        path = os.path.join(r".\xml", count[i])

        if os.path.isfile(path) and path.endswith('json'):
            data = json.load(open(path))
            
            if data['imageData']:
                imageData = data['imageData']
            else:
                imagePath = os.path.join(os.path.dirname(path), data['imagePath'])
                with open(imagePath, 'rb') as f:
                    imageData = f.read()
                    imageData = base64.b64encode(imageData).decode('utf-8')

            img = utils.img_b64_to_arr(imageData)
            label_name_to_value = {'_background_': 0}
            for shape in data['shapes']:
                label_name = shape['label']
                if label_name in label_name_to_value:
                    label_value = label_name_to_value[label_name]
                else:
                    label_value = len(label_name_to_value)
                    label_name_to_value[label_name] = label_value
            
            # label_values must be dense
            label_values, label_names = [], []
            for ln, lv in sorted(label_name_to_value.items(), key=lambda x: x[1]):
                label_values.append(lv)
                label_names.append(ln)
            assert label_values == list(range(len(label_values)))
            
            lbl = utils.shapes_to_label(img.shape, data['shapes'], label_name_to_value)
            
                
            PIL.Image.fromarray(img).save(osp.join(jpgs_path, count[i].split(".")[0]+'.jpg'))

            new = np.zeros([np.shape(img)[0],np.shape(img)[1]])
            for name in label_names:
                index_json = label_names.index(name)
                index_all = classes.index(name)
                new = new + index_all*(np.array(lbl) == index_json)

            utils.lblsave(osp.join(pngs_path, count[i].split(".")[0]+'.png'), new)
            print('Saved ' + count[i].split(".")[0] + '.jpg and ' + count[i].split(".")[0] + '.png')

训练时的损失值也很不科学：

又计算了miou值，好嘛（你看看你给孩子学了什么！）：

解决办法：

首先怀疑VOC标注图片的像素值的问题，非博主所说的目标区域像素值为1，背景区域像素值为0，用代码遍历统计voc标注图片的所有像素值：

from PIL import Image
import numpy as np

# 图像路径
image = Image.open(r'path.png')

# 转换为NumPy数组
image_array = np.array(image)

# 统计每个像素值的数量
unique, counts = np.unique(image_array, return_counts=True)

# 打印结果
pixel_counts = dict(zip(unique, counts))
for pixel_value, count in pixel_counts.items():
    print(f'像素值 {pixel_value}: {count} 个')

运行结果发现：

~~嘿！您猜怎么着？~~，使用博主提供的json_to_datasets.py代码转完之后的像素值会因为不明原因异常，需要手动修改一下，添加代码：

# 令所有非0像素值点为1
image_array[image_array != 0] = 1

#这里要根据自己实际标注的标签数量来确定像素值，我的标签只有一个所以目标区域为1，背景为0

再统计一下试试：

批量将png图片的像素值全部修改完成之后再重新进行训练，训练过程就正常多了，预测结果也可以正常拉框显示区域了(预测结果就不放了)：

损失值：

mIoU:

~~又可以愉快的炼丹了~~

总结

可能是环境配置和库版本不一的问题或是其他玄学问题，运行博主提供的json_to_datasets.py会导致原本应该像素值为1的点会乱掉（

所以就像原博主说的，请仔细检查一下自己的数据集的格式和像素值的问题！

其他问题请参考原博主的帖子神经网络学习小记录-番外篇——常见问题汇总_loading weights into state dict... killed-CSDN博客

标签：name,json,value,label,Pytorch,DeeplabV3,像素,path,Bubbliiiing
From： https://blog.csdn.net/m0_61145631/article/details/140125107

使用 PyTorch 创建的多步时间序列预测的 Encoder-Decoder 模型
Encoder-decoder模型在序列到序列的自然语言处理任务（如语言翻译等）中提供了最先进的结果。多步时间序列预测也可以被视为一个seq2seq任务，可以使用encoder-decoder模型来处理。本文提供了一个用于解决Kaggle时间序列预测任务的encoder-decoder模型，并介绍了获得前10%结果......
【打卡】003 p3 Pytorch实现天气识别
打卡～555我的环境：●语言环境：Python ●编译器：jupyternotebook●深度学习环境：Pytorch>-**......
解决PyTorch中的`CUDA out of memory`错误
解决PyTorch中的`CUDAoutofmemory`错误解决PyTorch中的`CUDAoutofmemory`错误......
动手学深度学习5.6 GPU-笔记&练习（PyTorch）
以下内容为结合李沐老师的课程和教材补充的学习笔记，以及对课后练习的一些思考，自留回顾，也供同学之人交流参考。本节课程地址：17使用和购买GPU【动手学深度学习v2】_哔哩哔哩_bilibili本节教材地址：5.6.GPU—动手学深度学习2.0.0documentation(d2l.ai)本节开源代码：...>d......
动手学深度学习（Pytorch版）代码实践 -计算机视觉-39实战Kaggle比赛：狗的品种识别（ImageNet
39实战Kaggle比赛：狗的品种识别（ImageNetDogs）比赛链接：DogBreedIdentification|Kaggle1.导入包importtorchfromtorchimportnnimportcollectionsimportmathimportosimportshutilimporttorchvisionfromd2limporttorchasd2limportmatplotlib.pyplo......
动手学深度学习（Pytorch版）代码实践 -计算机视觉-44目标检测算法综述：R-CNN、SSD和YOLO
41~44目标检测算法综述：R-CNN、SSD和YOLO1.区域卷积神经网络(R-CNN系列)1.1R-CNN使用启发式搜索算法来选择锚框。使用预训练模型对每个锚框提取特征（每个锚框视为一张图片，使用CNN提取特征）。训练SVM进行类别分类（在神经网络之前进行）。训练线性回归模型预测边界框偏移......
动手学深度学习（Pytorch版）代码实践 -计算机视觉-49风格迁移
49风格迁移读入内容图像：importtorchimporttorchvisionfromtorchimportnnimportmatplotlib.pylabaspltimportliliPytorchaslpfromd2limporttorchasd2l#读取内容图像content_img=d2l.Image.open('../limuPytorch/images/rainier.jpg')plt.im......
动手学深度学习（Pytorch版）代码实践 -计算机视觉-48全连接卷积神经网络（FCN）
48全连接卷积神经网络（FCN）1.构造函数importtorchimporttorchvisionfromtorchimportnnfromtorch.nnimportfunctionalasFimportmatplotlib.pyplotaspltimportliliPytorchaslpfromd2limporttorchasd2l#构造模型pretrained_net=torchvision.......
动手学深度学习（Pytorch版）代码实践 -计算机视觉-47转置卷积
47转置卷积importtorchfromtorchimportnnfromd2limporttorchasd2l#输入矩阵X和卷积核矩阵K实现基本的转置卷积运算deftrans_conv(X,K):h,w=K.shapeY=torch.zeros((X.shape[0]+h-1,X.shape[1]+w-1))foriinrange(X.shape......
transformer在图像分类上的应用以及pytorch代码实现_transformer 图片分类
本文简单介绍transformers的原理，主要介绍transformers如何应用在图像分类上的任务。1.对transformers的简单介绍transformers在自然语言处理领域有着天然的优势，transformers改进了RNN(循环神经网络)训练慢，不能够建立序列之间的长期依赖，记忆消失的缺点。transformers的核心......

在使用基于Pytorch的DeeplabV3+模型（Bubbliiiing）训练以及预测时遇到的问题

相关文章

赞助商

阅读排行