13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广

时间：2023-08-13 17:32:50浏览次数：39

标签：torchvision img 增广 0.5 transforms 图像 apply 13.1

一.图像增广的好处

随机改变训练样本可以减少模型对某些属性的依赖,从而提高模型的泛化能力。

裁剪图像可以减少模型对于对象出现位置的依赖

以不同的方式裁剪图像,使感兴趣的对象出现在不同的位置,减少模型对于对象出现位置的依赖

调整亮度、颜色等因素可以降低模型对颜色的敏感度。

二.代码实现：展示原图片

使用如下图片进行测试：

13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广_改变颜色

%matplotlib inline
import torch
import torchvision
from torch import nn
from d2l import torch as d2l
import time

# 不用opencv显示，而是用如下方式显示是因为，它可以显示在jupter网页上
d2l.set_figsize()
img = d2l.Image.open('../data/images/bird.jpg')
d2l.plt.imshow(img);

13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广_Image_02

# 定义图像增广函数：aug接收图像增广的方法，scale是显示的比例
def apply(img, aug, num_rows=2, num_cols=4, scale=1.5):
    Y = [aug(img) for _ in range(num_rows * num_cols)]
    d2l.show_images(Y, num_rows, num_cols, scale=scale)

二.代码实现：对原图片翻转和裁减

2.1 水平翻转

apply(img, torchvision.transforms.RandomHorizontalFlip())

13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广_代码实现_03

2.2 上下翻转

apply(img, torchvision.transforms.RandomVerticalFlip())

13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广_改变颜色_04

2.3 随机裁减，使目标物体以不同的比例出现在图像的不同位置，降低对目标位置的敏感

'''
    在我们使用的示例图像中,猫位于图像的中间,但并非所有图像都是这样。
    汇聚层可以降低卷积层对目标位置的敏感性。可以通过对图像进行随机裁剪,使物体以不同的比例出现在图像的不同位置。这也可以降低模型对目标位置的敏感性。
'''
# 随机裁剪一个面积为原始面积10%到100%的区域,该区域的宽高比从0.5〜2之间随机取值。然后,区域的宽度和高度都被缩放到200像素
shape_aug = torchvision.transforms.RandomResizedCrop(
    (200, 200), scale=(0.1, 1), ratio=(0.5, 2))
apply(img, shape_aug)

13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广_代码实现_05

三.代码实现：改变颜色

3.1 改变亮度

''' 另一种增广方法是改变颜色。我们可以改变图像颜色的四个方面:亮度、对比度、饱和度和色调。在下面的示例中,我们随机更改图像的亮度,随机值为原始图像的 50%(1 − 0.5)到150%(1 + 0.5)之间。 '''

apply(img, torchvision.transforms.ColorJitter(
    brightness=0.5, contrast=0, saturation=0, hue=0))

13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广_改变颜色_06

3.2 改变对比度

'''
    对比度为原始图像的 50%(1 − 0.5)到150%(1 + 0.5)之间。
'''
apply(img, torchvision.transforms.ColorJitter(
    brightness=0, contrast=0.5, saturation=0, hue=0))

13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广_代码实现_07

3.3 改变饱和度

# 饱和度为原始图像的 50%(1 − 0.5)到150%(1 + 0.5)之间。
apply(img, torchvision.transforms.ColorJitter(
    brightness=0, contrast=0, saturation=0.5, hue=0))

13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广_改变颜色_08

3.4 改变色调

# 色调为原始图像的 50%(1 − 0.5)到150%(1 + 0.5)之间。
apply(img, torchvision.transforms.ColorJitter(
    brightness=0, contrast=0, saturation=0, hue=0.5))

13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广_Image_09

3.5 随机更改图像的亮度(brightness)、对比度(contrast)、饱和度(saturation)和色调(hue)

# 我们还可以创建一个RandomColorJitter实例,并设置如何同时随机更改图像的亮度(brightness)、对比度(contrast)、饱和度(saturation)和色调(hue)。
color_aug = torchvision.transforms.ColorJitter(
brightness=0.5, contrast=0.5, saturation=0.5, hue=0.5)
apply(img, color_aug)

13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广_代码实现_10

四.代码实现：结合多种图像增广方法

augs = torchvision.transforms.Compose([
torchvision.transforms.RandomHorizontalFlip(), color_aug, shape_aug])
apply(img, augs)

13.1.1 翻转裁减，改变颜色，结合多种图像增广方法进行图像增广_代码实现_11

标签：torchvision,img,增广,0.5,transforms,图像,apply,13.1
From： https://blog.51cto.com/u_16207976/7068229

图像处理技巧形态学滤波之膨胀操作
1.引言欢迎回来，我的图像处理爱好者们！今天，让我们继续研究图像处理领域中的形态学计算。在本篇中，我们将重点介绍腐蚀操作的反向效果膨胀操作。闲话少说，我们直接开始吧！2.膨胀操作原理膨胀操作为腐蚀操作的作用相反，这是图像处理中最常使用的另一种形态学操作，它主要通过在图像边界上扩......
基于affine+sift+GTM算法的图像配准和三维重建算法matlab仿真
1.算法理论概述在计算机视觉和图像处理领域，图像配准和三维重建是两个重要的研究方向。图像配准是指将多幅图像中的同一场景进行对齐，使得它们在同一坐标系下，以便进行后续的图像处理和分析。三维重建则是指将多幅图像中的二维信息重建成三维信息，以便进行三维可视化......
安装Virtualbox Install Virtualbox in Ubuntu 13.10/13.04/12.10/12.04 using PPA
VirtualBoxisapowerfulOpenSourcevirtualizationsoftwarefromOracle,WhichsupportsLinux,WindowsandMacOS.CurrentstablereleaseisVirtualBox4.3.RecommendedwayofinstallingVirtualboxinUbuntu/LinuxMintisbyaddingPPAtoyourrepositor......
图像处理技巧形态学滤波之腐蚀操作
1.引言欢迎回来，我的图像处理爱好者们！今天，让我们深入研究图像处理领域中的形态学计算。这些非线性的图像处理技术允许我们操纵图像中对象的形状和结构。在本系列中，我们将依次介绍四种基本的形态学操作：腐蚀、膨胀、开操作和闭操作。闲话少说，我们直接开始吧！2.腐蚀操作原理腐蚀是常见......
鲁棒图像哈希
鲁棒图像哈希标题页:鲁棒图像哈希目录页一、背景介绍图像哈希的概念、意义和应用场景图像哈希面临的问题与研究现状二、关键技术概述基于局部和全局特征的哈希基于特征降维的哈希基于统计特征的哈希基于学习的哈希基于深度学习的哈希方法三、典型算法案例基于Zernik......
数字图像处理
图像增强图像增强分为两类：空间域增强和频域增强灰度变换点对点的灰度映射\(g(x,y)=T[f(x,y)]\)很明显，在这个式子中可以看出，灰度变换只是一种对于像素值的改变基本灰度变换函数线性函数反转变换，恒等变换等图像反转将低灰度的像素变为高灰度，高灰度变为低灰度目的可以突出......
使用LabVIEW 实现物体识别、图像分割、文字识别、人脸识别等深度视觉
前言哈喽，各位朋友们，这里是virobotics（仪酷智能），这两天有朋友私信问之前给大家介绍的工具包都可以实现什么功能，最新的一些模型能否使用工具包加载，今天就给大家介绍一下博主目前使用工具包已经实现的深度视觉模型及案例下表为前期写过的一些范例介绍，朋友们可以按需点击查看名字......
图像处理，加速
遍历图片：关于Python使用numba加速图像遍历_python加速cv2代码_FlyDremever的博客-CSDN博客python日记(二)：密集计算加速（双重for循环为例）_pythonfor循环加速_五月的echo的博客-CSDN博客卷积时加速：python图像遍历优化的方法总结（以中值滤波为例）_陨星落云的博客-CSDN博客for循......
《VTK图形图像开发进阶》第3章VTK基本数据结构——不同类型的数据集
......
《VTK图形图像开发进阶》第3章VTK基本数据结构——属性数据
属性数据(AttributeData)是与数据集组织结构相关联的信息。3.1标量数据#include<vtkAutoInit.h>VTK_MODULE_INIT(vtkRenderingOpenGL2);VTK_MODULE_INIT(vtkRenderingFreeType);VTK_MODULE_INIT(vtkInteractionStyle);#include<vtkSmartPointer.h>#include<vtkPoint......