ROI
ROI代表“感兴趣区域”(Region of Interest)。它指的是图像中被选定进行进一步分析或处理的那部分区域,这些区域被认为比图像的其他部分包含更多的有用信息。
仿射变换
建议看一下CSDN的文章https://blog.csdn.net/sinat_29957455/article/details/103845581
仿射变换(Affine Transformation)是一种二维坐标到二维坐标之间的线性变换,加上一个平移操作。在几何中,它能够实现对图像的缩放、旋转、平移和翻转等操作,同时保持图像中平行线的平行性不变(如果两条或多条线在变换前是平行的,它们在变换后仍然会保持平行)。
- 在pytorch中对应了torchvision.transforms这个模块
transforms.RandomAffine(degrees, translate=None, scale=None, shear=None): 随机进行仿射变换。degrees指定旋转角度范围translate指定平移范围,scale指定缩放范围,shear指定剪切范围。
transforms.Resize(size): 调整图像大小,这可以看作是仿射变换中的缩放操作。
transforms.Rotate(degrees): 对图像进行旋转,属于仿射变换的一种。
特征融合(什么是特征融合, 怎么融合, 如何代码实现)
- 定义
将来自不同源或不同层次的特征组合起来,以期望获得更加全面和强大的特征表示的过程。 - 怎么融合
将两个得到的卷积池化操作的张量进行拼接操作 。 - 如何代码实现
对应pytorch代码:
fused_feature = torch.cat((feature1, feature2), dim=1)
个人os: 这样拼接不久乱了吗?
GPT解答:特征融合的目的并不是简单地将特征混合在一起,而是有策略地结合不同特征的信息,以增强模型的表示能力和性能。当正确执行时,特征融合能够让模型利用不同来源或不同层次的特征之间的互补信息,而不是让特征变得“乱”。
数据集中域
"域"(Domain)通常指的是具有特定特征分布的数据集。
- 特征空间(Feature Space)
特征空间指的是数据的属性或特征构成的空间。不同的域可能有不同的特征空间或相同的特征空间但特征分布不同。 - 数据分布(Data Distribution)
数据分布是指数据在特征空间中的分布情况。即使两个域的特征空间相同,它们的数据分布也可能大不相同,这就导致了域之间的差异。 - 例子
在计算机视觉领域,"域"(Domain)指的是具有特定特征分布的图像或视频数据集。这些特征分布受到多种因素的影响,包括拍摄条件(如光照、背景)、对象类型(如人脸、汽车)、图像质量(如分辨率、噪声)等。
假设我们有两个图像数据集:
城市街景数据集:包含了拍摄于各种城市环境中的街道图像,特征分布可能包括高楼大厦、繁忙的交通、广告牌等元素。
农村街景数据集:包含了拍摄于农村或乡村环境中的街道图像,特征分布可能包括田野、农舍、树木、较少的车辆等元素。
这两个数据集就代表了两个不同的"域"。尽管它们都是街景图像,但由于拍摄背景和环境的不同,它们的视觉特征分布存在显著差异。