遥感影像-语义分割数据集：Postdam数据集详细介绍及训练样本处理流程

时间：2024-09-04 21:20:45浏览次数：13

标签：512 标签语义像素训练样本 tif Postdam 影像 255

原始数据集详情

Potsdam 数据集是一个有着2D 语义分割内容标注的城市遥感数据集。

Key	Value
卫星类型	未知
覆盖区域	一个典型的历史城市，有着大的建筑群、狭窄的街道和密集的聚落结构-Potsdam
场景	城市
分辨率	5cm
数量	38张
单张尺寸	6000*6000
原始影像位深	8位
标签图片位深	8位
原始影像通道数	三通道
标签图片通道数	三通道
官网	https://www.isprs.org/education/benchmarks/UrbanSemLab/Default.aspx

标签类别对照表

像素值	类别名（英文）	类别名（中文）	RGB
1	Impervious surfaces	不透光表面	255, 255, 255
2	Building	建筑	0, 0, 255
3	Low vegetation	低矮植被	0, 255, 255
4	Tree	树木	0, 255, 0
5	Car	汽车	255, 255, 0
6	Clutter/background	背景	255, 0, 0

数据处理部分

大家是否有这样的困惑？真值标签图片的像素值太小，比如1、2、3······，由于像素值太小，导致看上去标签图片全为黑色，无法看出真值标签与影像图片的像素位置是否对应？如果真值标签的像素值间隔太大，又无法直接作为训练样本。

其实有办法可以解决这个问题，那就是在像素值为1、2、3等的图片上添加一个彩色表，添加的彩色表不会改变图片的像素值，但是可以由彩色的视觉效果展示，如下图所示：
在这里插入图片描述

下面我们就对原始影像及标签进行模型训练前的数据预处理，根据这套数据集的原始信息，原作者整理的已基本接近训练条件，现在需要做的是根据自己训练模型的图片尺寸大小批量裁剪原始影像和标签为所需要的尺寸，比如512*512，另外如果需要检查裁剪后的数据是否一一对应，最好给标签数据添加颜色表，这样就可以轻易看出影像和真值标签是否一致。

下面就是使用代码对原始影像及原始标签进行批量裁剪为512*512大小，并给真值标签添加颜色表，效果图如下所示：

在这里插入图片描述

最后可以直接用于训练的数据集结构如下所示

/path/to/LoveDA
├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......

相关数据和代码见博主首页技术交流輑
01、官网原始数据集；
02、中间处理好的数据集；
03、裁剪后可训练的数据集；
04、裁剪影像及添加颜色表代码；

标签：512,标签,语义,像素,训练样本,tif,Postdam,影像,255
From： https://blog.csdn.net/qq_34578459/article/details/141688107

使用bert_base_chinese实现文本语义相似度计算
本文选择将模型下载到本地，进行离线分析计算，也可以使用在线下载，但本文略过1下载bert_base_chinese下载地址：https://huggingface.co/google-bert/bert-base-chinese/tree/main下载图上红框内的四个文件，并按照下图的目录结构放置bert-base-chinese文件夹里放2代码......
专业级语义搜索优化：利用 Cohere AI、BGE Re-Ranker 及 Jina Reranker 实现精准结果重
专业级语义搜索优化：利用CohereAI、BGERe-Ranker及JinaReranker实现精准结果重排1.简介1.1RAG在说重排工具之前，我们要先了解一下RAG。检索增强生成（RAG）是一种新兴的AI技术栈，通过为大型语言模型（LLM）提供额外的“最新知识”来增强其能力。基本的RAG应用包括四个关......
专业级语义搜索优化：利用 Cohere AI、BGE Re-Ranker 及 Jina Reranker 实现精准结果重
专业级语义搜索优化：利用CohereAI、BGERe-Ranker及JinaReranker实现精准结果重排1.简介1.1RAG在说重排工具之前，我们要先了解一下RAG。检索增强生成（RAG）是一种新兴的AI技术栈，通过为大型语言模型（LLM）提供额外的“最新知识”来增强其能力。基本的RAG应用包括四个关......
【Python机器学习】卷积神经网络（CNN）——语义理解
无论是人类还是机器，理解隐藏在文字背后的意图，对于倾听者或阅读者来说的，都是一项重要的技能。除了理解单个词的含义，词之间还有各种各样巧妙的组合方式。词的性质和奥妙与词之间的关系密切相关。这种关系至少有两种表达方式：词序词的临近度这些关系的模式以及词本身存在的模式......
艾体宝洞察丨透过语义缓存，实现更快、更智能的LLM应用程序
传统的缓存只存储数据而不考虑上下文，语义缓存则不同，它能理解用户查询背后的含义。它使数据访问更快，系统响应更智能，对GenAI应用程序至关重要。什么是语义缓存？语义缓存解释并存储用户查询的语义，使系统能够根据意图而不仅仅是字面匹配来检索信息。这种方法可以实现更细致入微的数据......
知识图谱——语义知识库的开端（1）
从最初的Google搜索，到如今的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统等各个领域，知识图谱的应用无处不在。知识图谱（KnowledgeGraph）的概念由Google在2012年正式提出，旨在打造更智能的搜索引擎，并在2013年后逐渐在学术界和工业......
图像字幕Image Captioning——使用语法和语义正确的语言描述图像
1.什么是图像字幕 ImageCaptioning（图像字幕生成）是计算机视觉和自然语言处理（NLP）领域的一个交叉研究任务，其目标是自动生成能够描述给定图像内容的自然语言句子。这项任务要求系统不仅要理解图像中的视觉内容，还要能够将这些视觉信息转化为具有连贯性和语义丰......
JSP基于隐语义模型的旅游推荐系统r4f0b--（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表系统功能：用户,景点类别,景点信息,游记路线,景点订票,景点退票开题报告内容一、研究背景与意义随着互联网技术的飞速发展，旅游行业逐渐向线上转移，但传统旅游推荐......
图解Kafka | 16张图讲透生产者交付语义
交付（传递）语义交付语义是在分布式消息系统（如Kafka）中，用来描述消息从生产者到达消息系统并最终被消费者消费时的可靠性保证。它主要涉及到消息是否能正确地被投递，及在什么情况下可能会出现消息丢失或重复的问题。根据Kafkabroker和生产者的配置，支持“最多一次”、“至少一......
Web语义化及实际应用
你好同学，我是沐爸，欢迎点赞、收藏和关注！今天一起了解下Web语义化及其应用吧！是什么？使用合适的标签、属性，让页面能“说话“，让人和机器都能快速理解网页内容。为什么？有利于被搜索引擎搜索有利于无障碍阅读增强代码的可读性、可维护性怎么做避免使用<div>或<span>标签来......

遥感影像-语义分割数据集：Postdam数据集详细介绍及训练样本处理流程

原始数据集详情

标签类别对照表

数据处理部分

相关文章

赞助商

阅读排行