首页 > 其他分享 >遥感影像-语义分割数据集:LoveDA数据集详细介绍及训练样本处理流程

遥感影像-语义分割数据集:LoveDA数据集详细介绍及训练样本处理流程

时间:2024-09-04 21:20:57浏览次数:11  
标签:2522 标签 LoveDA 语义 像素 训练样本 tif 512 影像

原始数据集详情

构建了一个城市-农村域自适应地表覆盖数据集LoveDA,同时推进语义分割和迁移学习,LoveDA 数据集包含来自三个不同城市的5987张0.3m高分辨率影像和166,768个标注语义对象。

KeyValue
卫星类型未知
覆盖区域南京、常州、武汉
场景城市、农村
分辨率0.3m
数量5987张
单张尺寸1024*1024
原始影像位深8位
标签图片位深8位
原始影像通道数三通道
标签图片通道数单通道

标签类别对照表

像素值类别名(英文)类别名(中文)
1background背景
2building建筑
3road道路
4water水体
5barren裸土
6forest林地
7agriculture耕地
0no-data无效值(使用时应被忽略)

数据处理部分

大家是否有这样的困惑?真值标签图片的像素值太小,比如1、2、3······,由于像素值太小,导致看上去标签图片全为黑色,无法看出真值标签与影像图片的像素位置是否对应?如果真值标签的像素值间隔太大,又无法直接作为训练样本。

其实有办法可以解决这个问题,那就是在像素值为1、2、3等的图片上添加一个彩色表,添加的彩色表不会改变图片的像素值,但是可以由彩色的视觉效果展示,如下图所示:
在这里插入图片描述

下面我们就对原始影像及标签进行模型训练前的数据预处理,根据这套数据集的原始信息,原作者整理的已基本接近训练条件,现在需要做的是根据自己训练模型的图片尺寸大小批量裁剪原始影像和标签为所需要的尺寸,比如512*512,另外如果需要检查裁剪后的数据是否一一对应,最好给标签数据添加颜色表,这样就可以轻易看出影像和真值标签是否一致。

下面就是使用代码对原始影像及原始标签进行批量裁剪为512*512大小,并给真值标签添加颜色表,效果图如下所示:
在这里插入图片描述

最后可以直接用于训练的数据集结构如下所示

/path/to/LoveDA
├── train
│   ├── images
│   │   ├── 2522_0_0.tif
│   │   ├── 2522_0_512.tif
│   │   └── ......
│   └── labels
│       ├── 2522_0_0.tif
│       ├── 2522_0_512.tif
│       └── ......
└── val
    ├── images
    │   ├── 2522_512_512.tif
    │   ├── 2523_0_0.tif
    │   └── ......
    └── labels
        ├── 2522_512_512.tif
        ├── 2523_0_0.tif
        └── ......

相关数据和代码见 博主首页 技术交流輑
01、官网原始数据集;
02、中间处理好的数据集;
03、裁剪后可训练的数据集;
04、裁剪影像及添加颜色表代码;

标签:2522,标签,LoveDA,语义,像素,训练样本,tif,512,影像
From: https://blog.csdn.net/qq_34578459/article/details/141687388

相关文章

  • 遥感影像-语义分割数据集:Postdam数据集详细介绍及训练样本处理流程
    原始数据集详情Potsdam数据集是一个有着2D语义分割内容标注的城市遥感数据集。KeyValue卫星类型未知覆盖区域一个典型的历史城市,有着大的建筑群、狭窄的街道和密集的聚落结构-Potsdam场景城市分辨率5cm数量38张单张尺寸6000*6000原始影像位深8位标签图片位深8位原始影像......
  • 使用bert_base_chinese实现文本语义相似度计算
    本文选择将模型下载到本地,进行离线分析计算,也可以使用在线下载,但本文略过1下载bert_base_chinese下载地址:https://huggingface.co/google-bert/bert-base-chinese/tree/main下载图上红框内的四个文件,并按照下图的目录结构放置bert-base-chinese文件夹里放2代码......
  • 专业级语义搜索优化:利用 Cohere AI、BGE Re-Ranker 及 Jina Reranker 实现精准结果重
    专业级语义搜索优化:利用CohereAI、BGERe-Ranker及JinaReranker实现精准结果重排1.简介1.1RAG在说重排工具之前,我们要先了解一下RAG。检索增强生成(RAG)是一种新兴的AI技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。基本的RAG应用包括四个关......
  • 专业级语义搜索优化:利用 Cohere AI、BGE Re-Ranker 及 Jina Reranker 实现精准结果重
    专业级语义搜索优化:利用CohereAI、BGERe-Ranker及JinaReranker实现精准结果重排1.简介1.1RAG在说重排工具之前,我们要先了解一下RAG。检索增强生成(RAG)是一种新兴的AI技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。基本的RAG应用包括四个关......
  • 【Python机器学习】卷积神经网络(CNN)——语义理解
    无论是人类还是机器,理解隐藏在文字背后的意图,对于倾听者或阅读者来说的,都是一项重要的技能。除了理解单个词的含义,词之间还有各种各样巧妙的组合方式。词的性质和奥妙与词之间的关系密切相关。这种关系至少有两种表达方式:词序词的临近度这些关系的模式以及词本身存在的模式......
  • 艾体宝洞察丨透过语义缓存,实现更快、更智能的LLM应用程序
    传统的缓存只存储数据而不考虑上下文,语义缓存则不同,它能理解用户查询背后的含义。它使数据访问更快,系统响应更智能,对GenAI应用程序至关重要。什么是语义缓存?语义缓存解释并存储用户查询的语义,使系统能够根据意图而不仅仅是字面匹配来检索信息。这种方法可以实现更细致入微的数据......
  • 知识图谱——语义知识库的开端(1)
            从最初的Google搜索,到如今的聊天机器人、大数据风控、证券投资、智能医疗、自适应教育、推荐系统等各个领域,知识图谱的应用无处不在。知识图谱(KnowledgeGraph)的概念由Google在2012年正式提出,旨在打造更智能的搜索引擎,并在2013年后逐渐在学术界和工业......
  • 图像字幕Image Captioning——使用语法和语义正确的语言描述图像
    1.什么是图像字幕        ImageCaptioning(图像字幕生成) 是计算机视觉和自然语言处理(NLP)领域的一个交叉研究任务,其目标是自动生成能够描述给定图像内容的自然语言句子。这项任务要求系统不仅要理解图像中的视觉内容,还要能够将这些视觉信息转化为具有连贯性和语义丰......
  • JSP基于隐语义模型的旅游推荐系统r4f0b--(程序+源码+数据库+调试部署+开发环境)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表系统功能:用户,景点类别,景点信息,游记路线,景点订票,景点退票开题报告内容一、研究背景与意义随着互联网技术的飞速发展,旅游行业逐渐向线上转移,但传统旅游推荐......
  • 图解Kafka | 16张图讲透生产者交付语义
    交付(传递)语义交付语义是在分布式消息系统(如Kafka)中,用来描述消息从生产者到达消息系统并最终被消费者消费时的可靠性保证。它主要涉及到消息是否能正确地被投递,及在什么情况下可能会出现消息丢失或重复的问题。根据Kafkabroker和生产者的配置,支持“最多一次”、“至少一......