首页 > 其他分享 >建筑裂缝检测图像ai模型训练数据集

建筑裂缝检测图像ai模型训练数据集

时间:2024-09-16 08:52:11浏览次数:16  
标签:ai 检测 image 图像 path images 裂缝 数据 标注

共52w例图像的建筑裂缝检测图像ai模型训练数据集


20 地上设施(公路桥梁、铁路桥梁、水坝(墙)、挡土墙)和地下 SOC 设施(公路/铁路隧道、地铁、水隧道);韩国40 个市、县、区 SOC 设施的数据,并考虑多样性分布;10种裂纹/缺陷(裂纹、网状裂纹、分层、剥落、泛白、漏水、钢筋外露、材料分离、提升、损坏)。数据集使用拍摄设备直接采集,主要记录灾害安全环境525000例格式为jpg;标签数据以折线和多边形记录525000例,格式为json;图片说明10000例。

项目背景:

建筑裂缝检测是基础设施维护和安全管理中的重要环节。裂缝不仅影响建筑物的美观,更重要的是会威胁到结构的安全性和使用寿命。传统的人工检查方法不仅效率低下,还可能因为人为因素而遗漏重要细节。随着计算机视觉技术的进步,利用AI模型进行自动裂缝检测已成为一种趋势。本数据集旨在为建筑裂缝检测提供高质量的标注数据,支持自动化检测系统的开发与应用。

数据集概述:

  • 名称:建筑裂缝检测图像AI模型训练数据集
  • 规模:共计525,000张图像
  • 设施类型:涵盖地上设施(公路桥梁、铁路桥梁、水坝(墙)、挡土墙)和地下SOC设施(公路/铁路隧道、地铁、水隧道)
  • 地域分布:来自韩国40个市、县、区的SOC设施数据
  • 缺陷类型:包含10种裂纹/缺陷类型(裂纹、网状裂纹、分层、剥落、泛白、漏水、钢筋外露、材料分离、提升、损坏)
  • 数据格式:图像格式为.jpg,标签数据以折线和多边形记录,格式为.json
  • 图片说明:包含10,000例图像说明

数据集特点:
  1. 全面性:涵盖多种设施类型和地域,确保数据集的多样性和实用性。
  2. 高质量标注:每张图像都已详细标注,确保数据的准确性和可靠性。
  3. 适用范围广:适用于多种深度学习框架,方便科研人员和开发者直接使用。
  4. 标准格式:采用广泛使用的.jpg图像格式和.json标签格式,方便导入不同的检测框架。
数据集内容:

  • 裂纹(Crack):标注了建筑表面的裂纹。
  • 网状裂纹(Hairline Cracks):标注了建筑表面的细小裂纹网络。
  • 分层(Delamination):标注了建筑表面的分层缺陷。
  • 剥落(Spalling):标注了建筑表面的剥落区域。
  • 泛白(Efflorescence):标注了建筑表面的泛白现象。
  • 漏水(Leakage):标注了建筑表面的漏水点。
  • 钢筋外露(Exposed Rebar):标注了建筑表面的钢筋外露情况。
  • 材料分离(Material Separation):标注了建筑表面的材料分离情况。
  • 提升(Heave):标注了建筑表面的提升缺陷。
  • 损坏(Damage):标注了建筑表面的损坏情况。
数据集用途:
  1. 缺陷检测:可用于训练和评估深度学习模型,特别是在建筑裂缝检测方面。
  2. 质量控制:帮助实现建筑设施的安全管理,减少人工检测的工作量。
  3. 科研与教育:为建筑裂缝检测领域的研究和教学提供丰富的数据支持。
使用场景:
  1. 自动化检测:在基础设施巡检中,利用该数据集训练的模型可以自动识别建筑裂缝。
  2. 质量控制:在质量控制系统中,利用该数据集可以提高检测的准确性和速度。
  3. 生产管理:在建设和维护管理工作中,利用该数据集可以提高工作效率和安全性。
技术指标:
  • 数据量:共计525,000张图像,覆盖多种建筑裂缝类型。
  • 数据划分:考虑到地域和设施类型的多样性分布。
  • 标注格式:标签数据以折线和多边形记录,格式为.json,方便导入不同的检测框架。
  • 标注精度:所有图像均已详细标注,确保数据的准确性和可靠性。
注意事项:
  • 数据隐私:在使用过程中,请确保遵守相关法律法规,保护个人隐私。
  • 数据预处理:在使用前,建议进行一定的数据预处理,如图像归一化等。
获取方式:
  • 下载链接:请访问项目主页获取数据集下载链接。
  • 许可证:请仔细阅读数据集的使用许可协议。
关键代码示例:

以下是关键代码的示例,包括数据加载、模型训练、检测和结果展示。

数据加载:
1import os
2import cv2
3import numpy as np
4import json
5
6# 数据集路径
7DATASET_PATH = 'path/to/dataset'
8IMAGES_DIR = os.path.join(DATASET_PATH, 'images')
9LABELS_DIR = os.path.join(DATASET_PATH, 'labels')
10
11# 加载数据集
12def load_dataset(directory):
13    images = []
14    labels = []
15
16    for img_file in os.listdir(IMAGES_DIR):
17        if img_file.endswith('.jpg'):
18            img_path = os.path.join(IMAGES_DIR, img_file)
19            label_path = os.path.join(LABELS_DIR, img_file.replace('.jpg', '.json'))
20            
21            image = cv2.imread(img_path)
22            with open(label_path, 'r') as f:
23                label = json.load(f)
24            
25            images.append(image)
26            labels.append(label)
27
28    return images, labels
29
30train_images, train_labels = load_dataset(os.path.join(DATASET_PATH, 'train'))
31val_images, val_labels = load_dataset(os.path.join(DATASET_PATH, 'val'))
32test_images, test_labels = load_dataset(os.path.join(DATASET_PATH, 'test'))
模型训练:
1# 初始化YOLOv8模型
2model = YOLO('yolov8n.pt')
3
4# 定义训练参数
5EPOCHS = 100
6BATCH_SIZE = 16
7
8# 训练模型
9results = model.train(data='crack_detection.yaml', epochs=EPOCHS, batch=BATCH_SIZE)
模型检测:
1# 加载训练好的模型
2model = YOLO('best.pt')
3
4# 检测图像
5def detect_cracks(image):
6    results = model.predict(image)
7    for result in results:
8        boxes = result.boxes
9        for box in boxes:
10            x1, y1, x2, y2 = box.xyxy[0]
11            conf = box.conf
12            class_id = box.cls
13            
14            # 显示结果
15            cv2.rectangle(image, (int(x1), int(y1)), (int(x2), int(y2)), (0, 255, 0), 2)
16            cv2.putText(image, f'Class: {class_id}, Conf: {conf:.2f}', (int(x1), int(y1)-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2)
17    
18    return image
19
20# 测试图像
21test_image = cv2.imread('path/to/test_image.jpg')
22result_image = detect_cracks(test_image)
23cv2.imshow('Detected Cracks', result_image)
24cv2.waitKey(0)
25cv2.destroyAllWindows()
配置文件 crack_detection.yaml
1train: path/to/train/images
2val: path/to/val/images
3test: path/to/test/images
4
5nc: 10  # Number of classes
6names: ['Crack', 'Hairline Cracks', 'Delamination', 'Spalling', 'Efflorescence', 'Leakage', 'Exposed Rebar', 'Material Separation', 'Heave', 'Damage']  # Class names
7
8# Training parameters
9batch_size: 16
10epochs: 100
11img_size: [640, 640]  # Image size
使用指南:
  1. 数据准备:确保数据集路径正确,并且数据集已准备好。
  2. 模型训练:运行训练脚本,等待训练完成。
  3. 模型检测:使用训练好的模型进行检测,并查看检测结果。
结语:

本数据集提供了一个高质量的建筑裂缝检测图像数据集,支持自动化检测、质量控制等多个应用场景。通过利用该数据集训练的模型,可以提高裂缝检测的效率和准确性。

标签:ai,检测,image,图像,path,images,裂缝,数据,标注
From: https://blog.csdn.net/2301_78240361/article/details/142292725

相关文章

  • 【AI学习】陶哲轩在 2024 年第 65 届国际数学奥林匹克(IMO)的演讲:AI 与数学
    陶哲轩在2024年第65届国际数学奥林匹克关于AI和数学的演讲,很有意思。陶哲轩的讲话语速太快了,足见其聪明!AI用于数学的一些方面:陶哲轩介绍到刚刚被数学家接受并开始普及的方法:形式化证明辅助工具。形式化证明辅助工具是用于验证论证是否真正正确的语言,可以验证某个论......
  • 谷歌图像生成AI-imagen 3新手入门指南!
    1Google最近推出了Imagen3,这是目前为止其最先进的文本生成图像模型。它基于之前的版本进行了改进,提供了更加精确的图像生成,减少了图像中的瑕疵,能够生成逼真、栩栩如生的图像。相比于早期版本,Imagen3可以处理更加复杂的文本描述,生成的图像在一致性和连贯性上有了显著提升......
  • 示例 30: 图像画廊
    <!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metaname="viewport"content="width=device-width,initial-scale=1.0"><title>ImageGallery</title>......
  • 发现一个超级赞的网站,每日更新热门AI产品
    发现了一个超级无敌赞的网站!可以看到每日热门产品榜单,大致一翻,看到好几个好玩的项目~简单介绍ProductHunt每日热榜是一个基于GitHubAction的自动化工具,它能够每天定时生成ProductHunt上的热门产品榜单Markdown文件,并自动提交到GitHub仓库中。该项目旨在帮助用户......
  • AI视频只有段子?不,轻舟已过万重山
    大家好,我是Shelly,一个专注于输出AI工具和科技前沿内容的AI应用教练,体验过300+款以上的AI应用工具。关注科技及大模型领域对社会的影响10年+。关注我一起驾驭AI工具,拥抱AI时代的到来。昨天,我发了一条用AI制作的10秒钟的中秋创意视频,全网浏览量过万。创作这条视频,主要是想在中秋......
  • idea运行java项目main方法报build failure
    一:概述在开发Java项目时,我们经常使用IntelliJIDEA(以下简称IDEA)作为主要的集成开发环境(IDE)。IDEA以其强大的功能和流畅的用户体验而受到开发者的青睐。然而,即使在如此成熟的开发环境中,我们仍然可能会遇到各种问题,其中之一就是运行项目时出现的“BuildFailure”错误。本文将详细探......
  • AI老照片修复神器,Anole下载介绍
    最近AI老照片修复上色,再一次火出圈,一些社交平台关于此话题内容流量满满,尤其是在小红书和抖音火的不得了,本期文章就来给大家分享下AI修复老照片的方式方法本文主要介绍使用Anole修复老照片的方法,只需输入一张黑白或彩色照片,即可得到修复后的彩色结果,让往日的老照片坐上时光机重焕......
  • 这可能是最清晰的AI存储数据流动图解
    之前小编也写过多篇AI存储相关的文章,包括AI背景与分层存储的分析,以及AI存储重点从训练转向推理等内容。具体参考:深度剖析:AI存储架构的挑战与解决方案存储正式迈入超大容量SSD时代!业内有很多关于AI不同解读对存储需求的分析,每家都有画对应的示意图。在这么多厂商的分析......