首页 > 其他分享 >【工业机器视觉】基于深度学习的水表盘读数识别(5-读数修正)

【工业机器视觉】基于深度学习的水表盘读数识别(5-读数修正)

时间:2024-12-15 14:58:01浏览次数:7  
标签:box 表盘 读数 img top flow seg 视觉 指针

【工业机器视觉】基于深度学习的水表盘读数识别(3-数据标注与转换)-CSDN博客

读数修正

上一篇我们已经正确对图片进行了预测,并且可视化了预测结果,接下来我们要对预测结果数据进行解析、处理、修正,得到最终读数。这里不再介绍上位机开发,本文是基于Pyside6开发的上位机。

模型加载

分别加载3个训练好的模型:

self.modelPointer = YOLO(model_path + weight_pointer)
self.modelSeg = YOLO(model_path + weight_seg)
self.modelDigit = YOLO(model_path + weight_digit)

modelPointer:指针目标检测

modelSeg:梅花针分割

modelDigit:字轮数字目标检测

指针预测

results = self.modelPointer.predict(frame, imgsz=640, verbose=False)
w_pointers = []
low_pointer = None
for result in results:
    names = result.names
    boxes = result.boxes
    box_datas = boxes.data.cpu().numpy()
    if len(box_datas) == 0:
        self.warnHint('指针区域:未发现检测目标')
        return

    for box in box_datas:
        name = names[int(box[5])]  # 预测标签
        if name.find('p') == 0:
            # 一个低位指针 当指针个数为3个时有效
           if self.pointerCount == 3:
              low_pointer = box
           elif name.find('area_p') == 0:
               # 指针区域
               w_pointers.append(box)

   if len(w_pointers) == 0:
      self.warnHint('未检测到有效的指针区域')
      return

得到最低位指针目标和其他指针区域目标数据,然后处理重复预测的BOX,一个量程只保留一个预测目标:

def restore_boxes(dst_areas):
    '''
    以X轴从大到小排序,并且两两之间如果小于10,则取得分最大的一个box
    :param dst_areas: 所有预测出来的目标区域
    :return:
    '''
    dst_areas_s = sorted(dst_areas, key=lambda box: box[0], reverse=True)
    tmp_list = []
    for i in range(len(dst_areas_s) - 1):
        diff = abs(dst_areas_s[i][0] - dst_areas_s[i + 1][0])
        if diff <= 10:
            if dst_areas_s[i][4] < dst_areas_s[i + 1][4]:
                tmp_list.append(i)
            else:
                tmp_list.append(i + 1)

    dst_boxes = []
    for i, dst_box in enumerate(dst_areas_s):
        if i not in tmp_list:
            dst_boxes.append(dst_box)

    return dst_boxes

最后返回的数据就是最终我们需要处理的目标数据。下面开始逐位处理:

p_flows = [0, 0, 0]  # 初始化
# 截取预测出来的指针区域矩形框
top_boxes = [[top_box[1] - 5, top_box[0] - 5, top_box[3] + 5, top_box[2] + 5] for top_box in pointer_boxes]

# 3个指针区域
low_flow = int(names[int(low_pointer[5])].replace('p', ''))  # 这是x0.001位的值,直接预测出来的
p_flows[2] = low_flow
# x0.01角度计算、修正
angle_flow1, msg = get_real_flow(top_boxes[1], frame, self.modelSeg, p_flows[2], 'x0.01', debug_show)
if angle_flow1 is None:
   self.warnHint(msg)
   return

p_flows[1] = angle_flow1
# x0.1角度计算、修正
angle_flow2, msg = get_real_flow(top_boxes[0], frame, self.modelSeg, p_flows[1], 'x0.1', debug_show)
if angle_flow2 is None:
   self.warnHint(msg)
   return

p_flows[0] = angle_flow2

result_pointer = get_flow(p_flows)

从低位到高位,依次进行角度计算、修正后,得到最终结果。

指针读数

定义一个名为 get_real_flow 的函数,该函数用于获取修正后的流量信息。它接受多个参数,并返回一个修正后的流量值和一个可能的错误消息。

def get_real_flow(box, frame, model_seg, low_flow, position, debug_show):
  • box: 表示一个边界框,通常用来定位图像中的特定区域。
  • frame: 代表一帧视频或图像。
  • model_seg: 可能是一个用于分割或者识别的模型。
  • low_flow: 可能是低流量的一个预估值或者是阈值。
  • position: 流量计的位置标识。
  • debug_show: 一个标志位,用来指示是否显示调试信息。

接下来,设置了一些固定的字符串值:

fix_up_value = '0,1,2,3'
fix_down_value = '7,8,9'

用于校正流量读数的固定值,与刻度盘上的某些数值相关联。然后,计算了矩形框的位置,并从原始帧中裁剪出这个矩形区域:

top, left, bottom, right = get_rect(box, frame)
frame_rect = frame[top:bottom, left:right]

get_rect 函数根据 boxframe 返回四个坐标值(上、左、下、右),这些坐标用于定义要分析的矩形区域,并从 frame 中提取出这个子区域。

之后,对提取出的帧部分进行角度计算和修正:

angle_flow = correct_flow(frame_rect, model_seg, low_flow, fix_up_value, fix_down_value, debug_show == 1)

correct_flow 函数使用模型 model_seg 来预测并计算角度,同时利用 fix_up_valuefix_down_value 对结果进行了调整。

最后,检查 angle_flow 是否为 None,如果是,则返回一个错误信息,表示流量识别失败。否则,返回修正后的流量值和一个空字符串作为成功的标志:

if angle_flow is None:
    return None, f'识别失败:[{position}]预测失败!请重试或换表!'

return angle_flow, ''

完整代码:

def get_real_flow(box, frame, model_seg, low_flow, position, debug_show):
    fix_up_value = '0,1,2,3'
    fix_down_value = '7,8,9'

    # x0.01 和 x0.1
    top, left, bottom, right = get_rect(box, frame)
    frame_rect = frame[top:bottom, left:right]
    # 角度计算、修正
    angle_flow = correct_flow(frame_rect, model_seg, low_flow, fix_up_value, fix_down_value, debug_show == 1)
    if angle_flow is None:
        return None, f'识别失败:[{position}]预测失败!请重试或换表!'

    return angle_flow, ''

角度计算与读数修正: 

def correct_flow(img, model_seg, low_flow, fix_up_value, fix_down_value, debug_show):
    '''
    角度计算与修正
    :param img:
    :param model_seg: 指针分割模型
    :param low_flow: 低位值
    :param fix_up_value: 需要向上修正的列表
    :param fix_down_value: 需要向下修正的列表
    :param debug_show:
    :return: 角度对应的刻度值
    '''
    try:
        circle_center, pointer_top = seg_center_top(img, model_seg, debug_show)
    except:
        return None

    if circle_center is None or pointer_top is None:
        return None

    zero_top = (circle_center[0], 20)
    # 求夹角
    B = cal_ang(zero_top, circle_center, pointer_top)
    if pointer_top[0] < circle_center[0]:
        B = 360 - B
    # 角度换算
    per_scale = 3.6
    # 向下取整  通过角度计算出来的
    angle_flow = math.floor((B / 10) / per_scale)

    # 修正算法.. 此处省略

    return angle_flow

分割模型预测结果处理:

定义一个名为 seg_center_top 的函数,其主要目的是使用一个分割模型来预测图像中的指针和刻度圆的位置,并计算出刻度圆的中心点和指针的顶点位置。

函数签名

def seg_center_top(img, model_seg, debug_show):
  • img: 输入的目标检测出来的指针区域图。
  • model_seg: 用于预测的分割模型。
  • debug_show: 调试模式标志位,当设置为 True 时,会显示一些中间结果以供调试。

图像预处理

img_copy = cv2.pyrUp(img.copy())
img_copy = cv2.addWeighted(img_copy, 1.2, img_copy, 0, 0)
  • 使用 cv2.pyrUp 方法对输入图像进行上采样,以提高分辨率。
  • 使用 cv2.addWeighted 增加图像亮度,这可能有助于改善分割模型的预测效果。

分割预测

results = model_seg.predict(img_copy, imgsz=128, verbose=False)
  • 使用分割模型对处理后的图像进行预测,获取预测结果。

处理预测结果

接下来的部分代码处理了分割模型返回的结果,提取了两个类别的mask(指针和刻度圆),并确定哪个是刻度圆,哪个是指针。如果检测到的对象数量小于等于1则直接返回 None。

计算中心点和指针顶点

w = x2 - x1
h = y2 - y1
center = ((w / 2) + x1, (h / 2) + y1)
cx, cy = center[0], center[1]
  • 计算了边界框的宽度和高度,并根据这些信息计算出刻度圆的中心点坐标 (cx, cy)
distances = np.sqrt(np.sum((pointers - np.array([cx, cy])) ** 2, axis=1))
top_pt = pointers[np.argmax(distances)]
  • 计算了指针上的所有点与刻度圆中心的距离,并选择距离最远的点作为指针的顶点。

完整代码:

def seg_center_top(img, model_seg, debug_show):
    '''
    使用分割模型预测,并找到指针顶点和刻度圆中点
    :param img: 目标检测出来的指针区域图
    :param debug_show: 调试模式
    :return:
    '''
    img_copy = cv2.pyrUp(img.copy())
    # 增加亮度
    img_copy = cv2.addWeighted(img_copy, 1.2, img_copy, 0, 0)
    # 预测
    results = model_seg.predict(img_copy, imgsz=128, verbose=False)
    for result in results:
        box_datas = result.boxes.data.cpu().numpy()
        if len(box_datas) <= 1:
            return None, None

        p1 = result.masks.xy[0]
        p2 = result.masks.xy[1]
        # 一般情况下刻度圆circle_points的mask长度比指针pointers的mask要多
        circle_points, pointers = (p2, p1) if len(p2) > len(p1) else (p1, p2)
        x1, y1, x2, y2, conf, _ = box_datas[0]

        for i, box_data in enumerate(box_datas):
            cls = int(box_data[5])
            if cls == 1:
                # 指针刻度圆box
                x1, y1, x2, y2, conf, _ = box_data
                # 指针mask
                pointers, circle_points = (result.masks.xy[1], result.masks.xy[0]) if i == 0 else (
                    result.masks.xy[0], result.masks.xy[1])
                break

        w = x2 - x1
        h = y2 - y1
        center = ((w / 2) + x1, (h / 2) + y1)
        cx, cy = center[0], center[1]

        # 求指针顶点
        distances = np.sqrt(np.sum((pointers - np.array([cx, cy])) ** 2, axis=1))
        top_pt = pointers[np.argmax(distances)]

        if debug_show:
            # 预测出来的box
            cv2.rectangle(img_copy, (math.ceil(x1), math.ceil(y1)), (math.ceil(x2), math.ceil(y2)), (0, 0, 255),
                          thickness=2)
            # 圆心
            cv2.circle(img_copy, (math.ceil(cx), math.ceil(cy)), 2, (0, 255, 0), thickness=2)
            # 指针顶点
            cv2.circle(img_copy, (math.ceil(top_pt[0]), math.ceil(top_pt[1])), 2, (0, 255, 0), thickness=2)
            # 连线圆心和指针顶点
            cv2.line(img_copy, (math.ceil(cx), math.ceil(cy)), (math.ceil(top_pt[0]), math.ceil(top_pt[1])),
                     (0, 255, 0), thickness=2)

            cv2.imshow('img', img_copy)
            cv2.waitKey(0)
            cv2.destroyAllWindows()

        return (cx, cy), top_pt

字轮数字预测、修正、读数

由于篇幅较长,此处省略...  感兴趣的小伙伴可以私信!

标签:box,表盘,读数,img,top,flow,seg,视觉,指针
From: https://blog.csdn.net/u014608435/article/details/144419569

相关文章

  • 西工大经典力作!AerialVLN:空中无人机视觉语言导航数据集
    作者:ShuboLiu,HongshengZhang,YuankaiQi,PengWang,YanningZhang,QiWu单位:西北工业大学,阿德莱德大学原文链接:AerialVLN:Vision-and-LanguageNavigationforUAVs(https://openaccess.thecvf.com/content/ICCV2023/papers/Liu_AerialVLN_Vision-and-Languag......
  • ECCV-2024 | NavGPT-2:释放视觉语言大模型的导航推理能力
    作者:GengzeZhou,YicongHong,ZunWang,XinEricWang,andQiWu阿德莱德大学,AdobeResearch,上海人工智能实验室,加利福尼亚大学圣克鲁斯分校原文链接:NavGPT-2:UnleashingNavigationalReasoningCapabilityforLargeVision-LanguageModels(https://link.spring......
  • 读数据保护:工作负载的可恢复性14备份和恢复数据库
    1. 给采用传统方式交付的数据库制作备份1.1. 某个数据库是新还是旧,跟该数据库是不是传统数据库没有必然的联系,真正的决定因素在于,这个数据库是不是运行在你所管理的服务器或虚拟机里1.1.1. 如果是,那就可以归入按照传统模型来交付的数据库1.1.2. 如果不是,那么则有可能......
  • arXiv-2024 | 具身智能体要上天!CITYNAV:基于地理信息的无人机视觉语言导航数据集
    作者:JungdaeLee,TaikiMiyanishi,ShuheiKurita,KoyaSakamoto,DaichiAzuma,YutakaMatsuo,NakamasaInoue单位:东京科学,东京大学,NII,ATR,京都大学AIP,京都大学,索尼半导体解决方案原文链接:CITYNAV:LANGUAGE-GOALAERIALNAVIGATIONDATASETWITHGEOGRAPHICINFORM......
  • 读数据保护:工作负载的可恢复性13一致性模型
    1. 一致性模型1.1. 数据库与其他东西相比,还有一个很重要的区别就在于,它们需要通过某种机制来确保数据一致,对于运行在多个节点上的数据库来说,这尤其重要1.1.1. 一致性模型(consistencymodel)1.2. 立即一致性1.2.1. 立即一致性(immediateconsistency)也叫强一致性(s......
  • 谷歌 Gemini 2.0 支持音频和图像输出;吴恩达:当下最重要的技术是 Agentic AI,视觉 AI 是
      开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑......
  • 《计算机视觉:瓶颈之辩与未来之路》
    一、计算机视觉的崛起计算机视觉是使用计算机模仿人类视觉系统的科学,让计算机拥有类似人类提取、处理、理解和分析图像以及图像序列的能力。它是一个多学科交叉的领域,与机器视觉、图像处理、人工智能、机器学习等领域密切相关。计算机视觉行业可分为基础层、技术层和应用层......
  • Simulink在机器人视觉场景下的应用——基于视觉的无人机自主导航与避障
    目录项目实例:Simulink在机器人视觉场景下的应用——基于视觉的无人机自主导航与避障项目背景1.系统架构1.1硬件平台1.2软件平台2.系统功能模块2.1图像采集与预处理2.2地形识别与建图2.3障碍物检测与分类2.4环境建图与定位2.5路径规划与避障2.6飞行控制与......
  • 管理看板:如何用视觉化工具提升团队效率
    在快节奏的商业环境中,管理看板已成为提升团队效率和透明度的重要工具。本文将探讨管理看板的概念、它如何帮助团队实现目标,以及如何有效地实施和管理看板系统。引言管理看板是一种视觉化管理工具,它源自于丰田生产系统的看板方法。它允许团队成员看到任务和项目的实时状态,促进沟......
  • 部分代码: PyTorch计算机视觉实战:目标检测、图像处理与深度学习
     第一章#https://github.com/PacktPublishing/Modern-Computer-Vision-with-PyTorch#https://github.com/PacktPublishing/Modern-Computer-Vision-with-PyTorch###################ChapterOne#######################################importnumpyasnpfromco......