首页 > 其他分享 >《DNK210使用指南 -CanMV版 V1.0》第三十五章 image图像特征检测实验

《DNK210使用指南 -CanMV版 V1.0》第三十五章 image图像特征检测实验

时间:2024-11-05 17:42:22浏览次数:1  
标签:img 检测 image V1.0 图像 使用指南 margin find

第三十五章 image图像特征检测实验

1)实验平台:正点原子DNK210开发板

2)章节摘自【正点原子】DNK210使用指南 - CanMV版 V1.0

3)购买链接:https://detail.tmall.com/item.htm?&id=782801398750

4)全套实验源码+手册+视频下载地址:http://www.openedv.com/docs/boards/k210/ATK-DNK210.html

5)正点原子官方B站:https://space.bilibili.com/394620890

6)正点原子K210技术交流企鹅群:605557868

在上一章节中,介绍了image模块中图像滤波方法给的使用,本章将继续介绍image模块中图像特征检测方法的使用。通过本章的学习,读者将学习到image模块中图像特征检测的使用。
本章分为如下几个小节:
35.1 image模块图像特征检测方法介绍
35.2 硬件设计
35.3 程序设计
35.4 运行验证

35.1 image模块图像特征检测方法介绍
image模块为Image对象提供了find_edges()方法,用于检测图像中的边缘特征,find_edges()方法如下所示:

image.find_edges(edge_type, threshold=(100, 200))

find_edges()方法用于检测图像中的边缘特征,该方法会将图像变为黑白,仅将边缘像素保留为白色,需要注意的是该方法仅支持灰度图像。
edge_type指的是边缘检测算法的选择,可以是image.EDGE_SIMPLE(简单的阈值高通滤波算法)或image.EDGE_CANNY(Canny边缘检测算法)。
threshold指的是一个包含一个低阈值和一个高阈值的二值元组,可以通过调整阈值来控制边缘质量,默认为(100, 200)。
find_edges()方法会返回经过处理的Image对象。
find_edges()方法的使用示例如下所示:

import image
img = image.Image(size=(320, 240))
img.to_grayscale()
img.find_edges(image.EDGE_SIMPLE, threshold=(100, 255))

image模块为Image对象提供了find_circles()方法,用于检测图像中的圆形特征,find_circles()方法如下所示:

image.find_circles(roi, x_stride=2, y_stride=1, threshold=2000, x_margin=10, y_margin=10, 
r_margin=10, r_min=2, r_max, r_step=2)

find_circles()方法用于检测图像中的圆形特征,该方法使用霍夫变换在图像中查找圆。
roi指的是对Image对象感兴趣的区域,若未指定,即为图像矩形。
x_stride和y_stride指的是霍夫变换时需要跳过的X和Y像素的数量,若已知被检测圆的半径较大,可以增加该参数。
threshold指的是霍夫变换阈值,只返回大于或等于阈值的圆。
x_margin、y_margin和r_margin指的是控制所检测的圆的合并,圆像素为x_margin、y_margin和r_margin的部分合并。
r_min和r_max指的是圆半径的阈值,只返回半径在阈值间的圆。
r_step指的是检测时的半径步进。
find_cricles()方法会返回一个image.circle对象列表
find_circles()方法的使用示例如下所示:

import image
img = image.Image(size=(320, 240))
circles = img.find_circles((0, 0, img.width(), img.height()), x_stride=2, y_stride=2, threshold=3800,
 x_margin=50, y_margin=50, r_margin=50, r_min=60, r_max=80, r_step=5)
for c in circles:
    img.draw_circle(c.x(), c.y(), c.r(), color=(255, 0, 0), thickness=2)

image模块为Image对象提供了find_lines()方法,用于检测图像中的直线特征,find_lines()方法如下所示:

image.find_lines(roi, x_stride=2, y_stride=1, threshold=1000, theta_margin=25, rho_margin=25)

find_lines()方法用于检测图像中的直线特征,该方法使用霍夫变换在图像中查找直线。
roi指的是对Image对象感兴趣的区域,若未指定,即为图像矩形。
x_stride和y_stride指的是霍夫变换时需要跳过的X和Y像素的数量,若已知被检测直线较大,可以增加该参数。
threshold指的是霍夫变换阈值,只返回大于或等于阈值的直线。
theta_margin和rho_margin指的是所检测直线的合并,直线角度为theta_margin的部分和直线p值为rho_margin的部分合并。
find_lines()方法会返回image.line对象列表。
find_lines()方法的使用示例如下所示:

import image
img = image.Image(size=(320, 240))
lines = img.find_lines((0, 0, img.width(), img.height()), x_stride=2, y_stride=1, threshold=1000, theta_margin=25, rho_margin=25)
for l in lines:
    img.draw_line(l.line(), color=(255, 0, 0), thickness=2)

image模块为Image对象提供了find_hog()方法,用于检测图像中的定向梯度特征,find_hog()方法如下所示:

image.find_hog(roi, size=8)

find_hog()方法用于用HoG(定向梯度直方图)线替换图像中的像素,需要注意的是该方法仅支持灰度图像。
roi指的是对Image对象感兴趣的区域,若未指定,即为图像矩形。
size指的是HoG的尺寸。
find_hog()方法会返回经过处理的Image对象。
find_hog()方法的使用示例如下所示:

import image
img = image.Image(size=(320, 240))
img.find_hog((0, 0, img.width(), img.height()), size=8)

35.2 硬件设计
35.2.1 例程功能

  1. 获取摄像头输出的图像,并使用image模块对图像进行一些特征检测后,将图像显示在LCD上。
  2. 当KEY0按键被按下后,切换image模块对图像的特征检测方式。
    35.2.2 硬件资源
    本章实验内容,主要讲解image模块的使用,无需关注硬件资源。
    35.2.3 原理图
    本章实验内容,主要讲解image模块的使用,无需关注原理图。
    35.3 程序设计
    35.3.1 image模块图像特征检测方法介绍
    有关image模块图像特征检测方法的介绍,请见第35.1小节《image模块图像特征检测方法介绍》。
    35.3.2 程序流程图

    图35.3.2.1image图像特征检测实验流程图

35.3.3 main.py代码
main.py中的脚本代码如下所示:

from board import board_info
from fpioa_manager import fm
from maix import GPIO
import time
import lcd
import sensor
import image
import gc
lcd.init()
sensor.reset()
sensor.set_framesize(sensor.QVGA)
sensor.set_pixformat(sensor.RGB565)
sensor.set_hmirror(False)
type = 0
type_dict = {
    0: "Normal",
    1: "Edge",
    2: "Circle",
    3: "Line",
    4: "HoG"
}
fm.register(board_info.KEY0, fm.fpioa.GPIOHS0)
key0 = GPIO(GPIO.GPIOHS0, GPIO.IN, GPIO.PULL_UP)
def key_irq_handler(key):
    global key0
    global type
   time.sleep_ms(20)
    if key is key0 and key.value() == 0:
       type = type + 1
       if type == len(type_dict):
           type = 0
key0.irq(key_irq_handler, GPIO.IRQ_FALLING, GPIO.WAKEUP_NOT_SUPPORT, 7)
while True:
    img= sensor.snapshot()
    if type == 0:
       # 原图
       pass
    elif type == 1:
       # 边缘检测
       gray = img.to_grayscale(copy=True)
       gray.find_edges(image.EDGE_SIMPLE, threshold=(100, 255))
       img.draw_image(gray, 0, 0, mask=gray)
       del gray
    elif type == 2:
       # 圆形检测
       circles = img.find_circles((0, 0, img.width(), img.height()), x_stride=2, y_stride=2, threshold=3800, 
x_margin=50, y_margin=50, r_margin=50, r_min=60, r_max=80, r_step=5)
       for c in circles:
           img.draw_circle(c.x(), c.y(), c.r(), color=(255, 0, 0), thickness=2)
    elif type == 3:
       # 直线检测
       lines = img.find_lines((0, 0, img.width(), img.height()), x_stride=2, y_stride=1, threshold=1000, 
theta_margin=25, rho_margin=25)
       for l in lines:
           img.draw_line(l.line(), color=(255, 0, 0), thickness=2)
    elif type == 4:
       img.to_grayscale()
       # HoG检测
       img.find_hog((0, 0, img.width(), img.height()), size=8)
    else:
       type = 0
    img.draw_string(10, 10, type_dict[type], color=(255, 0, 0), scale=1.6)
    lcd.display(img)
    gc.collect()

可以看到一开始是先初始化了LCD、摄像头和中断按键,并且按下中断按键可以切换图像特征检测的方式。
接着在一个循环中不断地获取摄像头输出的图像,因为获取到的图像就是Image对象,因此可以直接调用image模块为Image对象提供的各种方法,然后就是对图像进行特征检测,最后在LCD显示图像以及检测到的特征。

35.4 运行验证
将DNK210开发板连接CanMV IDE,点击CanMV IDE上的“开始(运行脚本)”按钮后,便能看到LCD上显示了处理后的摄像头图像,按下KEY0按键还能够切换特征检测方式,如下图所示:

图35.4.1 摄像头原图图像

图35.4.2 边缘检测

图35.4.3 圆形检测

图35.4.4 直线检测

图35.4.5 HoG检测

标签:img,检测,image,V1.0,图像,使用指南,margin,find
From: https://www.cnblogs.com/zdyz/p/18528438

相关文章

  • IDEA加载通义灵码插件及使用指南
    安装通义灵码插件登录通义灵码IDE插件下载登录参考教程https://help.aliyun.com/zh/lingma/user-guide/download-the-installation-guide本地工程和企业知识库准备请下载本地工程和知识库压缩包,并在本地解压缩,其中包含demoProject和知识库文件两个文件夹。通义灵码测......
  • C# NUnit 框架:高效使用指南
    一、NUnit简介NUnit是一个专门为.NET语言设计的开源单元测试框架,它基于xUnit架构,提供了丰富的断言方法和测试运行机制,帮助开发者轻松地编写和执行单元测试用例。使用NUnit,我们可以对代码中的各个功能单元进行独立测试,以验证其正确性。二、环境搭建创建项目首先,在......
  • python爬虫:xpath的基本使用指南
    当面对一个新网站时,了解其数据加载逻辑是获取所需信息的关键。以下是一份详细的技术指南,帮助你分析和提取网站数据。1.数据加载来源分析1.1数据从页面源代码加载浏览器获取页面源代码浏览器通过发送HTTP请求获取页面源代码。作为开发者,我们可以通过编程模拟这一过程。......
  • 一款开源简洁高颜值的酷狗第三方客户端V1.0.0 Beta
    MoeKoeMusic前言早在10年前后的样子,那会在用网页版QQ的时候我就已经开始使用酷狗音乐了(也是十来年的老粉了),所以这些年收藏的歌曲全部都在上面.后来我也尝试开始使用网易云或QQ音乐,也尝试把酷狗的歌单导入进去,但是效果都不尽人意.我听的大多是日漫OP,好多歌曲都没办法......
  • 软件工程课程项目“物品复活“软件开发v1.0
    项目地址:https://github.com/specture724/ItemReviveApp作业要求大学生经常有些物品觉得扔掉可惜,不处理又觉得浪费自己的地方。请你编写一个物品“复活”软件该程序允许添加物品的信息(物品名称,物品描述,联系人信息),删除物品的信息,显示物品列表,也允许查找物品的信息你实现的程序......
  • 抖店精选联盟商家批量采集器抖音商家采集使用指南
    抖店精选联盟商家批量采集器抖音商家采集使用指南作者V****553813195抖店精选联盟商家批量采集器是一款能够帮助商家快速、精准地获取抖音平台上精选联盟商家信息的工具。以下是该工具的使用指南:一、下载与安装下载:商家可以从抖店开放平台或相关软件下载网站,下载抖店精选联盟......
  • 5-w1r3s.v1.0
    kali:192.168.11.128靶机:192.168.11.134nmap扫描nmap-sT-sV-O-sC-p-192.168.11.13421端口发现ftp可以匿名登录还有三个目录将文件下载到kaliwget-r-A.txt-nd-np-P/home/kaliftp://Anonymous:[email protected]/-r:开启递归下载。-A.txt:......
  • Nginx使用指南
    Nginx是一款广泛使用的高性能HTTP和反向代理服务器,它以事件驱动的方式处理请求,能够高效地管理大量并发连接。Nginx的配置灵活,支持丰富的功能模块,如负载均衡、缓存支持、HTTP认证等,这使得它成为搭建现代Web应用和服务的理想选择。其稳定性高、资源消耗少,易于维护和扩展,特别是在......
  • [论文阅读] VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION
    写在前面原文:https://arxiv.org/pdf/1409.1556参考:https://www.cnblogs.com/lijiuliang/p/15133276.html关键字:卷积网络、卷积网络深度、图像识别阅读理由:卷积神经网络深度与算法优良性能之间的关系是什么,如何评估的,结果如何,有哪些思考前置知识:CNN(也是我写滴嘻嘻(#..#))、filt......
  • LLaVA-UHD: an LMM Perceiving Any Aspect Ratio and High-Resolution Images
    传统的大多模态模型(LargeMultimodalModel,LMM)关注于固定的尺寸和有限的分辨率。本文以GPT-4V和LLaVa-1.5为代表,揭示了视觉编码策略的根本性系统缺陷。本文指出大多模态模型可以有效地感知任何长宽比和高分辨率的图像。概述为了实现LMM模型在多种长宽比和高分辨率的图像感......