首页 > 其他分享 >单目视觉测量及双目视觉测量

单目视觉测量及双目视觉测量

时间:2024-11-11 19:43:36浏览次数:3  
标签:特征 测量 SIFT 算法 单目 不变性 图像 视觉

一、单目视觉测量        

1.1 原理部分讲解        

        单目视觉系统通过采集图像,将图像转换为二维数据,然后对采集的图像进行模式识别,通过图像匹配算法识别行驶过程中的车辆、行人、交通标志等,最后依据目标物体的运动模式和定位技术,估算目标物体与本车的相对距离和相对速度。

        单目相机测距常用或者说实用的方法就是相似三角形法。这种方法假设我们有一个宽度为W的目标或者物体,然后我们将这个目标放在距离我们的相机为D的位置。我们用相机对物体进行拍照并且测量物体的像素宽度P。这样我们就得出了相机焦距的公式:F = (P x D) / W。通过这个公式,我们可以计算出物体离相机的距离。

        该算法具有结构简单、运算速度快、成本低等优点。它不需要像双目视觉那样进行复杂的特征点匹配,因此算法的实时性和鲁棒性较好。但一个主要挑战是缺乏深度信息,导致尺度模糊问题。此外,单目视觉系统在复杂环境下的距离估计、低光照条件下的性能表现等方面也面临挑战。

1.2 常用特征测量算法    

1.2.1 SIFT(尺度不变特征变换)

        SIFT(Scale-Invariant Feature Transform,尺度不变特征变换)是一种在计算机视觉领域广泛使用的特征检测和描述算法,由David G. Lowe在1999年提出,并在2004年完善。SIFT算法的核心思想是提取图像中的局部特征,并生成对应的特征描述子,这些特征对图像的旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性。

        其主要包括以下特点:

  1. 尺度不变性:SIFT特征对图像的缩放保持不变,这意味着在同一物体的不同尺度图像中,SIFT能够检测到相同的特征点。
  2. 旋转不变性:SIFT特征对图像的旋转保持不变,即旋转图像后,SIFT能够检测到相同的特征点。
  3. 亮度不变性:SIFT特征对图像的亮度变化不敏感,即使在不同光照条件下,也能检测到相同的特征点。

        同时SIFT对视角变化、仿射变换、噪声等具有一定的稳定性,具有较好的区分性,信息量丰富,适用于在海量特征数据库中进行快速、准确的匹配。即使在图像中只有少数几个物体,SIFT也能产生大量的特征向量,并且SIFT可以与其他形式的特征向量方便地联合使用。

        SIFT算法的实现步骤主要包括:

  1. 尺度空间极值检测:在不同尺度下,通过高斯滤波器构建图像的高斯金字塔,并在每个尺度上寻找局部极值点,作为关键点候选。
  2. 关键点定位:通过在尺度空间和图像空间中对极值点进行精确定位,找到稳定的关键点。
  3. 方向赋值:为每个关键点分配一个或多个方向,提高特征的旋转不变性。
  4. 特征描述:基于关键点的位置和方向,计算局部特征向量,构建特征描述符

1.2.2 SURF(加速稳健特征)

        SURF(Speeded Up Robust Features,加速稳健特征)算法是一种用于图像特征提取和描述的计算机视觉算法,由Herbert Bay等人在2006年提出。它是基于SIFT(Scale-Invariant Feature Transform)算法的改进版本,旨在提高特征检测和描述的速度,同时保持特征的尺度不变性和旋转不变性。

        其主要包括以下特点:

  1. 快速性:SURF算法通过使用积分图像和快速的盒式滤波器(Box Filter)来加速特征点检测和描述符生成,比SIFT算法快几倍。
  2. 稳健性:SURF算法对于旋转、缩放、亮度变化等干扰具有较好的鲁棒性,能够在不同的场景中保持稳定的性能。
  3. 特征点检测:SURF使用Hessian矩阵的行列式值作为特征点检测的依据,这种方法可以有效地识别图像中的角点、边缘等特征点。

        SURF算法在特征点周围选择一个区域,并计算该区域内的水平和垂直Haar小波响应,形成特征描述符。默认情况下,SURF描述符为64维,但也可以配置为128维以提高描述的精度。同时SURF算法可以为特征点分配一个主方向,以提高特征的旋转不变性。这一步骤可以通过统计特征点邻域内的Haar小波特征来实现。

        值得一提的是,与SIFT不同,SURF的专利已经过期,因此在商业应用中更加自由无碍,其在图像匹配、目标识别、全景拼接等领域有着广泛的应用。

二、双目视觉测量

2.1 原理部分讲解

        双目视觉测量算法是一种基于双目立体视觉原理的计算机视觉技术,它通过使用两个摄像头从不同角度捕捉同一场景的图像,来计算图像中每个像素点的视差信息,进而获取实际空间中物体的三维信息。通过双目视觉测量算法,甚至可以构建出三维空间中的点云,这些点云数据可以用于进一步的三维重建和分析。以下是双目视觉测量算法的关键步骤和原理:

  1. 双目标定:确定两个摄像头的内外参数。
  2. 立体校正(含消除畸变):对图像进行校正,使两个摄像头的图像位于同一平面且互相平行。
  3. 立体匹配:在两个校正后的图像中进行像素点匹配。
  4. 视差计算:根据匹配结果计算每个像素的视差。
  5. 深度计算(3D坐标):利用视差信息计算空间中物体的三维坐标

        这种双目视觉测量算法的精度受到多种因素的影响,包括相机畸变、视差偏差、基线距离与焦距、像素大小和物理尺寸、深度范围等。其中相机畸变是指由于镜头光学特性导致的图像失真,需要通过标定来校正这些畸变,以获得准确的几何关系。而立体校正作为是双目视觉中的一个重要步骤,它包括消除畸变和调整图像,使得两个摄像头的图像可以进行有效的匹配。

        立体匹配是双目视觉系统中的核心部分,它确定多幅图像之间投影点间的一一对应关系。有效的立体匹配可以使关键点更加容易被提取。视差图是立体匹配的结果,显示了场景中每个像素点的视差值。深度图是基于视差图计算得到的,它表示了场景中每个像素点到摄像头的距离。深度图的计算通常涉及到将视差值转换为实际的距离,这需要知道摄像头的焦距和摄像头之间的基线距离。

2.2 常用特征测量算法

        在双目视觉测量中,特征测量算法是用于从图像中提取关键信息并进行匹配的重要技术。以下是一些常用的特征测量算法:

        SIFT(Scale-Invariant Feature Transform,尺度不变特征变换)

        SIFT算法能够在不同尺度和旋转下提取稳定的特征点,并且对亮度变化和视角变化保持不变性。SIFT特征提取的实质是在不同的尺度空间上查找关键点,并计算关键点的方向。这些关键点通常是图像中的角点、边缘点、暗区的亮点及亮区的暗点等。

        SURF(Speeded Up Robust Features,加速稳健特征)

        SURF算法是SIFT算法的改进版本,它采用快速Hessian算法检测关键点,并使用特征向量描述关键点周围区域的情况。SURF算法比SIFT算法快好几倍,同时保持了特征的尺度不变性和旋转不变性。

        ORB(Oriented FAST and Rotated BRIEF)

ORB算法结合了FAST关键点检测和BRIEF描述子,具有旋转不变性和尺度不变性。ORB特征由关键点和描述子两部分组成,其中关键点是Oriented FAST,描述子是BRIEF。ORB对BRIEF进行了改进,使用了先前计算的方向信息。

        Harris角点检测

        Harris角点检测是一种经典的角点检测方法,它通过计算图像的梯度和其二阶矩来检测角点。Harris角点检测基本思想是识别图像中灰度变化明显的地方,这些地方通常是角点。

        BRIEF(Binary Robust Independent Elementary Features)

BRIEF是一种快速的特征描述子提取方法,它通过对关键点周围的小块区域进行随机采样,并比较这些区域的像素值来生成二进制字符串作为描述子。

        FREAK(Fast Retina Keypoint)

        FREAK是一种快速的特征点提取和匹配算法,它模拟人类视网膜对视觉信息的处理方式,具有旋转不变性和尺度不变性。

        AKAZE(Accelerated-KAZE)

        AKAZE是一种非线性特征提取算法,它结合了KAZE算法的优点,并对其进行了加速。AKAZE能够提取出对视角变化和光照变化具有不变性的特征点。

标签:特征,测量,SIFT,算法,单目,不变性,图像,视觉
From: https://blog.csdn.net/qq_63129682/article/details/143692988

相关文章

  • (水下)目标检测/深度学习/计算机视觉国内外知名课题组
    大方向:目标检测、深度学习、计算机视觉国内课题组:1、港中文MMdetection课题组-号称计算机视觉界的黄埔军校香港中文大学的MMDetection课题组是隶属于香港中文大学多媒体实验室(multimedialaboratory,theChineseUniversityofHongKong)的一个重要研究团队。该多媒体实验......
  • 人工智能(11)——————计算机视觉
    目录声明正文1、简介2、步骤1)图像分类2)目标检测(目标定位)3)目标跟踪4)图像分割普通分割语义分割实例分割5)图像生成3、总结声明以下内容均来自B站吴恩达教授的视频以及西瓜书和众多前辈的学习成果总结,仅记录本人的大模型学习过程,如有侵权立马删除。言论仅代表自......
  • 【SPIE出版,往届稳定EI检索】2024智能视觉与数据建模国际学术会议(ICIVD 2024,12月13-15
    2024智能视觉与数据建模国际学术会议2024InternationalConferenceonIntelligentVisionandDatamodeling(ICIVD2024)重要信息会议官网:www.iccaid.net2024InternationalConferenceonIntelligentVisionandDatamodeling(ICIVD2024)www.iccaid.......
  • NLP论文速读|Describe-then-Reason: 通过视觉理解训练来提升多模态数学的推理
    论文速读|Describe-then-Reason:ImprovingMultimodalMathematicalReasoningthroughVisualCompre-hensionTraining论文信息:简介:   该论文试图解决的问题是开源多模态大型语言模型(MLLMs)在复杂多模态数学推理任务中的表现不佳的问题。尽管这些模型在处理涉......
  • 图像分类+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别+无人机检测+A*路径规划+单
    图像分类+目标检测+目标跟踪+姿态识别+车道线识别+车牌识别+无人机检测+A*路径规划+单目测距与测速+行人车辆计数(毕设+代码)车牌识别用python3+opencv3做的中国车牌识别,包括算法和客户端界面,只有2个文件,一个是界面代码,一个是算法代码,点击即可出结果,方便易用!链接:车牌识别......
  • 《计算机视觉技术》实验报告——6.生成并去除图像噪声
    首次完成时间:2024年 10月22日去除图像噪声一.实验内容1.根据均匀噪声的原理,设计添加均匀噪声。1)程序代码:importcv2importrandomasrdimportnumpyasnpdefavg_noise(src,noise_num):    img_noise=src.copy()    rows,cols,chn=img_nois......
  • ican机器视觉仿真项目一
    相机选型3656x1492产品大小245,相机工作长度782成像面就是上面芯片尺寸相机选了1000w,镜头的也要1000w,焦距选择50mm,接近45视野长边小于产品大小,但是条形码在中间区域,短一点不影响,主要看视野短边 短边满足要求选择光源,印刷表面有反光,选同轴位置修正,先找出两条直......
  • LLM | 论文精读 | CVPR | 基于问题驱动图像描述的视觉问答增强引言
    论文标题:EnhancingVisualQuestionAnswering throughQuestion-DrivenImageCaptionsasPrompts作者:Övg̈uÖzdemir,ErdemAkagünd̈uz期刊:CVPR2024引言视觉问答(VisualQuestionAnswering,VQA)是计算机视觉与自然语言处理交叉领域中的典型多模态任......
  • Openlayers实现角度测量
    概述在前面介绍了如何在Openlayers中进行长度和面积的测量,可以参考:《Openlayers实现长度测量》,《openlayers实现面积测量》。那么如何在Openlayers中进行角度的测量呢?很遗憾ol/sphere模块中没有提供对应角度测量的API或方法,但是我们可以自己实现。实践效果展示......
  • 风电机组产生次声的来源、测量及对健康影响的综述
    摘要:居住在风电机组附近的一些人抱怨风电机组对健康产生了一系列不利影响。包括耳鸣,血压升高,心悸,心动过速,压力,焦虑,眩晕,头晕,恶心,迷糊,视力,疲劳,认知功能障碍,头痛,耳压,加重偏头痛,运动敏感,内耳损伤和睡眠剥夺。本文首先从历史回顾的预后,如振动声疾病和风电机组综合症被提出来解释报......