首页 > 其他分享 >SFM(structure from motion从运动恢复结构)和MVS(multi-view stereo多视图立体视觉)

SFM(structure from motion从运动恢复结构)和MVS(multi-view stereo多视图立体视觉)

时间:2024-09-13 21:03:01浏览次数:10  
标签:multi MVS 标定 视图 相机 SFM 点云 三维重建

最近在开始新的领域,三维重建,其实是想做adas领域的4d label相关的工作。无奈啊,对computer graphics的东西,我一向很排斥,然后现在不得已要面对了。

首先推荐一本书,Multiple View Geometry in Computer Vision (Second Edition),英语版本可能读着顺利些,中文的看反馈说翻译的不好。顾名思义,就是多相机几何,那就是多个相机视角下的世界,无非就是各种相机空间转换,就是矩阵计算相关的操作。

 

在做三维重建时,经常用到的技术,提到最多的就是SFM,MVS等,在这些概念中,其实可以说前者是后者的initialization一样的作用。

SFM是可以重建稀疏点云和相机参数(内外),使用场景最多还是标定相机内外参,此处可参考 https://www.bilibili.com/video/BV1gR4y147Tt/?spm_id_from=333.999.0.0&vd_source=2756076b742ce0cf00a4d21dd0af6ddd   这个是北邮的老师课上介绍SFM挺清晰地。 SFM的输入是没有标定的图像,输出是稀疏点云和相机内外参。这个point cloud是稀疏的原因是,我们在SFM时,寻找的是特征点匹配上的点,不是每个像素点,所以是稀疏的。 MVS输入的是标定后的图像(就是具有相机参数的图),输出是稠密点云。 所以,相机参数可以通过SFM标定,那么一组图像中重建三维模型时,我们可以首先采用SFM标定相机内外参,然后根据标定结果进行稠密点云重建。 SFM给MVS算好了输入视角的位姿(T,R外参)、内参、稀疏点云以及它们的共视关系,MVS再利用这些信息以及彩色图来估计深度图以及做最后的fusion还有点云过滤等。SFM是camera tracking, 而MVS是深度估计depth map estimation 和深度融合depth fusion。在实际使用中,一般是SFM进行相机标定,然后采用MVS重建稠密点云。 这几年CG发展受到了极大的关注,主要是两个方向,一个是NeRF, 另外一个是3d Gaussian splatting。这两个其实算是替代掉了mvs以及后面的工作,一般前面还是会需要SFM的过程,因为这个过程是估计相机内外参和旋转参数的,即使是有工作觉得用SFM得到的点云过于稀疏,或者参数不够精确,会用lidar的数据来替代,但是并不代表SFM这个过程没有了,只是用了更精确的方法。但是如果只有相机信息来做三维重建,那没办法了,只能用SFM+NERF或者gaussian splatting了。   三维重建目前已经在很多领域应用非常广泛了,尤其是这两年在adas领域,但是adas领域有个非常大的问题是,adas是动态场景,而上述的方法,对动态物体重建时会出现黑洞现象,具体原因还没看明白,猜测主要原因是,在SFM过程中,我们估计的是相机的内外参和旋转矩阵,但是并没有真正给出来实际世界坐标下的位置,而一旦物体是动态的了,就决定了彼此之间的位置就变得复杂了,不能再简单的像之前SFM那样进行估算参数了。因此,动态场景下,目前都要有lidar真值来作为一个监督信息进行建模。但是,现在有个问题,如果我没有lidar,那我该咋对动态物体进行重建呢?   我还没看懂这块,有懂的行家请给点建议,谢谢。

标签:multi,MVS,标定,视图,相机,SFM,点云,三维重建
From: https://www.cnblogs.com/jianyingzhou/p/18412868

相关文章

  • mysql创建视图
    --CreatetablecreatetableODS_QMS.QMS_TRIAL_PROVIDE_BAD_INFORMATION(idVARCHAR2(36),date_tVARCHAR2(30),factoryVARCHAR2(16),provide_codeVARCHAR2(16),provide_nameVARCHAR2(16),marer......
  • 多模态(Multimodality)是一个涉及多个领域和层面的概念
    多模态(Multimodality)是一个涉及多个领域和层面的概念,主要指的是同时使用两种或多种感官(如视觉、听觉、触觉、嗅觉等)进行信息交互的方式。在人工智能领域,多模态技术则是指将不同类型的数据和信息进行融合,以实现更加准确、高效的人工智能应用。以下是对多模态的详细介绍:一、......
  • MySQL视图
    一、常见的数据库对象对象描述表(TABLE)表是存储数据的逻辑单元,以行和列的形式存在,列就是字段,行就是记录数据字典就是系统表,存放数据库相关信息的表。系统表的数据通常由数据库系统维护,程序员通常不应该修改,只可查看约束(CONSTRAINT)执行数据校验的规则,用于保证数据完整性的规......
  • [20240911]查看超长视图的定义2.txt
    [20240911]查看超长视图的定义2.txt--//昨天看了链接:https://www.anbob.com/archives/8295.html,提供了另外的方式获得超长定义试图的长文本。--//我重复验证看看.1.环境:SYS@book>@ver2==============================PORT_STRING                  :x86_6......
  • 3D异常检测最新论文《Complementary Pseudo Multimodal Feature for Point Cloud Anom
        本文是曹云康24年投稿至《PattenRecognition》的文章,是目前在MVTec3D-AD数据集上的3D异常检测SOTA。之所以被分类到3D异常检测类别,是因为这篇文章中仅使用了点云数据进行检测,未使用RGB模态。同样,文章中也指出了它所使用的多模态其实是“伪模态”,是将点云投影到2......
  • 探索MySQL视图的无限可能:优化查询、增强数据安全与简化数据访问
     作者简介:我是团团儿,是一名专注于云计算领域的专业创作者,感谢大家的关注 座右铭:   云端筑梦,数据为翼,探索无限可能,引领云计算新纪元 个人主页:团儿.-CSDN博客目录前言:正文:1.视图的定义:2.视图的优点:简单化:安全性:逻辑数据独立性:3.创建单表视图创表:插入数据:创建......
  • Stable Diffusion直接生成IP三视图,一招搞定,不用手绘和建模?(附模型)
    有了这套拆解公式,IP三视图简简单单!**SD生成一个Q版IP三视图模型。**标准的三视图,并且极富设计感,IP设计师的好帮手,用来辅助创意,建模参考。这个模型一般不需堆叠复杂的质量词,直接输入你想要的内容即可,描述越复杂可能效果越不是你想要的。一招搞定,不用手绘和建模?哪怕没有......
  • multipath多路径硬盘扩容
    Rose+多路径环境操作前建议先记录相关硬盘信息,如cat/etc/multipath.confmultipath-llls-l/dev/mapper/lsblk-fcat/etc/multipath/wwidscat/etc/multipath/bindings新增硬盘以从节点1查看相关信息为例首先存储中新建卷app2,设置大小为220G,并分别映射至两个主机......
  • 5G Multicast/Broadcast Services(MBS) (三)Broadcast
    这篇是Broadcast的overview,正文开始。值得注意的是,对于5MBSbroadcast,UE处于RRCidle/RRC connected/Inactive时,网络侧都可以通过MRB将MBS广播数据传输到UE。对于Broadcast涉及的RNTI有G-RNTI以及MCCH-RNTI。1SessionManagement对于特定服务,将执行以下阶段:(1)MBS......
  • SortableTableView:Android 表格视图库
    在Android应用开发中,提供用户交云和数据展示的功能是非常重要的。SortableTableView是一个开源的Android库,它提供了一个简单的TableView组件以及一个更高级的可排序TableView,允许开发者实现复杂的表格视图和数据排序功能。文章目录......