SFM（structure from motion从运动恢复结构）和MVS(multi-view stereo多视图立体视觉)

时间：2024-09-13 21:03:01浏览次数：14

最近在开始新的领域，三维重建，其实是想做adas领域的4d label相关的工作。无奈啊，对computer graphics的东西，我一向很排斥，然后现在不得已要面对了。

首先推荐一本书，Multiple View Geometry in Computer Vision (Second Edition)，英语版本可能读着顺利些，中文的看反馈说翻译的不好。顾名思义，就是多相机几何，那就是多个相机视角下的世界，无非就是各种相机空间转换，就是矩阵计算相关的操作。

在做三维重建时，经常用到的技术，提到最多的就是SFM，MVS等，在这些概念中，其实可以说前者是后者的initialization一样的作用。

SFM是可以重建稀疏点云和相机参数(内外)，使用场景最多还是标定相机内外参，此处可参考 https://www.bilibili.com/video/BV1gR4y147Tt/?spm_id_from=333.999.0.0&vd_source=2756076b742ce0cf00a4d21dd0af6ddd 这个是北邮的老师课上介绍SFM挺清晰地。 SFM的输入是没有标定的图像，输出是稀疏点云和相机内外参。这个point cloud是稀疏的原因是，我们在SFM时，寻找的是特征点匹配上的点，不是每个像素点，所以是稀疏的。 MVS输入的是标定后的图像（就是具有相机参数的图），输出是稠密点云。所以，相机参数可以通过SFM标定，那么一组图像中重建三维模型时，我们可以首先采用SFM标定相机内外参，然后根据标定结果进行稠密点云重建。 SFM给MVS算好了输入视角的位姿(T,R外参)、内参、稀疏点云以及它们的共视关系，MVS再利用这些信息以及彩色图来估计深度图以及做最后的fusion还有点云过滤等。SFM是camera tracking, 而MVS是深度估计depth map estimation 和深度融合depth fusion。在实际使用中，一般是SFM进行相机标定，然后采用MVS重建稠密点云。这几年CG发展受到了极大的关注，主要是两个方向，一个是NeRF, 另外一个是3d Gaussian splatting。这两个其实算是替代掉了mvs以及后面的工作，一般前面还是会需要SFM的过程，因为这个过程是估计相机内外参和旋转参数的，即使是有工作觉得用SFM得到的点云过于稀疏，或者参数不够精确，会用lidar的数据来替代，但是并不代表SFM这个过程没有了，只是用了更精确的方法。但是如果只有相机信息来做三维重建，那没办法了，只能用SFM+NERF或者gaussian splatting了。三维重建目前已经在很多领域应用非常广泛了，尤其是这两年在adas领域，但是adas领域有个非常大的问题是，adas是动态场景，而上述的方法，对动态物体重建时会出现黑洞现象，具体原因还没看明白，猜测主要原因是，在SFM过程中，我们估计的是相机的内外参和旋转矩阵，但是并没有真正给出来实际世界坐标下的位置，而一旦物体是动态的了，就决定了彼此之间的位置就变得复杂了，不能再简单的像之前SFM那样进行估算参数了。因此，动态场景下，目前都要有lidar真值来作为一个监督信息进行建模。但是，现在有个问题，如果我没有lidar，那我该咋对动态物体进行重建呢？我还没看懂这块，有懂的行家请给点建议，谢谢。

标签：multi,MVS,标定,视图,相机,SFM,点云,三维重建
From： https://www.cnblogs.com/jianyingzhou/p/18412868

mysql创建视图
--CreatetablecreatetableODS_QMS.QMS_TRIAL_PROVIDE_BAD_INFORMATION(idVARCHAR2(36),date_tVARCHAR2(30),factoryVARCHAR2(16),provide_codeVARCHAR2(16),provide_nameVARCHAR2(16),marer......
多模态（Multimodality）是一个涉及多个领域和层面的概念
多模态（Multimodality）是一个涉及多个领域和层面的概念，主要指的是同时使用两种或多种感官（如视觉、听觉、触觉、嗅觉等）进行信息交互的方式。在人工智能领域，多模态技术则是指将不同类型的数据和信息进行融合，以实现更加准确、高效的人工智能应用。以下是对多模态的详细介绍：一、......
MySQL视图
一、常见的数据库对象对象描述表(TABLE)表是存储数据的逻辑单元，以行和列的形式存在，列就是字段，行就是记录数据字典就是系统表，存放数据库相关信息的表。系统表的数据通常由数据库系统维护，程序员通常不应该修改，只可查看约束(CONSTRAINT)执行数据校验的规则，用于保证数据完整性的规......
3D异常检测最新论文《Complementary Pseudo Multimodal Feature for Point Cloud Anom
本文是曹云康24年投稿至《PattenRecognition》的文章，是目前在MVTec3D-AD数据集上的3D异常检测SOTA。之所以被分类到3D异常检测类别，是因为这篇文章中仅使用了点云数据进行检测，未使用RGB模态。同样，文章中也指出了它所使用的多模态其实是“伪模态”，是将点云投影到2......
探索MySQL视图的无限可能：优化查询、增强数据安全与简化数据访问
作者简介：我是团团儿，是一名专注于云计算领域的专业创作者，感谢大家的关注座右铭：云端筑梦，数据为翼，探索无限可能，引领云计算新纪元个人主页：团儿.-CSDN博客目录前言：正文：1.视图的定义：2.视图的优点：简单化：安全性：逻辑数据独立性：3.创建单表视图创表：插入数据：创建......
Stable Diffusion直接生成IP三视图，一招搞定，不用手绘和建模？（附模型）
有了这套拆解公式，IP三视图简简单单！**SD生成一个Q版IP三视图模型。**标准的三视图，并且极富设计感，IP设计师的好帮手，用来辅助创意，建模参考。这个模型一般不需堆叠复杂的质量词，直接输入你想要的内容即可，描述越复杂可能效果越不是你想要的。一招搞定，不用手绘和建模？哪怕没有......
multipath多路径硬盘扩容
Rose+多路径环境操作前建议先记录相关硬盘信息，如cat/etc/multipath.confmultipath-llls-l/dev/mapper/lsblk-fcat/etc/multipath/wwidscat/etc/multipath/bindings新增硬盘以从节点1查看相关信息为例首先存储中新建卷app2，设置大小为220G，并分别映射至两个主机......
5G Multicast/Broadcast Services(MBS) (三)Broadcast
这篇是Broadcast的overview，正文开始。值得注意的是，对于5MBSbroadcast，UE处于RRCidle/RRC connected/Inactive时，网络侧都可以通过MRB将MBS广播数据传输到UE。对于Broadcast涉及的RNTI有G-RNTI以及MCCH-RNTI。1SessionManagement对于特定服务，将执行以下阶段：(1)MBS......
SortableTableView：Android 表格视图库
在Android应用开发中，提供用户交云和数据展示的功能是非常重要的。SortableTableView是一个开源的Android库，它提供了一个简单的TableView组件以及一个更高级的可排序TableView，允许开发者实现复杂的表格视图和数据排序功能。文章目录......

SFM（structure from motion从运动恢复结构）和MVS(multi-view stereo多视图立体视觉)

相关文章

赞助商

阅读排行