论文解读｜进一步融合：体积融合中6D姿态估计的多对象推理

原创 | 文 BFT机器人

论文解读｜进一步融合：体积融合中6D姿态估计的多对象推理_ide

01 背景

机器人等智能设备需要从它们的车载视觉系统中获得高效的基于物体的场景表示，以解释接触、物理和遮挡。已识别的精确对象模型将与未识别结构的非参数重建一起发挥重要作用。

本文提出了一个系统用于估计实时的接触和遮挡的精确姿态。从单个RGBD视图中提出三维对象姿态建议，在摄像机移动时从多个视图中积累姿态估计和非参数占用信息，并执行联合优化，以估计接触中的多个对象的一致的、不相交的姿态。

本文在两个对象数据集上通过实验验证了该方法的准确性和鲁棒性：YCB-Video和具有挑战性的杂乱的YCB-Video。

其具有周围空间感知的姿态预测，预测网络接收占用网格作为对象的不可穿透空间；多对象姿态的联合优化，对多对象的场景配置进行评估和更新；将融合和6D姿态作为实时系统，利用目标级体积图进行增量和精确的姿态估计。

机器设备在执行复杂的任务的时候，需要从相机中捕捉信息，从而对物体之间的接触、物理和遮挡进行推理，实现它们在混乱的环境中进行精确操作。一些短期任务通过端到端连接感知和动作的端到端学习模型来完成，但扩展和多阶段的任务可以在以后3D场景表示展现出巨大的潜力。

论文解读｜进一步融合：体积融合中6D姿态估计的多对象推理_数据集_02

图1 显示的是我们在一个实时的机器人抓取应用程序中演示了该系统

论文解读｜进一步融合：体积融合中6D姿态估计的多对象推理_ide_03

图2 6D姿态估计系统

本文使用YCB-Video数据集在之前的工作中被广泛用于评估6D姿态估计，但由于所有的场景都是桌面的，该数据集在对象方向和遮挡的多样性方面受到限制。

MoreFusion系统在YCB-Video和ClutteredYCB-Video两个物体数据集上进行了实验验证，并与其他方法进行了对比。

实验结果表明，MoreFusion系统在物体姿态估计方面具有更高的准确性和鲁棒性，特别是在存在遮挡和复杂背景的情况下。

此外，MoreFusion系统还可以在实时机器人应用程序中实现高效的物体检测和姿态估计，从而实现了机器人在复杂环境中精确有序地拆卸物体堆的能力。

因此，MoreFusion系统的主要优势是：具有周围空间感知的姿态预测、多物体姿态的联合优化和融合、6D姿态的完全集成以及在复杂环境中实现高效的物体检测和姿态估计。

作者 | George

排版 | 居居手

更多精彩内容请关注公众号：BFT机器人

本文为原创文章，版权归BFT机器人所有，如需转载请与我们联系。若您对该文章内容有任何疑问，请与我们联系，将及时回应。

标签：6D,预测,对象,物体,融合,估计,体积,推理,姿态
From： https://blog.51cto.com/bftrobot/6905832