首页 > 其他分享 >[Paper Reading] Multi-modal 3D Human Pose Estimation with 2D Weak Supervision in Autonomous Driving

[Paper Reading] Multi-modal 3D Human Pose Estimation with 2D Weak Supervision in Autonomous Driving

时间:2024-11-22 22:13:14浏览次数:1  
标签:Multi Human Pose Label 2D modal Estimation 3D

目录

Multi-modal 3D Human Pose Estimation with 2D Weak Supervision in Autonomous Driving

link
时间:CVPR2022
作者与单位:

相关领域:3D Human Pose Estimation、autonomous vehicles
作者相关工作:人脸识别
https://scholar.google.com/citations?user=Cc4I1vYAAAAJ&hl=en
被引次数:39
主页:无

TL;DR

自动驾驶场景的3D人体姿态估计数据量少,并且与其它场景无法复用数据。本文提出一种使用Lidar + Camera模态作为输入,利用2D标签作为弱监督信号,来估计3D人体姿态的方法。效果方面比纯视觉提升22%,比纯Lidar模型提升6%。

Method

算法架构

Modality Fusion of LiDAR and Camera

将3D点云Project为2D点,利用这些点位置在图像heatmap上grid_sample出图像特征点,再与对应的3D点云Concat,获得两种模态融合的特征。

Auxiliary Pointwise Segmentation Branch

主要解决两个问题:

  • 有2D点Label,如何获取3D点Label?
  • 点云中的3D点,哪些是某个Joint的正样本?哪些是负样本?=> 用来作为点云Segmentation的GT。

核心处理思想是将点云投影到2D图像,与2D Label通过匹配机制来获取对应的3D的Label。

Implementation

使用Waymo Open Dataset,共19.7w行人。训练集本身有2D Label,测试集中2D Label是本工作中自己标注的。

Experiment


效果可视化

总结与思考

模态融合方式及2D Label构造3D Label的方式比较巧妙。

相关链接

引用的第三方的链接

资料查询

折叠Title FromChatGPT(提示词:XXX)

标签:Multi,Human,Pose,Label,2D,modal,Estimation,3D
From: https://www.cnblogs.com/fariver/p/18563782

相关文章

  • multi-agent-orchestrator aws 开源的多agent 调度框架
    multi-agent-orchestrator是aws开源的多agent调度框架包含的特性多agent调度多语言支持,目前支持python以及typescript包含智能意图分类,可以方便的基于查询以及动态路由灵活的agent响应,支持流以及非流出来支持上下文管理,可以方便的处理一致的上下文交互扩展架构,简单......
  • [PaperReading] EgoPoseFormer: A Simple Baseline for Stereo Egocentric 3D Human P
    目录EgoPoseFormer:ASimpleBaselineforStereoEgocentric3DHumanPoseEstimationTL;DRMethodDeformableStereoAttentionExperiment效果可视化总结与思考相关链接资料查询EgoPoseFormer:ASimpleBaselineforStereoEgocentric3DHumanPoseEstimationlink时间:EC......
  • 多目标优化算法:多目标伞蜥优化算法Multi-objective Frilled Lizard Optimization求解D
    一、伞蜥优化算法伞蜥优化算法(FrilledLizardOptimization,FLO)是2024年提出的一种新颖的元启发式算法,它模仿了伞蜥在其自然栖息地中独特的狩猎行为。该算法的核心原则被详细地描述并数学结构化为两个不同的阶段:(i)探索阶段,模仿蜥蜴对猎物的突然攻击;(ii)开发阶段,模拟蜥......
  • 多目标优化算法:多目标极光优化算法(Multi-objective Polar Lights Optimization, MOPLO
    一、极光优化算法极光优化算法(PolarLightsOptimization,PLO)是2024年提出的一种新型的元启发式优化算法,它从极光这一自然现象中汲取灵感。极光是由太阳风中的带电粒子在地球磁场的作用下,与地球大气层中的气体分子碰撞而产生的光显示。PLO算法通过模拟这些带电粒子的运动......
  • 【MATLAB代码】基于IMM(Interacting Multiple Model)算法的目标跟踪,所用模型:CV、CA、CT
    文章目录3个模型的IMM(代码简介)源代码运行结果代码介绍总结3个模型的IMM(代码简介)本MATLAB代码实现了基于IMM(InteractingMultipleModel)算法的目标跟踪。它使用三种不同的运动模型(匀速直线运动、左转弯和右转弯)来预测目标的位置,并通过卡尔曼滤波进行状态估计。源代......
  • 【伪造检测】Noise Based Deepfake Detection via Multi-Head Relative-Interaction
    一、研究动机[!note]动机:目前基于噪声的检测是利用PhotoResponseNon-Uniformity(PRNU)实现的,这是一种由于相机感光传感器而造成的缺陷噪声,主要用图像的源识别,在伪造检测的任务中并没有很好的表现。因此在文中提出了一种基于伪造噪声痕迹的检测算法。实现原理:通过提取伪造视......
  • DM multipath总结---基于LINUX 7
    DMmultipath总结---基于LINUX7DMmultipath总结DMMultipath提供的功能:冗余:    DMMultipath能够在主动/被动配置下提供故障转移。在主动/被动配置下,只有一半的路径在每次进行I/O时会被使用。若一条I/O路径的任一元素(电缆、交换器或者控制器)出现故障,DMMultipat......
  • SurroundOcc_ Multi-Camera 3D Occupancy Prediction for Autonomous Driving
    SurroundOcc:Multi-Camera3DOccupancyPredictionforAutonomousDrivingZoteroAbstract3Dsceneunderstandingplaysavitalroleinvision-basedautonomousdriving.Whilemostexistingmethodsfocuson3Dobjectdetection,theyhavedifficultydescribin......
  • <a-modal>打开页面报错Ancestor with aria-hidden
    报错信息Blockedaria-hiddenonanelementbecauseitsdescendantretainedfocus.Thefocusmustnotbehiddenfromassistivetechnologyusers.Avoidusingaria-hiddenonafocusedelementoritsancestor.Considerusingtheinertattributeinstead,whichwi......
  • [ABC221H] Count Multiset
    给定\(n,m\)。对于每个\(k=1,2,\dots,n\),求解有多少大小为\(k\)的正整数可重集的元素和为\(k\),且每个元素的出现次数都\(\lem\)。\(m\len\le5000\)。可重集转化成单调不降的序列\(a\)。在通过差分转化成任意非负整数序列\(b\)(需要保证\(b_1>0\))。可重集中......