首页 > 其他分享 >monocular 3D detection小结

monocular 3D detection小结

时间:2024-06-18 10:57:40浏览次数:20  
标签:loss monocular detection depth https L1 2d 3D 3d

smoke

参考https://zhuanlan.zhihu.com/p/452676265

monodle

通过大量密集实验(逐步用gt替换预测值测试),localization error是3d 检测的关键。
提出三点策略:
1.重新思考了2d中心和3d中心的不对齐影响(用3d center替换2d center能提高性能,且2d检测能作为辅助任务帮助3d检测)
2.去除较远样本,避免误导训练
3.提出新的3d IoU loss

训练loss

共7个loss
● 1个分类损失
○ heatmap-Focal Loss
● 2d 检测 2个loss
○ center offset-L1 loss
○ size-L1 loss
● 3d检测 4个loss
○ center offset- L1 loss
○ size- L1 loss
○ depth-uncertainty loss
○ heading angle-multi_bin loss(12 bins)

实验配置

batchsize=16
max-epoch=140 [90, 120]
lr=1.25e-3
adam
weight_deacy=1e-5
warmup 5epochs

augment:
random crop/scale (2d detection only)
random horizontal filp

inference:
nms 3x3 max pooling
score_thres=0.2

解读参考

https://blog.csdn.net/weixin_43799388/article/details/128449631?spm=1001.2014.3001.5502

monoflex

Edge heatmap

针对truncated(截断) 目标,区分普通目标,使用edge heatmap

uncertainty ensemble

不确定度建模使用在两方面:
1.直接回归depth。
2.几何关系。回归10个corner的2d位置,通过几何关系h2d和h3d,计算出三组depth,对这三组depth进行不确定性建模。
第一点同GUPNet,第二点GUPNet也利用了几何关系,但是对预测的h3d 不确定性建模。
最终的深度使用soft ensemble方式得到:

解读参考

https://blog.csdn.net/weixin_43799388/article/details/128161179?spm=1001.2014.3001.5502

monoDDE



回归更多的深度信息,20个深度(1个直接深度、3个height depth、16个keypoint depth)

参考论文

https://blog.csdn.net/weixin_43799388/article/details/129369984?spm=1001.2014.3001.5502

标签:loss,monocular,detection,depth,https,L1,2d,3D,3d
From: https://www.cnblogs.com/dingz/p/18253889

相关文章

  • lidar 3D decetion小结
    1.pointnetpointnet++:实现基于点云的分类和语义分割。提出了基于点云的特征提取网络。(https://zhuanlan.zhihu.com/p/336496973)2.VoxelNet:第一篇提出将点云转体素,进行3d检测。https://zhuanlan.zhihu.com/p/3524193163.SECOND:用spconv替换3d卷积,减少计算量。https://zhuanlan......
  • 3DS MAX课程结业实验报告书
    一、实验内容选题13题目:安静人生模型:表、沙发、抱枕二、实验说明实验工具:3dsmax文具+3DSMAX布料模拟动画插件CGTrader–PolyClothv2.06for3dsMax2016-2024实验课时:两周实验方法:自主制作任务:完成3dsmax源文件的制作,提交实验报告三、实验过程3.1安装......
  • AI + 3D:用单个图像和文本提示创建可交互的3D世界
    你是否曾经梦想过只需一张照片和一些简单的文字描述,就能立即进入一个生动的3D虚拟世界?今天,我们将介绍一个革命性的技术,它就像是一台神奇的3D场景制造机,能够根据你的想象快速构建出令人惊叹的虚拟空间。一、技术概览这项技术不仅仅是一个简单的图像到3D的转换工具,更是一个完整......
  • (slam工具)4 3D点集配准相似变换sRt计算
      https://github.com/Dongvdong/v1_1_slam_tool  importrandomimportmathimportnumpyasnpimportosdefAPI_pose_estimation_3dTo3d_ransac(points_src,points_dst):#NED->slamp=np.array(points_src,dtype=float)q=np.array(......
  • Rayfire 1.85 for 3DSMax软件安装包下载 丨不限速下载丨亲测好用
    软件简介:RayFireTool是3DSMax的高级插件,被广泛引用雨制作很多各种高级特效,如物体碎裂、毁灭、拆毁大型建筑、毁坏、分解、大范围破坏、炸毁、爆破、爆炸、引爆等效果,以及其他类似特效。这些你一直想要的大场面效果,都可以在3dsMax中使用RayFire来实现,安装包获......
  • 11大3D模型销售网站
     无法决定是在在线市场上销售3D模型还是在电子商务平台上销售?让我们帮助你。在这篇博文中,我们列出了10个在线销售3D模型的最佳网站。我们还列出了每个平台的优缺点,以便你做出明智的决定。那么,让我们开始吧!1、SellfySellfy是一种易于使用的电子商务解决方案,具有大......
  • 3D工艺大师:航空航天手册的数字蜕变
    在航空航天领域,技术手册是飞行器操作与维修工作的核心参考工具。常见的技术手册包括AMM(航空器维护手册)、CMM(航空部件维修手册)以及WDM(飞机重量与平衡手册)等,主要用于帮助机组工作人员进行飞行器的操作、维护和修复工作。而技术手册的制作是一项复杂且严谨的工作。常规操作1......
  • Linux下基于USB的WiFi(RTL8723DU):驱动、wpa_supplicant配置、hostapd配置等
    1WiFi基本概念WLAN(WirelessLAN)是无线局域网的意思。IEEE802.11是现今无线局域网通用的标准。关于802.11协议介绍参考《80211协议介绍》。信道也就是频段,是以无线信号作为传输载体的数据信号传送通道。802.11工作组划分了4个独立的频段:2.4GHz、3.6GHz、4.9GHz和5.8......
  • AI预测福彩3D采取888=3策略+和值012路或胆码测试6月15日新模型预测第5弹
            今天咱们继续验证新模型的8码定位=3,目前新模型新算法8码定位经过4次测试,已命中3次,9码定位连续命中4次。咱们重点是预测8码定位=3+和值012+胆码。有些朋友看到我最近几篇文章没有给大家提供缩水后的预测详情,在这里解释下:其实我每篇文章中既有8码定位,也有和值012......
  • 【python】用panda3d实现简易版《Minecraft》
    1.下載panda3d等等     panda3d是python的一个第三方库,在Windows的cmd下输入即可下載:pipinstallpanda3d     另外还用了 PIL,Pmw,ttkbootstrap這些第三方库,下載方式同上。。。2.方块模型     对于建模小白来说,blender有亿点难!! (资源放......