6D姿态估计和3D 目标检测(区别)

news/2024/11/17 2:54:50/

1.物体的6D姿态(相机系下的重心xyz+三轴的夹角abc)更完备,有物体的3D模型才有对应的6D姿态,这样就可以再计算得到size(s1,s2,s3);而目前3D检测,输入是重力方向校正的,得到的是对应完整物体的中心x,y,z,以及水平面内的夹角a,以及估计的size(s1,s2,s3);
2.6D姿态的角度范围可以是360度,但3D检测只能得到180度,因为物体旋转180度,3D包围盒不变;3.6D姿态准确度高,但受限于实例级别物体的应用,3D检测可扩展性强,但因为没有物体实例,只能基于整体的3D包围盒开展应用,如果想要对物体上的局部操作,需要依靠6D姿态得到具体局部位置或者进行语义理解;

通俗的说,物体6D位姿预测的是三个角度,而3D检测是一个角度;6D位姿目前主要是实例级别的,而3D检测更多的是类别级的;6D姿态的文章通常用空间三个角度旋转的包围盒展示6D位姿的预测结果,由于模型已知,物体的3D模型可以结合6D位姿投影到2D得到物体的mask区域;而3D检测只是在水平面上旋转的包围盒,而且投影到2D后只能得到BBox区域;有了6D的物体位姿,可以指定物体的机器人抓取部位,而只有3D检测,可以做一些避障的工作;


http://www.ppmy.cn/news/253091.html

相关文章

论文笔记(二十八):MegaPose: 6D Pose Estimation of Novel Objects via Render Compare

MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare 文章概括摘要1. 介绍2. 相关工作3. 模型3.1 技术方法3.2 训练流程 4. 实验4.1 数据集和指标4.2 新型物体的6D姿势估计4.3 消融4.4 限制 5. 结论 文章概括 作者:Labb, Y., Manuelli, L., M…

笔记:DenseFusion: 6D Object Pose Estimation by Iterative Dense Fusion

DenseFusion: 6D Object Pose Estimation by Iterative Dense Fusion(CVPR2019) 原文:https://ieeexplore.ieee.org/document/8953386 代码和视频:https://sites.google.com/view/densefusion/ Github:https://github.…

Real-Time Seamless Single Shot 6D Object Pose Prediction代码复现

开源代码链接:https://github.com/Microsoft/singleshotpose/ 1、我的设备环境 电脑系统:win10 运行平台:pycharm 框 架:pytorch, torchvision 0.11.3 torch 1.10.2 2、准备文件 (1)代码 github上下: 解压即可。…

活动报名|港中文博士生陈凯:6D物体位姿估计及其在机器人抓取中的应用

11月30日(周三)晚上19:00「青源Live 第56期丨6D物体位姿估计及其在机器人抓取中的应用 」将在线举办,来自香港中文大学计算机科学与工程学系的博士生陈凯(师从窦琪教授)做报告分享,欢迎预约观看并参与线上交…

经典<6D姿态估计算法>汇总

参考链接:机械臂抓取---(1)概述 - PeterPeng7997 - 博客园 (cnblogs.com) 17篇6D姿态估计算法汇总(含论文,代码及解读) 6D位姿估计(开源包含视频测试) 1.Dense Fusion 原文链接&…

如何理解物体的6D位姿估计任务?

关键词:三维位置、三维朝向、物体坐标系、世界坐标系、相机坐标系、成像坐标系、像素坐标系、三维模型、3D坐标值、2D像素点、投影点、物体中心点、关键点、旋转R、平移t、PnP 如何“感性”地理解物体的6D姿态估计任务? 答: 三维世界中&…

PoseCNN DOPE Yolo-6D对比总结

一、介绍 首先看一下时间线: PoseCNN(2018.05)→DOPE(2018.07)→Yolo-6D(2018.12) PoseCNN是三者里最早发布的文章,对后续的文章会起到一定的借鉴作用。比如,DOPE在处理遮罩问题,回归2D中心点时就借鉴了PoseCNN中向量领域的概念…

FFB6D A Full Flow Bidirectional Fusion Network for 6D Pose EstimationFFB6D 6D 姿势估计的全流双向融合网络

文章目录 摘要解决问题贡献方法LOSS 3D-3D对应 摘要 在这项工作中,我们提出了 FFB6D,这是一种全流双向融合网络,专为从单个 RGBD 图像进行 6D 姿态估计而设计。我们的主要见解是 RGB 图像中的外观信息和深度图像中的几何信息是两个互补的数…