PETR: Position Embedding Transformation for Multi-View 3D Object Detection

news/2024/10/27 17:22:23/

PETR: Position Embedding Transformation for Multi-View 3D Object Detection

作者单位

旷视

目的

DETR3D 中 2D->3D过程 存在的问题:

  1. 预测的参考点坐标可能不准确,在采样图片特征时可能拿不到对应的特征。
  2. 只有参考点 投影位置的图像特征被使用,无法学到全局的特征。
  3. 采样图像特征的过程过于复杂,难于应用

本文的目标是 在 DETR 的基础上,提出一个 简单优雅的 3D 目标检测框架

本文的贡献总结:

  1. 提出了一个简单优雅的框架,PETR,用于多视角的 3D 目标检测。
  2. 提出了一个新的 3D position-aware 表示
  3. 在 nuScenes 数据集上达到了 sota

方法

网络结构

网络整体结构:

  1. N 个 view 的图片,送入到 backbone(resnet50) 中提取 特征
  2. 3D坐标生成器:先将图像视锥空间离散化到成 3D 的 网格,然后使用 相机的参数,变换网格的坐标,并生成 3D 空间的坐标。
  3. 3D的坐标 和 2D feature 一起送入到 3D 位置编码器中,生成 3D position-aware 特征(每个 view 对应一个 特征图)。
  4. 3D position-aware 特征 会送入到 transformer decoder 中 并且与 来自 query 生成器 的 object queries 交互
  5. 更新后的 object queries 被用于生成 目标类别 和 3D 的 bounding boxes

3D 坐标生成器:

为了建立起 2D 图像 和 3D 空间的联系,将 相机视锥空间的点 投影到 3D 空间,因为这两个空间的点 是 一一对应的。
和 DGSN 论文相同,首先 离散 相机视锥空间 生成一个 网格(shape : W_F, H_F, d),然后可以用一个 变换矩阵 将 坐标 转换到 3D 坐标,3D 空间的 是 所有 view 的相机共享的。
然后再对 3D 空间下的坐标做归一化
归一化之后的坐标 在经过一次 transposed

3D 位置编码器

3D 位置编码器的目的 是 通过 联系 2D 图像特征 与 3D 位置信息 来 获得 3D 的特征
3D 位置编码器的结构:
2D特征 经过 1x1 卷积降维,3D坐标 使用 mlp 生成 embedding,然后将两者 add ,再 使用 flatten ,生成 向量(3D position-aware feature, shape, NxHxW)

Query 生成器 和 Decoder

Query Generator:
(网络学习的是基于 最初的 object queries 的 offset ,这样有利于网络收敛。以及该网络生成的是 3D 空间下的坐标点,这样可以保证网络的收敛,本文尝试了 DETR 中的设置,或者生成 BEV 下的 anchor poitns 都不能保证收敛

首先 初始化一组可学习的 3D 世界空间的 anchor poins 服从 0到1 的均匀分布,
然后输出 两层的 mlp 中 生成 最初的object queries。

Decoder
使用的 DETR 中标准的 decoder


http://www.ppmy.cn/news/893644.html

相关文章

暴力Wi-Fi

2022年5月整理--简单方法 暴力破解WIFI密码 很多人都面临过短期租房、短期出差、而没有WIFI可用等境遇, 有的是宽带太多办不起、有的是临时一阵子不值得折腾、有的是运营商不给扯线等等原因。然后就用手机下载了WIFI智能钥匙等APP,然后发现卵用么有&…

Wi—Fi

新的Wi—Fi标准 新出现的Wi—Fi标准,如802.11ac、11ad、11aq和11ah,将提高Wi—Fi性能,使Wi—Fi成为遥测等应用更相关的技术兵且使Wi—Fi能够提供新的服务。在未来三年里,随着机构中出现更多的具有Wi—Fi功能的设备,随着…

Wi-Fi发展史

WiFi 的诞生 WiFi的历史挺长而有趣的。早在1971年, 夏威夷就覆盖了一个叫ALOHAnet的无线网络。ALOHAnet和相应的协议ALOHA就是后来的互联网和802.11协议的雏形。 Vic Hayes是公认的“WiFi之父”。WiFi的源头是来自他于1974年加入NCR公司。NCR公司后来被Agere公司合并。 1985年…

【Android - Wi-Fi】

Android - Wi-Fi Android允许应用程序访问以非常低的级别查看无线连接状态的访问权限.应用程序几乎可以访问wifi连接的所有信息. 应用程序可以访问的信息包括连接网络的链接速度,IP地址,协商状态,其他网络信息.应用程序还可以扫描&#xff…

Wi-Fi 6

# 小米10发布会 2020年2月13日,小米10发布会上提到了一项技术——Wi-Fi 6。 并配套推出了支持Wi-Fi 6功能的小米AIoT路由器AX3600(手机和路由器同时支持Wi-Fi 6,才能发挥出Wi-Fi 6的威力)。 # 何为Wi-Fi 6 ? IEEE 802.11ax,W…

Wi-Fi基础术语

AP: access point,即无线接入点,是一个无线网络的创建者,是网络的中心节点;无线路由器就是一个AP STA: station,指每一个连接到无线网络中的终端设备都可以称为一个站点 IBSS:Independent Basic Service Se…

'fi' 和 fi

今天用Edge读《Automatic Text Input Generation for Mobile Testing》,遇到specification,复制到词典查,结果没有这个词。 手打specification,却有。 觉得很神奇,然后发现fi是一个字符。 但是更神奇的是,s…

Wi-Fi 简介

Wi-Fi 简介 Wi-Fi(Wireless Fidelity)即无线保真,是一个无线网络通信技术的品牌,由Wi-Fi联盟(Wi-Fi Aliance, WFA)所拥有,WFA负责Wi-Fi的认证与商标授权。Wi-Fi是一种认证名称&…