论文阅读--Planning-oriented Autonomous Driving(二)

devtools/2024/9/24 10:48:11/

自动驾驶框架的各种设计比较。

( a )大多数工业解决方案针对不同的任务部署不同的模型。

( b )多任务学习方案共享一个具有分割任务头的主干。

( c )端到端范式将感知和预测模块统一起来。以往的尝试要么采用( c.1 )中对规划的直接优化,要么采用( c.2 )中的部分元件设计系统。相反,我们在( c.3 )中主张,一个理想的系统应该以规划为导向,并适当地组织前期工作以促进规划。

1.创新点

     在这篇文献《Planning-oriented Autonomous Driving》中,作者提出了一个创新的自动驾驶系统框架UniAD,它以规划为核心,将感知、预测和规划任务集成在一个统一的网络中,通过基于查询的设计实现不同模块间的有效通信和信息共享。UniAD采用端到端的训练方法,允许直接从传感器数据学习到规划结果,强调了对规划模块的专门设计,包括自我车辆的显式建模和环境交互。此外,系统引入了非线性优化策略来提高运动预测的物理可行性,并通过同时考虑实例级和场景级信息来增强占用预测的准确性。在nuScenes基准测试中,UniAD展现出显著的性能提升,证明了其在规划安全性和准确性方面的优势。整个系统在保持计算效率的同时,为自动驾驶技术的发展提供了一个全面、协调且高效的解决方案。

2.规划导向系统设计具体是如何实现的?

       规划导向系统设计通过创建一个名为UniAD的统一网络框架实现,该框架整合了自动驾驶的关键任务,包括感知、预测和规划,以规划为核心目标进行端到端的优化。通过基于查询的交互方式,UniAD促进了任务间的有效通信和信息共享,同时采用非线性优化策略来提高运动预测的物理可行性,并结合实例级与场景级的占用预测,为规划模块提供了精确的环境理解。此外,规划模块利用从感知和预测模块中提取的信息,考虑自我车辆的动态和环境的占用状态,生成安全有效的轨迹。这种设计在nuScenes基准测试中验证了其在规划安全性和准确性方面的优势,展示了显著的性能提升。
 

3.方法论

统一自动驾驶框架( Uniad )。它是精心设计的遵循规划为导向的哲学。我们不是简单的任务堆叠,而是研究每个模块在感知和预测中的作用,利用从前节点到最终规划的联合优化在驾驶场景中的好处。所有感知和预测模块均采用转换器解码器结构设计,任务查询作为连接各节点的接口。最后,一个简单的基于注意力的规划器考虑从前面节点提取的知识来预测自我车辆的未来路径点。超占地图仅供视觉使用。

UniAD系统能够实现一个高度集成和协调的自动驾驶解决方案,强调了规划在自动驾驶系统中的核心地位。

3.1 系统概览

UniAD系统由四个基于Transformer解码器的感知和预测模块以及一个规划器组成。这些模块通过查询(queries)相互连接,以模拟驾驶场景中实体间的不同交互。系统处理多摄像头图像,将视角视图特征转换为统一的鸟瞰视图(BEV)特征,然后进行进一步的处理和规划。

3.2 感知模块

3.2.1 跟踪和映射(TrackFormer 和 MapFormer)

  • TrackFormer:负责检测和多目标跟踪(MOT),无需非可微的后处理。它使用检测查询和跟踪查询来分别处理新出现的目标和已跟踪目标。
  • MapFormer:基于2D全景分割方法,将道路元素(如车道、分隔线和交叉口)作为地图查询,执行语义分割。

3.3 预测模块

3.3.1 运动预测(MotionFormer)

  • 利用来自TrackFormer和MapFormer的动态代理和静态地图的查询,预测所有代理的多模态未来运动。
  • 通过场景中心的方式,一次前向传播产生多代理轨迹,节省计算成本。

3.3.2 占用预测(OccFormer)

  • 预测未来时间步的占用网格图,考虑场景级别的语义和代理级别的动态。
  • 使用注意力模块在时间上展开未来预测,同时保持代理身份。

3.4 规划模块

  • 将从MotionFormer得到的自我车辆查询与BEV特征结合,预测未来路径点。
  • 通过牛顿方法在推理阶段优化路径,避免与预测的占用区域发生碰撞。

3.5 学习策略

  • 两阶段训练:首先独立训练感知模块,然后进行端到端训练,包括所有模块。
  • 共享匹配:使用二分图匹配算法在跟踪和映射阶段进行预测与真实值的匹配。

3.6 实现细节

  • 检测和跟踪:使用Deformable DETR头进行检测,引入跟踪查询以实现端到端跟踪。
  • 在线映射:将道路元素分为“thing”和“stuff”,进行实例和语义分割。
  • 运动预测:采用Transformer结构,通过多模态预测和非线性优化策略生成物理上可行的轨迹。
  • 占用预测:通过注意力机制和多步交互预测未来的占用网格图。
  • 规划:使用自我车辆查询和BEV特征进行规划,优化路径以避免碰撞。

3.7 损失函数

  • 定义了各种任务的损失函数,包括跟踪、映射、运动预测、占用预测和规划,以确保模型在训练过程中能够学习到各个任务的特性和需求。

4.实验

4.1 实验设置

  • 数据集:使用nuScenes数据集进行实验,这是一个多模态自动驾驶数据集,包含丰富的交通场景和传感器数据。
  • 评估指标:采用多种指标来评估系统性能,包括跟踪准确性(AMOTA、AMOTP)、预测误差(minADE、minFDE)、规划安全性(L2误差、碰撞率)等。

4.2 联合结果

  • 任务协调:通过广泛的消融实验(ablations),验证了系统中各个任务模块的协调对最终规划性能的重要性。
  • 预测与规划:展示了运动预测和占用预测任务对于安全规划的必要性,以及它们如何共同提升规划性能。

4.3 模块化结果

  • 感知模块:评估了UniAD在3D目标检测和多目标跟踪任务上的性能,并与现有技术进行了比较。
  • 预测模块:分析了运动预测和占用预测模块的性能,展示了UniAD在这些任务上相较于其他方法的优势。
  • 规划模块:评估了UniAD在规划任务上的性能,特别是在复杂交通场景中的安全性和准确性。

4.4 定性结果

  • 场景可视化:通过可视化方法展示了UniAD在不同交通场景中的表现,包括城市道路巡航、复杂交叉口导航和障碍物避让等。
  • 注意力掩码:展示了规划模块中注意力掩码的可视化结果,说明了模型如何关注关键区域和代理。

4.5 消融研究

  • 设计影响:通过逐步移除或修改UniAD中的某些设计元素(如非线性优化、注意力机制等),研究了这些设计对最终性能的具体影响。
  • 任务贡献:评估了系统中每个任务模块对整体性能的贡献,以及它们如何共同作用以提升规划的安全性和准确性。

4.6 计算效率

  • 模型复杂度:分析了UniAD模型的参数量、计算复杂度(FLOPs)和运行速度(FPS),以评估其在实际车辆硬件上的可行性。

4.7 限制与未来工作

  • 系统限制:讨论了UniAD系统在某些长尾场景下可能遇到的挑战,如大型车辆、复杂光照条件等。
  • 未来方向:提出了未来研究的方向,包括如何进一步优化系统以适应更广泛的驾驶场景,以及如何提高系统的泛化能力和鲁棒性。

http://www.ppmy.cn/devtools/116449.html

相关文章

OpenCV特征检测(12)检测图像中的潜在角点函数preCornerDetect()的使用

操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 计算用于角点检测的特征图。 该函数计算源图像的基于复杂空间导数的函数 dst ( D x src ) 2 ⋅ D y y src ( D y src ) 2 ⋅ D x x src − 2 …

cisco网络安全技术第2章测试及考试

测试 1、通过思科 IOS CLI 提供哪些工具来启动安全审计并在有或没有管理员输入的情况下进行推荐的配置更改? 思科 AutoSecure 2、可以配置 SNMP 实施的哪个元素来响应请求以及转发通知? SNMP 代理 3、哪两项任务与路由器加固相关联?&…

面经3——中和农信

今天参加了中和农信的面试,先进行60分钟的笔试,笔试完参加面试,面试官有两个人,面试了大概四十多分钟,因为没有亮点的项目,简历看起来十分单薄。现在来复盘一下。 笔试 事务ACID、事务隔离级别、乐观锁的…

Ansible部署openstack案例

案例为使用Ansible工具部署一个单控制单计算的OpenStack平台。 macbook双网卡,配置路由: sudo route -n add -net 192.168.100.0 -netmask 255.255.255.0 172.16.16.1 sudo route -n add -net 192.168.200.0 -netmask 255.255.255.0 172.16.16.1一、环境准备 使用OpenStack…

剑侠情缘c++源码全套(增加缺失的头文件和相关的库,其它网上流传的都是不全的)剑网三源码

剑侠情缘c源码全套(增加缺失的头文件和相关的库,其它网上流传的都是不全的) 下载地址: 通过网盘分享的文件:剑侠情缘c源码全套(增加缺失的头文件和相关的库,其它网上流传的都是不全的&#xff0…

[深度学习]Pytorch框架

1 深度学习简介 应用领域:语音交互、文本处理、计算机视觉、深度学习、人机交互、知识图谱、分析处理、问题求解2 发展历史 1956年人工智能元年2016年国内开始关注深度学习2017年出现Transformer框架2018年Bert和GPT出现2022年,chatGPT出现,进入AIGC发展阶段3 PyTorch框架简…

实验十七:串口通信实验

串口通信实验硬件接口图 具体原理可以查看相应的资料和视频 现就代码分享如下; main.c #include<reg52.h>typedef unsigned int u16; typedef unsigned char u8;sbit LED1=P2^0;void delay_10us(u16 n) {while(n--); }int n=0;void delay_ms(u16 ms) {u16 i,j;for(i=…

Hadoop 性能优化高频面试题及答案

目录 高频面试题及答案1. 如何通过调整 MapReduce 任务的并行度优化性能&#xff1f;2. 如何通过数据压缩优化 MapReduce 性能&#xff1f;3. 如何通过调整 IO 相关参数提升 Hadoop 性能&#xff1f;4. 如何优化 NameNode 和 DataNode 的性能&#xff1f;5. 如何通过优化 Shuff…