地平线SuperDrive首秀:千人研发投入,出场即「比肩第一梯队」

news/2024/9/17 7:52:47/ 标签: 自动驾驶, 汽车

作者 |德新

编辑 |王博

0889b063e20045a53f268e446d076fcf.jpeg

8月底,地平线在北京开放了第一批面向媒体的高阶智驾方案SuperDrive体验。

预计到明年第三季度,SuperDrive将伴随主机厂客户的第一款量产车交付。

目前在国内,仅有英伟达和华为两家的平台基础上,有车企向用户成功交付了带有城区功能的高阶智驾方案。地平线「J6P + SuperDrive」的组合,希望成为日益火热的高阶市场中有力的竞争者。

这次SuperDrive开放体验有两个背景:

  • 第一是今年4月在北京车展前夕,地平线发布了征程6系列产品,J6P是征程6系列最高阶的计算平台;
  • 第二是据媒体报道,去年10月地平线内部针对智驾软件的研发做了战略调整。其将中阶的方案全部交由Tier 1合作伙伴来做,内部聚焦高阶,并且整合了原有内部中阶的团队。

从去年10月开始,地平线投入了超过1000人的团队,专门开发基于J6P软硬结合的高阶方案——SuperDrive

招股书显示,截止2023年底,地平线约有雇员2066人,这意味着地平线将近一半的精锐部队都投到了SuperDrive的开发上。

招股书同时也披露,2023年地平线的研发投入是23.66亿元。

地平线希望通过「饱和式」的投入,打造出一套高度产品化的智驾方案SuperDrive,来拔高地平线整个商业生态的天花板。

如果SuperDrive大获成功,这也将大幅拔高国内智驾系统产品力的天花板。毕竟当前虽然中低阶的市场杀成红海,但真正能做高阶方案、开放的供应商仍然寥寥。

作为一套「初出茅庐」的高阶智驾系统,SuperDrive在地平线的积累和投入之上,以及车辆目前在北京、上海闹市区所展示出的能力,可以说一出场就有「比肩第一梯队」的实力。

对于SuperDrive当前的进展,余凯在沟通会上评价:超过预期。

不少国内和国际车企客户,也在体验SuperDrive之后给出了颇高的评价。

一、按照3A游戏标准打造的智驾HMI

过去很长一段时间,行业内都是将智能驾驶作为技术来开发,而SuperDrive立项的出发点就是「用产品思维做高阶智驾」,向车企和用户交付完整的高阶智驾产品体验。

我们可以先从智驾的HMI,来管窥一下地平线在SuperDrive上的产品探索。

SuperDrive的SR,对物理世界进行了高度还原。

从界面上可以看到丰富的细节:

f3d253d691687a36a8bbe8a57bd3b15c.jpeg

SR界面与导航地图做了深度融合,它的底色是一层类似战争迷雾的效果,随着本车的行驶,呈现模拟探索认知的视角。

除了常见的车道、车辆目标之外,这套SR还会渲染道路两旁的树木以及天桥这样的建筑物。

由于采用的是无高精地图的方案,SuperDrive使用了世界模型来做实时的感知识别,再叠加激光雷达点云,来还原树木以及一些大的建筑。这样做可以让用户更容易对齐真实世界和虚拟世界的坐标,增加安全感。

由于在测试中经常会遇到遛狗的行人,地平线把包括小猫、小狗在内的小目标,也做到了SR上。

针对常见重叠的目标,比如等待过路口的行人、路边停放的车辆也专门做了感知优化,SR上被遮挡的目标仍能稳定追踪,物体结构清晰完整。

整个SR,无论动静态的目标,尤其路边的行人、两轮车,包括朝向、姿态在内都非常稳定,很少有「跳变」。

这些都展示了扎实的算法和工程功底。

e7160bc113595dbb4caf9f8704ca7d30.jpeg

一位地平线工程师告诉我们:这套SR,内部对于审美和产品细节有很高的标准。

首先,从元素展示上,作为深度研发智驾系统的供应商,他们最了解哪些信息对于用户理解智驾系统的行为、建立安全感是必要的。

过去,一些智驾系统的HMI开发由车企与供应商分开主导,智驾供应商缺乏对用户交互的理解,而车企则缺少智驾系统开发的经验,因此有时整个交互体验的一致性不够好,信息也不够完整。

地平线的这套SR希望帮助车企树立起一套高阶智驾交互的「标杆」。

实际上,内部还有一项目标是将这套SR,做到3A级游戏的标准

二、世界模型 + 数据驱动的交互博弈

作为地平线最新一代的智驾方案,SuperDrive用上了时下最流行的大模型驱动的技术栈,也就是炙手可热的「端到端」技术。

并且,J6这代的BPU也对运行大参数模型做了底层优化。

d80194fa417a53a04492566160325fdb.jpege07964f6a9ac425303ec489cd192c51c.jpeg

它的前端以异构传感器与导航地图的信息作为输入,进入到一个「静态环境 + 动态目标 + 占用格栅」三网合一的感知世界模型。

世界模型向下游同时输出动静态的目标信息,这些目标信息同时用于SR的显示,并且世界模型同步向下游传输更丰富的无损高纬度特征信息。

而下游的决策规划,则包含了模型驱动和规则兜底的两套系统。

整套系统追求拟人化的驾驶体验,希望做到「优雅不怂」。

模型驱动的决策规划,是系统能做到「优雅不怂」的其中一个原因。

55ad37a2040e970de2922aebdd6c3cbe.jpeg

在开发的初期,地平线采集了一些国宾司机标准的驾驶数据来启动模型的训练;目前这套系统,已经学习了超过1万小时的高质量驾驶数据。

不过,余凯认为,端到端并不是智驾系统的终局解决方案,智驾产品也不存在一招鲜。

「真正的门槛来自千锤百炼的工程能力,在干脏活累活攒下的积累。」

比如地平线600万套征程家族的出货积累下的车辆纵向控制算法,「地平线拥有业界最丰富的纵向控制的数据库」。

在这批SuperDrive的试验车上,由于没有原厂开放的底盘控制信号,地平线是通过工程方法独立做的底盘控制。

在体验完SuperDrive后,这套系统在控制上的细腻程度让不少主机厂客户折服,评价地平线的团队是「懂车、懂底盘的」。

三、产品、技术、工程化,高阶智驾的铁人三项赛

在相当长一段时间内,智能驾驶都是作为先进技术被行业所研发推进。

而智驾的关键构成,比如计算机视觉、深度学习,都来自于学界的前沿研究。大家长期视最新的算法突破为瑰宝,而忽略了工程化的重要性。

工程化短板是后来很多年智驾科技公司在尝试商业落地时遇到的挑战,至今仍然如此。

至于产品化,则是非常稀缺的经验。

如果从高速NOA量产开始计算,智能驾驶真正开始被产品化并开始被用户大量使用,只有四五年时间。

而到了2024年,当智能驾驶的装配率开始快速上升,而智驾供应的格局开始急剧收敛时,高阶智驾的已经是「技术 + 工程 + 产品」全面的铁人三项赛事。

这也是余凯所说的,智能驾驶不可能做到一招鲜。

SuperDrive是以深度定制优化的硬件为基础,高度软硬协同的方案。

征程6系列最高阶的计算平台J6P,单片算力达到560 Tops;在地平线前3代计算平台的设计经验基础上,J6P集成了BPU、CPU、GPU、MCU、ISP和Codec等丰富的异构计算资源。

并且第三代BPU架构Nash,专门针对大参数模型进行优化,运行Transformer类算法相比于主流的竞品平台有9 - 11倍的FPS性能(每秒处理的图片帧数)提升。

在城区NOA加速普及的阶段,头部厂商都已经深刻意识到深度软硬结合的必要性。

比如英伟达在DRIVE计算平台的基础上,由吴新宙带领正在开发全栈的高阶智驾软件;而Momenta则是从软件算法的背景出发,正在快速推进自研芯片,核心目标也是针对大模型的底层硬件优化。

深度优化的计算硬件,600万套出货的工程积累和产品化思考,使SuperDrive一出场就站在了一个高起点上。

这一批的SuperDrive体验,地平线专门选择了在北京、上海闹市区,在高峰时段甚至夹杂着恶劣天气下,系统依然可以顺滑地完成路线的体验。

地平线希望这样的场景设置,能够尽可能地打磨出系统的上限,同时也在开展大规模的泛化测试。

预计最快到明年第三季度,我们将看到搭载SuperDrive的量产车上市

2024年,中国市场L2辅助驾驶的新车装配率已经超过了50%,但大部分仍以基础辅助驾驶为主。

根据灼识咨询的预测,到2030年,中国智能汽车的销量将增加到815万台,而高阶智驾将成为主流的前装解决方案,其渗透占比预计将超过60%。

而SuperDrive就是要加速这样的目标普及,余凯预计在3 - 5年内,十几万级的车型搭载SuperDrive这样的系统,完全是可以预期的。


http://www.ppmy.cn/news/1521707.html

相关文章

网络安全售前入门09安全服务——安全加固服务

目录 1.服务概述 2.流程及工具 2.1服务流程 2.2服务工具 3.服务内容 ​​​​​​​4.服务方式 ​​​​​​​5.风险规避措施 ​​​​​​​6.服务输出 1.服务概述 安全加固服务是参照风险评估、等保测评、安全检查等工作的结果,基于科学的安全思维方式、长期的安全…

红队攻防 | 利用GitLab nday实现帐户接管

在一次红队任务中,目标是一家提供VoIP服务的公司。该目标拥有一些重要的客户,如政府组织,银行和电信提供商。该公司要求外部参与,资产测试范围几乎是公司拥有的每一项互联网资产。 第一天是对目标进行信息收集。这一次&#xff0…

Python编码系列—Python项目架构的艺术:最佳实践与实战应用

🌟🌟 欢迎来到我的技术小筑,一个专为技术探索者打造的交流空间。在这里,我们不仅分享代码的智慧,还探讨技术的深度与广度。无论您是资深开发者还是技术新手,这里都有一片属于您的天空。让我们在知识的海洋中…

高级java每日一道面试题-2024年8月30日-基础篇-你对泛型了解多少?

如果有遗漏,评论区告诉我进行补充 面试官: 你对泛型了解多少? 我回答: 泛型的基本概念 泛型是一种编程语言特性,它允许在类、接口或方法定义时使用类型参数(Type Parameters)。类型参数允许在编译时指定具体的类型,从而避免了…

Ceph集群维护相关操作

1、通过套接字进行单机管理 node节点: [rootceph-node1 ~]# ll /var/run/ceph/ total 0 drwxrwx--- 2 ceph ceph 140 Aug 19 08:46 ./ drwxr-xr-x 25 root root 840 Aug 19 11:26 ../ srwxr-xr-x 1 ceph ceph 0 Aug 19 08:46 ceph-osd.0.asok srwxr-xr-x 1 ceph c…

计算机毕业设计推荐-基于Java的乡村农家乐管理系统

💖🔥作者主页:毕设木哥 精彩专栏推荐订阅:在 下方专栏👇🏻👇🏻👇🏻👇🏻 实战项目 文章目录 实战项目 一、基于Java的乡村农家乐管理系…

NGINX 中配置负载均衡器

Nginx 提供了多种负载均衡策略,如轮询(Round Robin)、最少连接数(Least Connections)、IP 哈希(IP Hash)等。这里以轮询策略为例进行配置。 1. 准备工作 假设你有以下几台 PHP 服务器&#xf…

Codeforces Round 969 (Div. 2 ABCDE题) 视频讲解

A. Dora’s Set Problem Statement Dora has a set s s s containing integers. In the beginning, she will put all integers in [ l , r ] [l, r] [l,r] into the set s s s. That is, an integer x x x is initially contained in the set if and only if l ≤ x ≤…

electron-vite打包出错

问题:1 electron-vite 安装, 打包下载资源失败,设置国内镜像 由于electron默认打包会从github上下载相关二进制包,众所周知,国内GitHub访问是相当慢的,所以经常会出现下载失败导致打包不成功,…

生信圆桌x生信宝库:生物信息学资源与工具的终极指南

介绍 生物信息学作为现代生物科学的重要分支,涉及到大量的数据处理、分析和存储工作。随着领域的不断发展,各类生物信息学资源与工具也如雨后春笋般涌现。这些资源涵盖了从基因组数据、蛋白质结构到代谢路径的方方面面,极大地丰富了科研人员的…

ElementUI 动态表格高度,使页面一屏显示

一、效果 二、代码 <script> export default {data () {return {maxHeight: 500}},methods: {handlePageReSize () {let card document.querySelector(.el-card);this.maxHeight card.clientHeight - 108;}},mounted () {let _this this;window.onresize () > {re…

pytorch view 函数介绍

view 是 PyTorch 中用于改变张量形状(tensor shape)的函数。与其他形状转换操作不同的是,view 并不改变张量的数据,而是返回一个新的张量,该张量与原始数据共享内存。 1. 基本用法 view 的作用是将一个张量重新排列成新的形状。它的基本语法是: tensor.view(shape)sha…

ES之三:springboot集成ES

一.选择版本很重要&#xff0c;不然会找不到好多方法 明明有Timeout方法&#xff0c;不报红&#xff0c;运行时&#xff0c;报错&#xff0c;找不到该类 ClassNotFoundException 为了避免使用的Elasticsearch版本和SpringBoot采用的版本不一致导致的问题&#xff0c;尽量使用…

高级算法设计与分析 学习笔记3 哈希表

首先我们要讨论一个把n个数据放到列表S里面的问题&#xff1a; 但很显然&#xff0c;这些数据的范围有多大这个T就得有多大&#xff0c;而实际上要放的数字可能就几个&#xff08;比如就放一个1和一个10000000&#xff0c;那我还是要准备一个巨大的T&#xff09;&#xff0c;不…

华为达芬奇人像引擎2.0,人像体验有哪些升级

对于年轻人而言&#xff0c;拍照已成为生活中不可或缺的一部分&#xff0c;不仅是为了记录世界、更重要的是成为生活的主角&#xff0c;大胆表达自己。然而很多喜欢使用手机记录生活的人&#xff0c;既希望能够实现媲美单反的影像实力&#xff0c;同时还想呈现出真实、更具自然…

利用机器人自动回复软件,显著提升客户体验

随着科技的飞速发展及互联网普及&#xff0c;机器人自动回复软件成为了现代企业的重要工具。无论是在客户服务领域&#xff0c;还是在营销、销售等方面&#xff0c;自动回复机器人都表现出了强大的功能和显著的效果。究竟什么是机器人自动回复技术?它是如何运行的?本文将为您…

懒加载<图片懒加载>

1、懒加载的概念 懒加载也叫做延迟加载、按需加载。指的是在长网页中延迟加载图片数据&#xff0c;是一种较好的网页性能优化的方式。 在比较长的网页或应用中&#xff0c;如果图片很多&#xff0c;所有的图片都被加载出来&#xff0c;而用户只能看到可视窗口的那一部分图片数…

基于Spring的Uniapp自动更新实现方法

Uniapp自动更新 本文介绍了基于rouyi-uniapp的更新包版本自动推送更新。结合minio和网址下载地址两种方式&#xff0c;计算版本号大小后&#xff0c;可选是否强制更新。 一、表结构和后端版本号检测设计 1、版本更新控制表结构 主要字段和设计思路&#xff1a; fileUrl&…

使用matplotlab绘制多条形图

##黑马程序学习 这种多个条形图放在一起的图形该怎么画呢&#xff1f; 请看以下代码 #横着的条形图 from matplotlib import pyplot as plt import matplotlib#设置显示中文 和 负号 matplotlib.rcParams[font.sans-serif][SimHei] matplotlib.rcParams[axes.unicode_minus]F…

学会这2招,让你轻松提取长视频中的文案!

在当今数字化时代&#xff0c;短视频已成为备受欢迎的内容形式&#xff0c;众多品牌和营销人员借助短视频推广宣传产品。 短视频文案作为短视频内容的关键部分&#xff0c;能够在极短时间内向受众传达品牌信息和产品特点。 不过&#xff0c;短视频文案的提取和创作确实极具挑…