行业报告|3D感知技术快速发展,打造“机器之眼”,助推各行业加速升级!

news/2024/12/5 5:52:16/

原创 | 文 BFT机器人 

图片

01

3D视觉感知全栈式平台,硬核实力蓄势待发

1.1 3D视觉感知为“机器之眼”,未来市场空间广阔

3D视觉感知技术充分弥补了2D成像技术的以上不足,可获取空间几何尺寸信息。

过去数十年2D成像技术蓬勃发展,分辨率从几十万像素发展到现在的上亿像素,色彩还原更真实,逆光环境下也能通过HDR技术提升图像质量。

然而,2D图像仅能够提供纹理无法提供实现更精准识别、追踪等功能所需的空间形貌、几何尺寸、位姿等信息。

3D视觉的本质是将光源发射到物体再反射回来,根据图像传感器拍摄的画面计算每个图像的变形量或者根据反射回来的时间计算出距离,形成深度图和点云图,再经算法重现1:1还原的3D模型。有了这些信息作为基础,应用场景会大大增多,性能也会大幅提升。

图片

3D视觉感知技术逐步在消费级、工业级等领域应用,经历了以下几个阶段:

(1)技术启蒙期:3D视觉感知技术最早应用于工业领域,主要用于工业设备与零部件的高精度三维测量以及物体、材料的微小形变测量等,代表产品如德国高慕公司(GOM)的ATOS系列三维扫描仪等,用于工业级的设备通常成本高、体积大、功耗高,该阶段应用普及缓慢。

(2)技术起步期:随着底层元器件、核心算法等的快速发展,3D视觉感知技术不再拘泥于工业领域,逐步向消费领域推广,如微软2010年发布的Kincect、英特尔2013年发布的RealSense、奥比2015年发布的Astra,该阶段国内外共振助力3D视觉感知发展。

(3)技术发展期:前两个阶段发布的产品大多聚焦在三维建模、人机交互等领域,随着3D视觉感知技术的进一步迭代与优化,也逐渐向对成本、功耗、体积等要求更加严格的应用领域拓展,比如智能手机、移动支付、AIoT等。

(4)技术爆发期:随着底层元器件和核心算法的不断更迭,3D视觉感知技术逐步人工智能化,消费级应用产品也不断向高端化发展,如2020年苹果在iphone 12pro上搭建了基于dToF技术的Lidar扫描仪,谷歌于2020年在凤凰城推出无人驾驶租车服务等,3D视觉感知进入快速增长时期。

图片

2025年全球3D成像和传感市场规模达150亿美元,市场空间广阔。随着2D成像逐步向3D视觉感知升级,3D视觉感知市场处于规模快速增长的爆发前期,3D成像和传感市场受到传感器、发射器、光学元件、模块技术发展和研发工作推动,目前3D成像和感知朝着多样化、智能化方向发展,未来将各领域共同放量。

根据法国市场研究与战略咨询公司Yole发布的全球3D成像和传感市场研究报告,2019年全球3D视觉感知市场规模为50亿美元,且市场规模将快速发展,预计在2025年达到150亿美元,2019-2025年CAGR约为20%。

3D视觉赛道千亿市场多领域开花,消费电子和汽车领域增速领衔。根据法国市场研究与战略咨询公司Yole发布的全球3D成像和传感市场研究报告显示,3D视觉感知市场主要由消费电子、工业、医疗、汽车及消费电子领域组成,到2025年其细分板块占3D感知市场的比分别为54%、11%、2%、8%和25%,消费电子和汽车的增速较高。

未来随着像素内混合堆叠(in-pixel hybrid stacking)、激光雷达光源由近红外光(NIR)慢慢移动到短波红外线(SWIR)等技术的发展与渗透,将会有越来越多新兴产业进入3D视觉感知市场,比如3D打印设备、人形机器人、虚拟现实混合等,值得期待。

图片

1.2 深耕3D视觉感知,以技术为核心打造全栈式平台

3D视觉感知经过近十年的不断探索、研发及应用,已形成完善的产业化链条。其中,上游主要是3D传感器硬件供应商,主要由深度引擎芯片、光学成像模组、激光投影模组以及其他电子器件、结构件等构成,公司自主研发生产专用感光芯片和传感器模组。

中游是3D视觉感知方案供应商,主要是基于深度引擎算法结合应用进行各类3D视觉传感器的方案设计,其中部分3D视觉感知方案商已具备完整的3D视觉感知方案的能力,如苹果、微软、英特尔、华为、奥比中光等。

下游主要是应用算法供应商,如图像分割/增强优化算法、和VSLAM算法等;应用终端则有消费电子、生物识别等领域。

图片

(1)双目:类似于人眼,通过两个摄像头同时拍摄一个物体,然后利用计算机算法计算两个摄像头之间的视差(两个摄像头同时拍摄同一个物体时,物体在两个图像上的位置是有差异的),从而获取物体的深度信息。双目比较依赖于自然光,且无法处理无纹理的物体。

(2)结构光:通过投射仪主动发射一束光源(通常是红外光束),通过光学元件形成一束带有条纹编码的光,打到物体上反射回来的光由于物体的形状不同导致带编码光束产生不同的变形,通过分析这种畸变的大小和形状可以获取物体的深度信息。结构光适用于近距离,随着距离变远精度和分辨率都会变差,且容易收到环境光的干扰。

(3)ToF:相机通过打出一束光(通常是红外线光束)到目标物体上,这束光经物体反射回来,相机的光电二极管阵列接收反射光,并测量光的时间飞行(ToF)从而获取物体的距离信息。测量时间飞行的方式有两种,一种是dToF即直接计算光束飞行的时间(发射与接收到的时间),一种是iToF即间接测量光束飞行的时间,iToF是通过计算前后发出的两束光的相位差来得到光飞行的时间。ToF的分辨率不高,但是对光有抗干扰能力。

(4)Lidar:目前激光雷达的测距方法ToF、相干法和三角法等,其中三角法较为常用,是指一束光发射至物体表面,激光在物体表面发生反射和折射,在另一角度利用透镜对反射激光汇聚成像,光斑成像在CCD位置传感器上。当被测物体沿激光方向发生移动时,位置传感器上的光斑将产生移动,其位移大小对应被测物体的移动距离,以此来计算物体距离。

(5)工业三维测量:通过特定光源将有光学编码的图案投射到被测物体上,通过分析物体表面变形的光学图案,利用相机标定等方法获得特定光源和相机的位姿关系,采用三角测量法获得物体表面的空间三维信息,最终获得待测物体表面的点云数据。

图片

不同应用领域或场景对3D视觉的测量范围、测量精度、尺寸和功耗等性能要求均不同。其中结构光、iToF、双目、dToF、Lidar主要是运用于消费级应用场景的技术,其中结构光和双目的分辨率较高,更多适用于手机前置和机器人等领域。

ToF技术的抗干扰性和视角较宽,但分辨率较低,更多用于手机后置、扫地机器人等对分辨率要求没有那么高的领域。


工业三维测量则是专用于工业领域,适用于高精度工业测量、材料和结构的测量,其分辨率和测量精度都极高。

图片

1.3 芯片到算法全线技术打造消费级应用设备,产品性能一流

3D视觉传感器的深度引擎芯片具备更快更精确的计算能力,公司具备定制化生产能力。3D视觉传感器主要由结构件外壳、激光投影/RGB成像/感光芯片的IR成像等模组、衍射光学元件、感光芯片、深度引擎芯片等组成,深度引擎芯片具备更快的计算效率以及更精确的计算能力,是实现3D视觉传感器由实验室走向量产、产品化的核心。

图片

在消费级具备全线系统设计、芯片设计、光学设计、软件开发和量产的能力。消费级3D视觉感知技术先进性体现在以下几个方面:

(1)系统设计能力:公司依托从底层到上层技术的全栈式布局,在系统设计时可以更好地进行深入优化与融合,使得系统设计更加合理。


(2)芯片设计能力:公司的芯片团队具备数字及模拟芯片的研发实力,目前已成功完成四代深度引擎芯片、两款iToF感光芯片、两款dToF感光芯片的开发。

(3)算法研发上布局了深度引擎和消费场景多种算法。

(4)公司可以依据客户要求提供定制化光学产品。

(5)二次软件开发包SDK使得客户二次开发更为便利。

(6)量产组装能力。

图片

1.4 工业级3D视觉感知技术先进,国产替代进行时

3D视觉感知在工业领域主要应用于三维扫描、微小形变测量、弯管角度测量分析、工业机器人的定位与导航等方面。

三维测量一直是工业领域不可或缺的技术环节,通过使用高精度相机、光纤光栅等设备,可以实现对物体在力学载荷下的形变、应变、三维形态、曲率等参数的测量,细致、精确、快速获取,结合全局自动拼接技术,可以实现几十米超大工件的快速高精度测量。

02

原有下游稳固,新兴科技应用场景助推发展

2.1 引领服务机器人3D视觉感知市场,人形机器人再续航

机器人视觉相比工业视觉对深度引擎芯片、3D建模算法、分辨率和集成度的要求更高。

机器人视觉和机器视觉都属于计算机视觉,机器视觉通常用于工业,工业视觉的核心是以光学设备+控制系统+执行机构,代替人眼来完成生产制造中的识别、测量、定位、检测等工作,场景单一,对集成度、算力要求较低。

而机器人视觉则需要将机器人对运动场景、物体位置、物体形状实时计算,场景非常复杂,因此对于应用算法、分辨率和物体建模的要求较高,且机器人的体积较小,视觉传感器需要高度集。

图片

预计2027年我国机器视觉市场(包含2D平面图像和3D视觉)预计达560亿,其中3D视觉市场规模接近160亿元。

依据《2023机器视觉产业发展蓝皮书》显示,预计到2026年服务机器人产量有望达27万台,CGAR超27%。

目前来看,更多服务机器人配备2-4台传感器,其中以3D视觉传感器为主。预计未来几年,单台服务机器人搭载的传感器数量有望提升,传感器需求的复合增速超30%。

到2026年传感器需求量有望接近80万台,其中3D视觉传感器占比接近80%,未来市场空间广阔。

图片

多家厂商推出的人形机器人采用了3D视觉感知方案,人形机器人市场空间巨大。

今年以来,以GPT为代表的大模型快速发展,催生了人工智能产业新浪潮,具身智能机器人将成为人工智能终极形态。视觉能力各类智能终端的“眼睛”,是智能终端人机交互中不可或缺的关键一环,尤其是人形机器人,要更加“像人”和“仿生”,视觉感知不可或缺。

目前已有多家厂商在人形机器人上采用了3D视觉感知方案,如小米的CyberOne全尺寸人形机器人和CyberDog2、宇树科技的H1等。公司3D视觉感知技术是为人工智能提供三维视觉能力的关键共性技术,也是科技创新领域的前沿技术之一。

图片

图片

2.2 3D打印应用场景加速推广,千亿赛道蓄势待发

我国3D打印行业整体处于成长期,与国外仍有一定的差距。

我国3D打印行业整体起步较晚,起源于20世纪90年代,以清华大学等高校的研究力量为主。

1994年国内首台自主知识产权的工业级3D打印设备研制成功,1998年卢秉恒团队研制出国内首台光固化快速成型机,3D打印行业持续产生新的突破。

随后2012年中国工程院开始对3D打印行业进行市场调研,2013年中国3D打印技术产业联盟成立,标志着国家层面开始重视。

2017年至今,国家出台多项政策,支持国内3D产业发展,新企业不断进入,行业发展进入增速较快的阶段。

图片

据预测,2026年我国3D打印行业规模可达1101.9亿元,行业进入高增速时期。

3D打印是实施制造强国战略的主攻方向之一,被视为引领新一轮科技革命和产业变革的核心技术之一,3D打印具有零技能制造、设计空间无限、减少废弃副产品等优点,目前已经在军工、医疗、教育、服饰、模具等领域尝试应用。

据预测,2021年3D打印的市场规模为265亿,预计2026年行业规模可达千亿,复合增长率接近26.79%,当前行业已经进入高速发展期。

图片

2.3 智能座舱渗透率提升,千亿市场前景广阔

汽车从被动驾驶转向主动交互,智能座舱是必经之路。据IDC统计,2023年1季度渗透率已达88.8%。

近年来,汽车已经从简单的交通工具逐渐向智能终端转变,汽车的座舱涉及理解和塑造人与车辆之间的交互,尤其是交互领域中的感觉、感知、信息交换和决策等内容,传统的行车更多的是被动过程,未来随着驾驶技术更加先进,驾驶人员将有更多的时间选择来做驾驶之外的任务,智能座舱则相当于主动式的驾驶过程。智能座舱通常包括操控系统、娱乐系统、通信系统、交互系统和智能感知系统。

图片

中国智能座舱为千亿赛道,硬件端对深度摄像头等3D视觉传感器需求高。

据ICVTank统计,2022年中国智能座舱市场规模739亿元,预计2025年可达1030亿元,多家企业纷纷入场,行业进入高速发展阶段。

智能座舱为交互开辟了新的途径,主动式的引入了智能座舱概念,因此,越来越多的传感器被整合到车辆中,参考理想的L9,智能座舱中包含1个激光雷达、1个高精度毫米波雷达、4个环视摄像头、7个外部感知摄像头、1个内部驾驶员监控摄像头等传感器,其中智能座舱的视觉上采用3D视觉传感将会把人机交互体验推向更完美的状态。

图片

2.4 工业测量领域技术持续完善,下游覆盖行业丰富

预计2026年我国工业视觉市场规模可达543亿元,应用领域广阔。

3D视觉感知在工业领域主要应用于三维扫描、微小形变测量、弯管角度测量分析、工业机器人的定位与导航等方面。

通过使用高精度相机、光纤光栅等设备,可以实现对物体在力学载荷下的形变、应变、三维形态、曲率等参数的测量。

可应用于多种行业:汽车工业、航空航天工业、数码家电、文保文创及医学等。据甲子光年智库测算,2021年工业视觉市场规模为178亿,预计2026年可达543亿,市场规模持续放量。

图片

2.5 3D视觉感知助力AIOT和生物识别

(1)智慧生活系列:公司针对智慧零售、智慧农牧、智慧交通提出了3D视觉感知方案。

针对智慧零售,公司3D感知技术助力零售行业打造线上线下一体化的商业模式,实现消费市场提速升级,为传统零售店提供人体3D扫描、商品扫描识别等功能。

针对智慧农牧,公司提出了基于图像视频技术的猪只盘点、背膘测量等产品,解决猪场科学管理难题、提升管理效率、提高经济效益。


针对智慧交通,公司自研3D视觉感知技术赋能交通行业,实现交通客流统计分析智能化处理,形成高效、全面及3D数据为中心的智能交通决策系统,以推动智慧交通发展。

图片

(2)消费电子系列:针对家庭娱乐,公司结合人体骨架识别、AR抠图、人脸识别、物体识别等核心算法,打造“3D+AR”平台,覆盖亲子教育、家庭健身、互动娱乐、家庭看护等应用场景,目前公司家庭娱乐业务已覆盖全国多个省市。

为手机前置提供3D结构光解决方案,已为OPPO旗舰手机FindX定制开发超百万台3D视觉传感器;为手机后置提供iToF解决方案为魅族旗舰手机17Pro、18Pro定制开发ToF解决方案。

(3)生物识别:主要是刷脸支付、3D刷脸门锁、身份核验等解决方案。3D刷脸支付解决方案已在全国数百座城市普及,覆盖超市、药店、便利店等线下场景。

3D刷脸门锁门禁助力实现真3D智能门锁规模化量产,并在办公楼、商场、医院等多个场景广泛使用门禁产品。

提供于人脸识别的金融级KYC验证服务,通过身份信息录入、人脸活体检测、等可快速核验人员信息、分配人员权限等,可广泛应用于政府、医院、人才公寓、校园、产业园区等重要场所。

来源 | 国盛证券

排版 | 居居手

审核 | 柒柒

版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。


http://www.ppmy.cn/news/1070614.html

相关文章

安全生产作业现场违规行为识别 opencv

安全生产作业现场违规行为识别算法通过pythonopencv网络模型算法框架设定了各种合规行为和违规行为的模型,安全生产作业现场违规行为识别算法检测到违规行为,将立即进行抓拍并发送告警信息给相关人员,以便及时采取相应的处置措施。OpenCV是一…

前端面试话术集锦第二篇

🚗前端面试集锦目录 💖前端面试话术集锦第一篇💖 💖前端面试话术集锦第二篇💖 本章目录 1. iframe有那些缺点2. WEB标准以及W3C标准是什么?3. xhtml和html有什么区别?4. Doctype作⽤? 严格模式与混杂模式如何区分?它们有何意义?5. ⾏内元素有哪些?块级元素有哪…

strtok, strtok_s(字符串分割符)和memset_s

strtok()函数的原型如下 char *__cdecl strtok(char *_String, const char *_Delimiter)strtok()函数接收两个传入参数,将_String中保存的字符串(待处理字符串),按照_Delimiter中的字符作为分隔符进行分割。如果_String为空&…

Multicast IP Interface

该模块通过多播IPv4和IPv6在UDP上实现CAN和CAN FD消息的传输。此虚拟接口允许在多个进程甚至主机之间进行通信。这与虚拟接口不同,虚拟接口只能在单个进程中传递消息,但不需要网络堆栈。 它在UDP上运行以具有尽可能低的延迟(与使用TCP相反),并且因为正常的IP多播本质上是…

【Golang】go条件编译

交叉编译只是为了能在一个平台上编译出其他平台可运行的程序,Go 作为一个跨平台的语言,它提供的类库势必也是跨平台的,比如说程序的系统调用相关的功能,能根据所处环境选择对应的源码进行编译。让编译器只对满足条件的代码进行编译…

C语言练习题解析:挑战与突破,开启编程新篇章!(1)

💓博客主页:江池俊的博客⏩收录专栏:C语言刷题专栏👉专栏推荐:✅C语言初阶之路 ✅C语言进阶之路💻代码仓库:江池俊的代码仓库🎉欢迎大家点赞👍评论📝收藏⭐&a…

idea查找maven所有依赖

文章目录 idea自带的依赖结构图idea安装maven helper插件 idea自带的依赖结构图 缺点是只有依赖,没有版本 idea安装maven helper插件 settings–>plugins–>搜索maven helper并安装 安装后打开pom.xml文件会有依赖解析 勾选conflict就是有冲突的依赖选中…

linux系统(centos、ubuntu、银河麒麟服务、uos、deepin)判断程序是否已安装,通用判断方法:适用所有应用和命令的判断

前言 项目中需要判断linux服务器中是否已经安装了某个服务 方法有很多种,但是很多都不通用, 脚本代码就不容易做成统一的 解决方案 用下面的脚本代码去进行判断 用jdk测试 脚本意思如下: 输入java -version命令,将返回的字…