自动驾驶之BEV概述

news/2025/2/22 15:58:30

1、为什么需要BEV

自动驾驶需要目标在3D空间的位置信息,传统检测为2D图像上检测目标然后IPM投影到3D。所以无论如何3D结果才是我们最终想要的。
对于单个传感器:通过单目3D、深度估计等手段好像能解决这个问题,但是往往精度不高。
对于自动驾驶,往往需要360度的多个摄像头协同工作。将多个摄像头的结果进行融合也是一大问题。所以把图象特征转到BEV空间下直接进行3D位置预测,一则可以解决2D到3D的投影问题,二则预测结果可以直接用于下游的决策,省去多个传感器的融合。

2、什么是BEV的核心?
我们知道3D空间投影2D图象是一对一的,而2D图象投影3D空间则是一对多的射线上。所以如何把多个图象的2D特征表达到对应3D的BEV空间特征,进行视图转换,则是BEV的核心工作。
当前主要有代表性的两种方法:
1、基于深度分布估计的:代表方法为BEVDet
2、基于交叉注意力的:代表方法为BEVFormer

BEV的基础上,往往加入时序融合多任务学习多模态监督等手段,由此发展出各种BEV的变形。

3、BEV特点
输入:来自不同角度相机的多张图像,覆盖360°视野范围。

输出:BEV视图下的各种感知结果,比如物体,道路,车道线,语义栅格等。

算法:图像到BEV视图转换,包括稠密和稀疏两种方式。
稠密有BEVDet和BEVFormer。有的方法则是针对具体的任务,比如3D物体检测,直接生成稀疏的BEV视图下的感知结果,比如DETR3D和PETR

4、测试数据集
对于BEV感知来说,目前比较常用的数据集是nuScenes。
nuScenes数据库发布了多个测试任务,包括物体检测跟踪,运动轨迹预测点云全景分割以及路径规划
3D目标检测任务的性能指标主要有两个:mAPNDS

mAP(mean Average Precision)是目标检测中常用的性能指标,它对Precision-Recall(P-R)曲线进行采样,计算每个类别出平均的Precision。在计算P-R曲线时,需要匹配算法预测的物体框和标注的真值物体框。nuScenes中采用BEV视图下物体框的2D中心点距离来进行匹配,而不是传统的Intersection-of-Union(IoU),这样可以提高小物体的匹配率。

NDS(nuScenes Detection Score)在mAP的基础上,增加了物体框预测质量的指标。这些指标包括物体框的位置,大小,朝向,速度以及其它属性。与mAP相比,NDS可以更全面的评价3D目标检测算法的优劣。

对于BEV的发展历程,以及各种BEV的方法介绍,参考以下综述:BEV感知综述


http://www.niftyadmin.cn/n/5862491.html

相关文章

Spring Boot(十六):使用 Jenkins 部署 Spring Boot

Jenkins 是 Devops 神器,本篇文章介绍如何安装和使用 Jenkins 部署 Spring Boot 项目 Jenkins 搭建、部署分为四个步骤; 第一步,Jenkins 安装 第二步,插件安装和配置 第三步,Push SSH 第四步,部署项目 第…

ubuntu部署小笔记-采坑

ubuntu部署小笔记 搭建前端控制端后端前端nginx反向代理使用ubuntu部署nextjs项目问题一 如何访问端口号配置后台运行该进程pm2 问题二 包体过大生产环境下所需文件 问题三 部署在vercel时出现的问题需要魔法访问后端api时,必须使用https协议电脑端访问正常&#xf…

DuodooBMS源码解读之 odoo_phoenix_alarm模块

Odoo18 扩展模块声光报警器用户使用手册 一、模块概述 本扩展模块是基于 Odoo18 原生系统进行开发的,主要用于实现与上位声光报警设备的通讯功能。通过该模块,用户可以方便地向设备发送指令,控制设备的声音、灯光等操作。本手册将详细介绍该…

DeepSeek接入Siri(已升级支持苹果手表)完整版硅基流动DeepSeek-R1部署

DeepSeek接入Siri(已升级支持苹果手表)完整版硅基流动DeepSeek-R1部署 **DeepSeek** 是一款专注于深度学习和人工智能的工具或平台,通常与人工智能、机器学习、自动化分析等领域有关。它的主要功能可能包括:深度学习模型搜索&…

Python爬虫实战:获取12306特定日期、城市车票信息,并做数据分析以供出行参考

注意:以下内容仅供技术研究,请遵守目标网站的robots.txt规定,控制请求频率避免对目标服务器造成过大压力! 1. 核心思路 需求:获取明天(2025 年 2 月 21 日)从北京到上海的车次、票价、出发时间、硬卧二等卧信息,并保存到 CSV 文件,然后分析出价格最低的 10 趟车次。目…

Java四大框架深度剖析:MyBatis、Spring、SpringMVC与SpringBoot

目录 前言: 一、MyBatis框架 1. 概述 2. 核心特性 3. 应用场景 4. 示例代码 二、Spring框架 1. 概述 2. 核心模块 3. 应用场景 4. 示例代码 三、SpringMVC框架 1. 概述 2. 核心特性 3. 应用场景 4. 示例代码 四、SpringBoot框架 1. 概述 2. 核心…

基于COSTAR模型的内容创作:如何用框架提升写作质量

目录 前言1. Context(上下文):理解背景,奠定写作基础1.1 何为上下文1.2 上下文的作用1.3 案例解析 2. Objective(目标):明确写作方向,避免跑题2.1 确立目标2.2 如何设定目标2.3 案例…

【电子通知】案例:26AWG*3C OD=3.8线缆的含义是什么?

在看线缆图纸时,有时候会发现标识:26AWG*3C OD3.8,那这个参数是什么意思呢? 首先我们要先知道线缆规格的表示方法,一般来说,线缆规格按以下方式标注: 线规:表示导线的直径或截面积&a…