当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > OccFusion：一种简单有效的Occ多传感器融合框架（性能SOTA）

OccFusion：一种简单有效的Occ多传感器融合框架（性能SOTA）

来源：51CTO.COM 2024-04-25 17:21:15 0浏览收藏

偷偷努力，悄无声息地变强，然后惊艳所有人！哈哈，小伙伴们又来学习啦~今天我将给大家介绍《OccFusion：一种简单有效的Occ多传感器融合框架（性能SOTA）》，这篇文章主要会讲到等等知识点，不知道大家对其都有多少了解，下面我们就一起来看一吧！当然，非常希望大家能多多评论，给出合理的建议，我们一起学习，一起进步！

对3D场景的全面理解在自动驾驶中至关重要，最近的3D语义占用预测模型已经成功地解决了描述具有不同形状和类别的真实世界物体的挑战。然而，现有的3D占用预测方法在很大程度上依赖于全景相机图像，这使得它们容易受到照明和天气条件变化的影响。通过集成激光雷达和环视雷达等附加传感器的功能，本文的框架提高了占用预测的准确性和稳健性，从而在nuScenes基准上获得了顶级性能。此外，在nuScene数据集上进行的广泛实验，包括具有挑战性的夜间和雨天场景，证实了我们的传感器融合策略在各种感知范围内的卓越性能。

论文链接：https://arxiv.org/pdf/2403.01644.pdf

论文名称：OccFusion: A Straightforward and Effective Multi-Sensor Fusion Framework for 3D Occupancy Prediction

本文的主要贡献概述如下：

提出了一种多传感器融合框架，用于集成相机、激光雷达和雷达信息，以执行3D语义占用预测任务。
在3D语义占用预测任务中，将本文的方法与其他最先进的（SOTA）算法进行了比较，以证明多传感器融合的优势。
进行了彻底的消融研究，以评估不同传感器组合在具有挑战性的照明和天气条件下（如夜间和雨天）所实现的性能增益。
考虑到各种传感器组合和具有挑战性的场景，进行了一项全面的研究，以分析感知范围因素对我们的框架在3D语义占用预测任务中的性能的影响！

网络结构一览

OccFusion的总体架构如下所示。首先，将环绕视图图像输入到2D主干中以提取多尺度特征。随后，在每个尺度上进行视图变换，以获得每个级别的全局BEV特征和局部3D特征volume 。激光雷达和环视雷达生成的3D点云也被输入到3D主干中，以生成多尺度局部3D特征量和全局BEV特征。每个级别的动态融合3D/2D模块融合了相机和激光雷达/雷达的功能。在此之后，将每个级别的合并的全局BEV特征和局部3D特征volume 馈送到全局-局部注意力融合中，以生成每个尺度的最终3D volume 。最后，对每个级别的3D volume 进行上采样，并在采用多尺度监督机制的情况下进行skip连接。

OccFusion：一种简单有效的Occ多传感器融合框架（性能SOTA）