当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > 合成非模态感知数据集AmodalSynthDrive：用于自动驾驶的创新解决方案

合成非模态感知数据集AmodalSynthDrive：用于自动驾驶的创新解决方案

来源：51CTO.COM 2023-10-11 12:56:18 0浏览收藏

今天golang学习网给大家带来了《合成非模态感知数据集AmodalSynthDrive：用于自动驾驶的创新解决方案》，其中涉及到的知识点包括等等，无论你是小白还是老手，都适合看一看哦~有好的建议也欢迎大家在评论留言，若是看完有所收获，也希望大家能多多点赞支持呀！一起加油学习~

论文链接：https://arxiv.org/pdf/2309.06547.pdf
数据集链接：http://amodalsynthdrive.cs.uni-freiburg.de

摘要

本文介绍了AmodalSynthDrive：一个用于自动驾驶的合成非模态感知数据集。与人类不同，即使在部分遮挡的情况下，人类也可以毫不费力地估计物体的整体，而现代计算机视觉算法仍然发现这一方面极具挑战性。由于缺乏合适的数据集，利用这种非模态感知进行自动驾驶在很大程度上仍未得到开发。这些数据集的生成主要受到昂贵标注成本的影响，以及需要减轻标注者在准确标注遮挡区域的主观性带来的干扰。为了解决这些限制，本文引入了AmodalSynthDrive，这是一种合成的多任务非模态感知数据集。该数据集提供了150个驾驶序列的多视图相机图像、3D边界框、激光雷达数据和里程计，其包括了在各种交通、天气和光照条件下超过1M的目标标注。AmodalSynthDrive支持多种非模态场景理解任务，包括引入的非模态深度估计用于增强空间理解。本文为每项任务评估若干基线，以说明挑战并且设置公开基准服务器。

主要贡献

本文的贡献总结如下：

1）本文提出了AmodalSynthDrive数据集，这是一种针对城市驾驶场景的全面合成非模态感知数据集，具有多种数据来源；

本文提出了针对非模态感知任务的基准，包括非模态语义分割、非模态实例分割和非模态全景分割

3）新型的非模态深度估计任务旨在促进增强空间理解。本文通过若干基线证明了这项新任务的可行性。

论文图片和表格

合成非模态感知数据集AmodalSynthDrive：用于自动驾驶的创新解决方案

总结

感知是自动驾驶汽车的一项关键任务，但目前的方法仍然缺乏对复杂交通场景解释所需的非模态理解。因此，本文提出了AmodalSynthDrive，这是一个用于自动驾驶的多模态合成感知数据集。通过合成的图像和激光雷达点云，我们提供了一个全面的数据集，其中包括用于基本非模态感知任务的真值标注数据，并引入了一种新的任务来增强空间理解，称为非模态深度估计。本文提供了超过60000个单独的图像集，每个图像集都包含非模态实例分割、非模态语义分割、非模态全景分割、光流、2D和3D边界框、非模态深度以及鸟瞰图相关的数据。通过AmodalSynthDrive，本文提供了各种基线，并相信这项工作将为对动态城市环境中的非模态场景理解的新型研究铺平道路

合成非模态感知数据集AmodalSynthDrive：用于自动驾驶的创新解决方案