当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > 高性能模拟：基于高斯过程的驾驶场景重建技术的最新进展

高性能模拟：基于高斯过程的驾驶场景重建技术的最新进展

来源：51CTO.COM 2023-12-26 19:35:53 0浏览收藏

对于一个科技周边开发者来说，牢固扎实的基础是十分重要的，golang学习网就来带大家一点点的掌握基础知识点。今天本篇文章带大家了解《高性能模拟：基于高斯过程的驾驶场景重建技术的最新进展》，主要介绍了，希望对大家的知识积累有所帮助，快点收藏起来吧，否则需要时就找不到了！

原标题：DrivingGaussian：用于周围动态自动驾驶场景的复合高斯点状绘制

请点击这里查看论文：https://arxiv.org/pdf/2312.07920.pdf

代码链接：https://pkuvdig.github.io/DrivingGaussian/

作者单位：北京大学谷歌研究加州大学默塞德分校

论文思路：

本文提出 DrivingGaussian，这是一个针对动态自动驾驶场景的高效率和高效益的框架。对于具有移动物体的复杂场景，本文首先使用增量静态3D高斯 (incremental static 3D Gaussians) 顺序渐进地对整个场景的静态背景进行建模。然后，本文利用复合动态高斯图(composite dynamic Gaussian graph) 来处理多个移动物体，单独重建每个物体并恢复它们在场景中的准确位置和遮挡关系。本文进一步使用 LiDAR 先验进行 Gaussian Splatting 来重建具有更多细节的场景并保持全景一致性。DrivingGaussian 在驾驶场景重建方面优于现有方法，并能够实现具有高保真度和多相机一致性的逼真环视合成。

主要贡献：

根据本文了解，DrivingGaussian是第一个使用复合高斯飞溅技术进行大规模动态驾驶场景表示和建模的框架

引入了两个新颖的模块，包括增量静态3D高斯和复合动态高斯图。前者增量地重建静态背景，而后者则使用高斯图对多个动态物体进行建模。在激光雷达先验的辅助下，该方法有助于在大规模驾驶场景中恢复完整的几何形状

综合实验证明，DrivingGaussian在具有挑战性的自动驾驶基准测试中优于先前的方法，并且能够模拟各种极端情况以进行下游任务

网络设计：

本文介绍了一种名为DrivingGaussian的新型框架，用于表示环视动态自动驾驶场景。该框架的关键思想是使用来自多个传感器的顺序数据对复杂的驾驶场景进行分层建模。通过采用Composite Gaussian Splatting技术，将整个场景分解为静态背景和动态物体，并分别对每个部分进行重建。具体而言，首先使用增量静态3D高斯方法从环视多相机视图顺序构建综合场景。然后，采用复合动态高斯图单独重建每个运动物体，并通过高斯图将它们动态地集成到静态背景中。在此基础上，通过Gaussian Splatting进行全局渲染，捕捉现实世界中的遮挡关系，包括静态背景和动态物体。此外，本文还在GS表示中引入了LiDAR先验，相比于使用随机初始化或SfM生成的点云，它能够恢复更精确的几何形状并保持更好的多视图一致性

大量的实验表明，本文的方法在公共自动驾驶数据集上实现了最先进的性能。即使事先没有激光雷达，本文的方法仍然表现出良好的性能，证明了其在重建大规模动态场景方面的多功能性。此外，本文的框架支持动态场景构建和极端情况(corner case)模拟，有助于验证自动驾驶系统的安全性和鲁棒性。

DrivingGaussian：逼真环视数据，驾驶场景重建SOTA

图 1. DrivingGaussian 实现了环视动态自动驾驶场景的逼真渲染性能。朴素的方法 [13, 49] 要么在大范围背景中产生 unpleasant 伪影和模糊，要么难以重建动态物体和详细的场景几何形状。DrivingGaussian 首先引入了 Composite Gaussian Splatting 来有效地表示复杂的环视驾驶场景中的静态背景和多个动态物体。DrivingGaussian 能够跨多相机高质量合成环视视图，并促进长期动态场景重建。

DrivingGaussian：逼真环视数据，驾驶场景重建SOTA

图 2.本文方法的总体流程。左：DrivingGaussian 从多传感器获取连续数据，包括多相机图像和 LiDAR。中：为了表示大规模动态驾驶场景，本文提出了 Composite Gaussian Splatting ，它由两个部分组成。第一部分增量地重建广泛的静态背景，而第二部分使用高斯图构造多个动态物体并将它们动态地集成到场景中。右图：DrivingGaussian 在多个任务和应用场景中展示了良好的性能。

DrivingGaussian：逼真环视数据，驾驶场景重建SOTA

图 3. 具有增量静态3D高斯和动态高斯图的 Composite Gaussian Splatting 。本文采用 Composite Gaussian Splatting 将整个场景分解为静态背景和动态物体，分别重建每个部分并整合它们进行全局渲染。

实验结果：

DrivingGaussian：逼真环视数据，驾驶场景重建SOTA

总结：

本文介绍了DrivingGaussian，一种基于所提出的Composite Gaussian Splatting来表示大规模动态自动驾驶场景的新颖框架。DrivingGaussian使用增量静态3D高斯逐步对静态背景进行建模，并使用复合动态高斯图捕获多个移动物体。本文进一步利用LiDAR先验来实现精确的几何结构和多视图一致性。DrivingGaussian在两个自动驾驶数据集上实现了最先进的性能，实现了高质量的环视视图合成和动态场景重建

引用：

Zhou, X., Lin, Z., Shan, X., Wang, Y., Sun, D., & Yang, M. (2023). DrivingGaussian: Composite Gaussian Splatting for Surrounding Dynamic Autonomous Driving Scenes. ArXiv. /abs/2312.07920

DrivingGaussian：逼真环视数据，驾驶场景重建SOTA