当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了

真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了

来源:51CTO.COM 2023-12-15 18:54:28 0浏览 收藏

最近发现不少小伙伴都对科技周边很感兴趣,所以今天继续给大家介绍科技周边相关的知识,本文《真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了》主要内容涉及到等等知识点,希望能帮到你!当然如果阅读本文时存在不同想法,可以在评论中表达,但是请勿使用过激的措辞~

最近,Waabi AI、多伦多大学、滑铁卢大学和麻省理工的研究者们在NeurIPS 2023上提出了一个全新的自动驾驶光照仿真平台LightSim。研究者们提出了一种从真实数据中生成配对光照训练数据的方法,解决了数据缺失和模型迁移损失的问题。LightSim利用神经辐射场(NeRF)和基于物理的深度网络渲染车辆驾驶视频,首次在大规模真实数据上实现了动态场景的光照仿真

真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了

  • 项目网站:https://waabi.ai/lightsim
  • 论文链接:https://openreview.net/pdf?id=mcx8IGneYw

为什么需要自动驾驶光照仿真?

在机器人技术中,相机仿真是非常重要的,特别是对于自动驾驶车辆感知室外场景来说。然而,现有的相机感知系统在遇到未经训练的室外照明条件时表现不佳。通过使用相机模拟来生成多样的室外照明变化数据集,可以提升自动驾驶系统的稳定性

常见的相机仿真方法一般基于物理引擎。这种方法通过设定 3D 模型和照明条件来渲染场景。但往往仿真效果缺乏多样性且不够逼真。此外,由于高质量的 3D 模型数量有限,并且物理渲染结果与真实世界场景不完全匹配。这导致训练模型在真实数据上的泛化能力较差。

另一种方法是基于数据驱动的仿真方法。这种方法利用神经渲染技术重构真实世界的数字孪生,以复制传感器观测到的数据。通过这种方法,我们可以更加灵活地创建场景并提高真实感。然而,目前的技术将场景的照明信息嵌入到3D模型中,这样就限制了对数字孪生的编辑,比如改变照明条件或添加、删除物体等操作

在 NeurIPS 2023 的一篇工作中,来自 Waabi AI 的研究者们展示了一个基于物理引擎和神经网络的光照仿真系统 LightSim: Neural Lighting Simulation for Urban Scenes.

真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了

与以往工作不同,LightSim能够同时实现以下几点:

1. 真实(realistic): 首次做到对大规模室外动态场景进行光照仿真,并且可以较为准确地模拟阴影、物体间的光照效果等。

2. 可控(controllable):支持动态驾驶场景的编辑(增添、删除物体、相机位置和参数、改变光照、生成安全关键场景等),从而生成更逼真且一致性更强的视频来提升系统对于光照和边缘情况的鲁棒性。

3. 可扩展 (scalable): 方便扩展到更多的场景和不同数据集中,只需要采集一次数据(single pass), 就能重新建构并进行真实可控的仿真测试。

真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了

仿真系统的搭建

第一步:构建真实世界的可重新照明数字孪生体

为了在数字世界中重建自动驾驶场景,LightSim 首先从采集的数据中划分动态物体和静态场景。这一步使用了 UniSim 来重建场景,并在网络中移除了相机视角依赖。再使用 marching cube 得到 geometry, 并进一步转换为带有基本材料的 mesh。

真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了

除了材料和几何,LightSim 还能够根据室外白天场景的主要光源太阳和天空,估算室外照明,得到高动态范围的环境图(HDR Sky dome)。借助传感器数据和提取的几何体,LightSim 可以估算出一个不完整的全景图像,然后补全它,获得一个全方位 360° 的天空视图。从而利用这个全景图像和 GPS 信息生成 HDR 环境图,准确估算出太阳强度、太阳方向和天空外观。

真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了


重述内容:第二步骤是进行动态城市场景的神经照明仿真

在得到数字孪生体后,可以进一步对其进行修改,例如增加或移除物体,改变车辆轨迹或更改照明等,以生成增强现实的表征。LightSim 将执行基于物理的渲染,生成有关修改场景的照明相关数据,如基本色彩、深度、法向量和阴影。利用这些与照明相关的数据以及对场景源和目标照明条件的估算,LightSim 的工作流程如下所示。

真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了

尽管基于物理的渲染图像能够很好地重建场景中的照明效果,但由于几何形状的不完美以及材料/照明分解中的误差,渲染结果往往缺乏真实感,例如模糊、不真实的表面反射和边界伪影。因此,研究人员提出了增强真实感的神经延迟渲染。他们引入了一个图像合成网络,该网络利用预计算缓冲区中的源图像和渲染引擎生成的照明相关数据,生成最终的图像。同时,论文中的方法还为网络提供了环境图,以增强照明上下文,并通过数字孪生体生成了成对图像,提供了一种新颖的成对仿真和真实数据训练方案

仿真能力展示

改变场景的光照 (Scene Relighting)

LightSim 可以在新的光照条件下以时间一致的方式渲染同一场景。如视频所示,新的太阳位置和天空外观会导致场景的阴影和外观发生变化。

LightSim可以自动对场景进行批量重新照明。它可以从估计和真实的HDR环境图中生成与原场景相同的新的、时间一致的、3D感知的照明变化

影像修正 (Image Correction)

LightSim的照明表示是可编辑的,可以改变太阳的方向,从而更新与太阳光方向相关的照明变化和阴影。通过旋转HDR环境图并将其传递给神经延迟渲染模块,LightSim生成以下视频

LightSim还支持批量编辑阴影功能

光照感知角色插入 (Lighting-Aware Character Insertion)

除了修改照明之外,LightSim 还可以对不常见的对象(例如建筑障碍物)执行照明感知的添加。这些添加的对象可以更新物体的照明阴影、做到准确遮挡物体以及与整个相机配置的空间适配。

仿真迁移 (Generalization to nuScenes)

由于LightSim的神经延迟渲染网络是在多个驾驶视频上进行训练的,所以LightSim可以推广到新场景中。以下视频展示了LightSim在nuScenes中驾驶场景的泛化能力。LightSim可以为每个场景构建照明感知数字孪生,然后应用于在PandaSet上预训练的神经延迟渲染模型。LightSim的迁移性能良好,并且可以为场景重新照明提供较为鲁棒的解决方案

真实可控的相机仿真

综合以上展示的所有功能,LightSim 实现了可控、多样化且逼真的相机模拟。以下视频展示了 LightSim 的场景仿真性能。在视频中,一辆白色的车紧急变道至 SDV 车道,引入了新的路障,这使得白色车辆进入了产生一个全新的场景,在新场景的多种照明条件下 LightSim 生成的效果如下所示。

在下面的视频中,演示了一个新的实例。在现有的道路障碍中插入了新的障碍,并增加了一组新的车辆。通过使用LightSim进行仿真光照,使得新加入的车辆能够完美地融入到场景中

总结和展望

LightSim是一個可感知光照的相機模擬平台,提供處理大規模動態駕駛場景的服務。它能夠根據現實世界的數據構建可感知照明的數字孿生體,並對其進行修改,以創建具有不同物體布局、自動駕駛車視角的新場景。LightSim能夠模擬新的照明條件,實現多樣化、真實且可控的相機模擬,從而生成時間/空間一致的視頻。值得注意的是,LightSim還可以結合逆向渲染、天氣模擬等技術,進一步提升模擬性能

到这里,我们也就讲完了《真实、可控、可拓展,自动驾驶光照仿真平台LightSim上新了》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于模型,训练的知识点!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
智能时代的引领者:vivo S18系列手机发布,AI蓝心大模型助力智能时代的引领者:vivo S18系列手机发布,AI蓝心大模型助力
上一篇
智能时代的引领者:vivo S18系列手机发布,AI蓝心大模型助力
DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发现全新解
下一篇
DeepMind论文登上Nature:困扰数学家几十年的难题,大模型发现全新解
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 讯飞AI大学堂免费AI认证证书:大模型工程师认证,提升您的职场竞争力
    免费AI认证证书
    科大讯飞AI大学堂推出免费大模型工程师认证,助力您掌握AI技能,提升职场竞争力。体系化学习,实战项目,权威认证,助您成为企业级大模型应用人才。
    13次使用
  • 茅茅虫AIGC检测:精准识别AI生成内容,保障学术诚信
    茅茅虫AIGC检测
    茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
    157次使用
  • 赛林匹克平台:科技赛事聚合,赋能AI、算力、量子计算创新
    赛林匹克平台(Challympics)
    探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
    188次使用
  • SEO  笔格AIPPT:AI智能PPT制作,免费生成,高效演示
    笔格AIPPT
    SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
    174次使用
  • 稿定PPT:在线AI演示设计,高效PPT制作工具
    稿定PPT
    告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
    162次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码