当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 谷歌逆天「夜视」拍照突然火了!完美降噪还能合成3D视角

谷歌逆天「夜视」拍照突然火了!完美降噪还能合成3D视角

来源:51CTO.COM 2023-04-28 19:53:20 0浏览 收藏

亲爱的编程学习爱好者,如果你点开了这篇文章,说明你对《谷歌逆天「夜视」拍照突然火了!完美降噪还能合成3D视角》很感兴趣。本篇文章就来给大家详细解析一下,主要介绍一下,希望所有认真读完的童鞋们,都有实质性的提高。

最近,网上一段来自谷歌的AI夜景拍摄视频被刷爆了!

图片

视频中的这个技术叫RawNeRF,顾名思义就是NeRF的一个全新变体。

NeRF是一种全连接神经网络,使用2D图像的信息作为训练数据,还原出3D场景。

RawNeRF比起之前的NeRF,有了多处改进。不仅能完美降噪,还能改变相机视角,调整焦点、曝光和色调映射。谷歌的这篇论文于2021年11月发表,并被CVPR 2022收录。

图片

项目地址:https://bmild.github.io/rawnerf/

黑夜中的RawNeRF

在此之前,NeRF是使用色调映射的低动态范围LDR图像作为输入。

而谷歌的RawNeRF改为直接在线性原始图像上进行训练,可以保留场景的完整动态范围。

在合成视图领域,处理黑暗的照片一直是一个难题。

因为在这种情况下,图像中的细节极少。而且这些图像让我们很难把新视图拼接到一起。

图片

还好,我们有一个新的方案——使用原始传感器(RAW sensor data)的数据。

就是像这样的一张图,这样,我们就有了更多的细节。

不过,仍然存在一个问题:噪点也多了。

图片

所以我们必须做个选择:是更少的细节和更少的噪点,还是选择更多的细节和更多的噪点。

好消息是:我们可以使用图像降噪技术。

图片

可以看到,降噪之后的图像效果不错,但要合成视图,这种质量还是不够。

不过图像降噪技术给我们提供了一个思路:既然可以给单个图像去噪,那也可以给一组图像去噪。

让我们来看看RawNeRF的效果。

图片

而且,它还有更多令人惊喜的功能:对基础数据进行色调映射,从深色图像中提取更多细节。

图片

比如改变图像的焦点,营造出很棒的景深效果。

图片

更厉害的是,这个还是实时的。

图片

此外,图像的曝光也会随着焦点的变化而产生相应的变化!

图片

接下来,就让我们看看RawNeRF的五个经典的应用场景吧。

五大经典场景

1. 图像清晰度

看这张图像,你能看到路牌上的信息吗?

图片

可以看到,经过RawNeRF处理后,路牌上的信息就清晰多了。

在下面这个动图里,我们可以清晰地看到原始的NeRF技术和RawNeRF在图像合成上的区别。

图片

其实,所谓的NeRF也并不是多古老的技术,时间才刚刚过了2年而已……

看得出来,RawNeRF在高光的处理上,表现得还是非常出色的,我们甚至能看到右下角车牌周围的高光变化。

2. 镜面高光

镜面高光属于非常难捕捉的对象,因为在移动相机时,它们会发生很大的变化,而且照片之间的相对距离也比较远。这些因素对于学习算法来说,都是巨大的挑战。
在下面这张图中可以看到,RawNeRF所生成的镜面高光可以说是相当还原了。

图片

3. 薄的结构

即使在光线充足的情景中,以前的技术对于栅栏的显示效果也并不好。

图片

而RawNeRF即使处理有一堆栅栏的夜间照片,也妥妥hold得住。

即使在栅栏与车牌重合的地方,效果依然很好。

谷歌逆天「夜视」拍照突然火了!完美降噪还能合成3D视角

4. 镜面反光

路面上的反光,是一种更有挑战性的镜面高光。可以看到,RawNeRF也处理得非常自然,非常真实。

图片

5. 改变焦点,调整曝光

在这个场景中,让我们试试改变视角,不断变换焦点,同时调整曝光。

图片

在以前,要完成这些工作,我们需要从25到200张照片的集合。

而现在,我们只需要几秒钟,就可以完成拍摄了。

当然,RawNeRF现在并不完美,我们可以看到,左边的RawNeRF图像和右边的真实照片,还是有一些差异。

图片

不过,从一组充满噪点的原始图像达到现在这样的效果,RAWnerf已经取得相当大的进步了。要知道,两年前的技术还完全做不到这样。

RAW的好处

简单回顾一下,NeRF训练管线所接收的是经过相机处理的LDR图像,之后的场景重建和视图渲染,基于的都是LDR色彩空间。因此,NeRF的输出实际上已经是经过了后期处理的,想要大幅修改和编辑是不可能了。

相比而言,RawNeRF是直接在线性原始HDR输入数据上训练的。由此产生的渲染结果可以像任何原始照片一样进行编辑,如改变焦点和曝光等等。

图片

由此带来的好处主要有两点:HDR视图合成和降噪处理。

在亮度变化极大的场景中,固定的快门速度不足以捕捉到全部动态范围。RawNeRF模型则可以同时对短曝光和长曝光进行优化处理,从而恢复完整的动态范围。

例如(b)中的这种大光比场景,就需要更复杂的局部色调映射算法(例如HDR+后期处理),才能同时保留暗部的细节和室外的高光。

此外,RawNeRF还可以使用线性颜色渲染具有正确饱和的「虚化」亮点的合成失焦效果。

图片

在图像噪点的处理上,作者进一步地将RawNeRF在完全未经处理的HDR线性原始图像上进行了训练,使其变成了一个能处理几十甚至几百张输入图像的「降噪器」。

这种鲁棒性也就意味着,RawNeRF可以出色地完成在黑暗中重建场景的任务。

例如在(a)这个只有一根蜡烛照明的夜景中,RawNeRF可以从嘈杂的原始数据中提取出本来会被后期处理破坏的细节(b,c)。

图片

作者介绍

论文的第一作者Ben Mildenhall是谷歌研究院的一名研究科学家,从事计算机视觉和图形方面的问题。

图片

他在2015年于斯坦福大学取得计算机科学和数学学士学位,并在2020年于加州大学伯克利分校取得计算机科学博士学位。

图片

刚刚结束的CVPR 2022,可以说是Ben的高光时刻了。

7篇录用论文中有5篇拿下Oral,并且还有一篇获得了最佳学生论文的荣誉提名。

图片

网友评论

视频一出,立马惊艳了众网友。大家一起脑洞大开。

图片

图片

图片

图片

图片

图片

看这技术进步的速度,要不了多久,夜间拍照再也不用愁了~

本篇关于《谷歌逆天「夜视」拍照突然火了!完美降噪还能合成3D视角》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于科技周边的相关知识,请关注golang学习网公众号!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
固定参数的模型有多大潜力?港中文、上海AI Lab等提出高效视频理解框架EVL固定参数的模型有多大潜力?港中文、上海AI Lab等提出高效视频理解框架EVL
上一篇
固定参数的模型有多大潜力?港中文、上海AI Lab等提出高效视频理解框架EVL
首次:微软用GPT-4做大模型指令微调,新任务零样本性能再提升
下一篇
首次:微软用GPT-4做大模型指令微调,新任务零样本性能再提升
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    7次使用
  • Brev AI:零注册门槛的全功能免费AI音乐创作平台
    Brev AI
    探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
    7次使用
  • AI音乐实验室:一站式AI音乐创作平台,助力音乐创作
    AI音乐实验室
    AI音乐实验室(https://www.aimusiclab.cn/)是一款专注于AI音乐创作的平台,提供从作曲到分轨的全流程工具,降低音乐创作门槛。免费与付费结合,适用于音乐爱好者、独立音乐人及内容创作者,助力提升创作效率。
    6次使用
  • SEO标题PixPro:AI驱动网页端图像处理平台,提升效率的终极解决方案
    PixPro
    SEO摘要PixPro是一款专注于网页端AI图像处理的平台,提供高效、多功能的图像处理解决方案。通过AI擦除、扩图、抠图、裁切和压缩等功能,PixPro帮助开发者和企业实现“上传即处理”的智能化升级,适用于电商、社交媒体等高频图像处理场景。了解更多PixPro的核心功能和应用案例,提升您的图像处理效率。
    6次使用
  • EasyMusic.ai:零门槛AI音乐生成平台,专业级输出助力全场景创作
    EasyMusic
    EasyMusic.ai是一款面向全场景音乐创作需求的AI音乐生成平台,提供“零门槛创作 专业级输出”的服务。无论你是内容创作者、音乐人、游戏开发者还是教育工作者,都能通过EasyMusic.ai快速生成高品质音乐,满足短视频、游戏、广告、教育等多元需求。平台支持一键生成与深度定制,积累了超10万创作者,生成超100万首音乐作品,用户满意度达99%。
    9次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码