AI研究获悉印象派的启发,创作栩栩如生的3D模型
今日不肯埋头,明日何以抬头!每日一句努力自己的话哈哈~哈喽,今天我将给大家带来一篇《AI研究获悉印象派的启发,创作栩栩如生的3D模型》,主要内容是讲解等等,感兴趣的朋友可以收藏或者有更好的建议在评论提出,我都会认真看的!大家一起进步,一起学习!
19世纪是印象主义艺术运动盛行的时期,该运动在绘画、雕塑、版画等艺术领域都有影响力。印象主义的特点是使用短小、断断续续的笔触,几乎不追求形式的精准,这后来演变为印象派艺术风格。简而言之,印象派艺术家的笔触没有经过修饰,呈现出明显的特点,不追求形式的精确度,甚至有些模糊。印象派艺术家将光与色的科学理念引入绘画中,革新了传统的色彩观念。
在D3GA中,作者有一个与众不同的目标,他希望通过反其道而行之的方式创造出逼真如照片般的表现效果。为了实现这一目标,作者在D3GA中创造性地运用了高斯泼溅(Gaussian Splatting)技术,将其作为一种现代化的「段笔触」,用来构建虚拟角色的结构和外观,并实现实时稳定的效果。
《日出·印象》是著名的印象派画家莫奈的代表作品。
为了创造可生成动画新内容的逼真人类形象,虚拟形象的构建工作目前需要大量的多视角数据。这是因为单目方法的准确性有限。此外,现有的技术还需要进行复杂的预处理,包括准确的3D配准。然而,获取这些配准数据需要迭代,并且很难集成到端到端的流程中。 另外,还有一些不需要准确配准的方法,它们基于神经辐射场(NeRFs)。然而,这些方法通常在实时渲染方面速度较慢,或者在服装动画方面存在困难。
Kerbl等人提出了一种名为3D Gaussian Splatting(3DGS)的渲染方法,它在经典的Surface Splatting渲染方法的基础上进行了改进。与基于神经辐射场的最先进方法相比,3DGS能够以更快的帧率呈现出更高质量的图像,而且无需进行高度准确的3D初始化。
然而,3DGS最初是为静态场景设计的。目前已经有人提出了基于时间条件的高斯喷洒(Gaussian Splatting)方法,可以用来渲染动态场景。这种方法只能回放之前观察到的内容,因此不适用于表达新的或以前未见过的运动。
在驱动型的神经辐射场的基础上,作者对 3D 的人类的外观及变形进行建模,将其放置在一个规范化的空间中,但使用 3D 高斯而不是辐射场。除性能更好以外,Gaussian Splatting 还不需要使用相机射线采样启发式方法。
剩下的问题是定义触发这些 cage 变形的信号。目前在驱动型的虚拟角色中的最新技术需要密集的输入信号,如 RGB-D 图像甚至是多摄像头,但这些方法可能不适用于传输带宽比较低的情况。在本研究中,作者采用基于人体姿势的更紧凑输入,包括以四元数形式的骨骼关节角度和 3D 面部关键点。
通过在九个高质量的多视图序列上训练个体特定的模型,涵盖各种身体形状、动作和服装(不仅限于贴身服装),以后我们就可以通过任何主体的新姿势对人物形象进行驱动了。
方法概览
- 论文链接:https://arxiv.org/pdf/2311.08581.pdf
- 项目链接:https://zielon.github.io/d3ga/
目前用于动态体积化虚拟角色的方法要么将点从变形空间映射到规范空间,要么仅依赖正向映射。基于反向映射的方法往往在规范空间中会累积误差,因为它们需要一个容易出错的反向传递,并且在建模视角相关效果时存在问题。
因此,作者决定采用仅正向映射的方法。D3GA 是基于 3DGS 的基础上通过神经表示和 cage 进行扩展,分别对虚拟角色的每个动态部分的颜色和几何形状进行建模。
D3GA 使用 3D 姿势 ϕ、面部嵌入 κ、视点 dk 和规范 cage v(以及自动解码的颜色特征 hi)来生成最终的渲染 C¯ 和辅助分割渲染 P¯。左侧的输入通过每个虚拟角色部分的三个网络(ΨMLP、ΠMLP、ΓMLP)进行处理,以生成 cage 位移∆v、高斯变形 bi、qi、si 以及颜色 / 透明度 ci、oi。
在 cage 变形将规范高斯变形后,通过方程式 9,它们被光栅化成最终的图像。
实验结果
D3GA 在 SSIM、PSNR 和感知度量 LPIPS 等指标上进行评估。表 1 显示,D3GA 在只使用 LBS 的方法中(即不需要为每个帧扫描 3D 数据)其在 PSNR 和 SSIM 上的表现是最佳的,并在这些指标中胜过所有 FFD 方法,仅次于 BD FFD,尽管其训练信号较差且没有测试图像(DVA 是使用所有 200 台摄像机进行测试的)。
定性比较显示,与其它最先进方法相比,D3GA 能更好地建模服装,特别是像裙子或运动裤这样的宽松服装 (图 4)。FFD 代表自由形变网格,其包含比 LBS 网格更丰富的训练信号 (图 9)。
与其基于体积方法相比,作者的方法可以将虚拟角色的服装分离出来,并且服装也是可驱动的。图 5 显示了每个单独的服装层,可以仅通过骨骼关节角度控制,而不需要特定的服装配准模块。
以上就是本文的全部内容了,是否有顺利帮助你解决问题?若是能给你带来学习上的帮助,请大家多多支持golang学习网!更多关于科技周边的相关知识,也可关注golang学习网公众号。

- 上一篇
- 机器人的基础模型:目前的进展如何了?

- 下一篇
- GPT-4解释能力下降的新理论
-
- 科技周边 · 人工智能 | 5分钟前 | 微软
- 微软裁员潮升级,Xbox团队大变动
- 452浏览 收藏
-
- 科技周边 · 人工智能 | 9分钟前 |
- 即梦AI如何添加片头片尾?
- 148浏览 收藏
-
- 科技周边 · 人工智能 | 13分钟前 |
- 豆包AI解析HTML数据方法详解
- 420浏览 收藏
-
- 科技周边 · 人工智能 | 14分钟前 | Python 加速
- 豆包AI提升Python效率的3个技巧
- 226浏览 收藏
-
- 科技周边 · 人工智能 | 22分钟前 |
- 豆包AI写Laravel路由,构建RESTfulAPI技巧
- 211浏览 收藏
-
- 科技周边 · 人工智能 | 22分钟前 |
- 拼多多商家必备:DeepSeek话术生成教程
- 214浏览 收藏
-
- 科技周边 · 人工智能 | 23分钟前 |
- MemoAI官方下载教程指南
- 258浏览 收藏
-
- 科技周边 · 人工智能 | 30分钟前 | golang 文心大模型
- Golang接入文心大模型实战教程
- 358浏览 收藏
-
- 科技周边 · 人工智能 | 35分钟前 | C++ 内存泄漏
- 豆包AI内存泄漏检测实战技巧分享
- 321浏览 收藏
-
- 科技周边 · 人工智能 | 44分钟前 | 中兴通讯 air core
- 中兴AIRCore三级智能重构体验与运维解析
- 263浏览 收藏
-
- 科技周边 · 人工智能 | 45分钟前 | Python 列表字典
- 豆包AI列表与字典处理方法详解
- 206浏览 收藏
-
- 科技周边 · 人工智能 | 51分钟前 | 调试指南
- GeminiAPI调试技巧与错误解决方法
- 138浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 茅茅虫AIGC检测
- 茅茅虫AIGC检测,湖南茅茅虫科技有限公司倾力打造,运用NLP技术精准识别AI生成文本,提供论文、专著等学术文本的AIGC检测服务。支持多种格式,生成可视化报告,保障您的学术诚信和内容质量。
- 119次使用
-
- 赛林匹克平台(Challympics)
- 探索赛林匹克平台Challympics,一个聚焦人工智能、算力算法、量子计算等前沿技术的赛事聚合平台。连接产学研用,助力科技创新与产业升级。
- 137次使用
-
- 笔格AIPPT
- SEO 笔格AIPPT是135编辑器推出的AI智能PPT制作平台,依托DeepSeek大模型,实现智能大纲生成、一键PPT生成、AI文字优化、图像生成等功能。免费试用,提升PPT制作效率,适用于商务演示、教育培训等多种场景。
- 138次使用
-
- 稿定PPT
- 告别PPT制作难题!稿定PPT提供海量模板、AI智能生成、在线协作,助您轻松制作专业演示文稿。职场办公、教育学习、企业服务全覆盖,降本增效,释放创意!
- 126次使用
-
- Suno苏诺中文版
- 探索Suno苏诺中文版,一款颠覆传统音乐创作的AI平台。无需专业技能,轻松创作个性化音乐。智能词曲生成、风格迁移、海量音效,释放您的音乐灵感!
- 138次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览