当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 浙大提出SIFU算法:单图即可高质量重建几何纹理,新SOTA达成!

浙大提出SIFU算法:单图即可高质量重建几何纹理,新SOTA达成!

来源:51CTO.COM 2024-01-20 16:25:46 0浏览 收藏
推广推荐
免费电影APP ➜
支持 PC / 移动端,安全直达

欢迎各位小伙伴来到golang学习网,相聚于此都是缘哈哈哈!今天我给大家带来《浙大提出SIFU算法:单图即可高质量重建几何纹理,新SOTA达成!》,这篇文章主要讲到等等知识,如果你对科技周边相关的知识非常感兴趣或者正在自学,都可以关注我,我会持续更新相关文章!当然,有什么建议也欢迎在评论留言提出!一起学习!

在AR、VR、3D打印、场景搭建以及电影制作等多个领域中,高质量的穿着衣服的人体3D模型非常重要。

传统方法创建模型需大量时间,专业设备和技术人员才可完成。

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型


相反,在日常生活中,我们通常使用手机相机或在网页上找到的人像照片。

因此,一种能从单张图像准确重建3D人体模型的方法可以显著降低成本,并简化独立创作的过程。

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型以往方法(左)与本文方法技术路线比较(右)

以往的深度学习模型用于3D人体重建,往往需要经过三个步骤:从图像中提取2D特征,将2D特征转到3D空间,以及3D特征用于人体重建。

然而这些方法在2D特征转换到3D空间的阶段,往往忽略了人体先验的引入,导致特征的提取不够充分,最终重建结果上会出现各种缺陷。

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型SIFU与其他SOTA模型重建效果比较

此外,在对纹理预测的阶段,以往模型仅仅依靠训练集中学得的知识,缺少真实世界的先验知识,也往往导致不可见区域的纹理预测较差。

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型

SIFU在纹理预测阶段引入先验知识,增强不可见区域(背部等)的纹理效果。

对此,来自浙江大学ReLER实验室的研究人员提出SIFU模型,依靠侧视图条件隐函数从单张图片重建3D人体模型。

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型图片

论文地址:https://arxiv.org/abs/2312.06704

项目地址:https://github.com/River-Zhang/SIFU

该模型通过在2D特征转换到3D空间引入人体侧视图作为先验条件,增强几何重建效果。并在纹理优化阶段引入预训练的扩散模型,来解决不可见区域纹理较差的问题。

模型结构

模型pipeline如下:

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型图片

该模型运行可分为两个阶段,第一阶段借助侧隐式函数重建人体的几何(mesh)与粗糙的纹理(coarse texture),第二阶段则借助预训练的扩散模型对纹理进行精细化。

在第一阶段中,作者设计了一种独特的Side-view Decoupling Transformer,通过global encoder提取2D特征后,在decoder中引入了人体先验模型SMPL-X的侧视图作为query,从而在图像2D特征中解耦出人体不同方向的3D特征(前后左右),最后用于重建。

该方法成功的在2D特征转换到3D空间时结合人体先验知识,从而使得模型有更好的重建效果。

在第二阶段,作者提出一种3D一致性纹理优化流程(3D Consistent Texture Refinement),首先将人体不可见的区域(侧面、背面)可微渲染成视角连续的图片集,再借助在海量数据中学习到先验知识的扩散模型,对粗糙纹理图片进行一致性编辑,得到更精细的结果。最后通过精细化前后的图片计算损失来优化3D模型的纹理贴图。

实验部分

更高的重建精度

在实验部分,作者使用全面多样化的测试集对他们的模型进行测试,包括CAPE-NFP、CAPE-FP和THuman2.0,并与以往发表在各大顶会的单张图片人体重建SOTA模型进行比较。经定量测试,SIFU模型在几何重建与纹理重建中均表现出了最好的效果。

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型定量评估几何重建精度

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型定量评估纹理重建效果

 

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型使用互联网中公开图片作为输入进行定性效果展示

更强的鲁棒性

以往的模型应用训练集以外的数据时,由于估计的人体先验模型SMPL/SMPL-X不够准确,往往导致重建结果与输入图片相差甚远,难以投入实际应用。

对此,作者专门对模型的鲁棒性进行了测试,通过在ground truth先验模型参数中加入扰动使其位姿发生偏移,模拟真实场景中SMPL-X估计不准确的情况,来评估模型重建的精度。结果表明SIFU模型在该情况下,依然具有最好的重建精度。

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型评估模型面对有误差的人体先验模型时的鲁棒性

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型使用真实世界中的图片,在先验人体模型估计不准确的情况下,SIFU依然有较好的重建效果

更广阔的应用场景

SIFU模型的高精度高质量重建效果,使得其具有丰富的应用场景,包括3D打印、场景搭建、纹理编辑等。

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型3D打印SIFU重建的人体模型

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型SIFU用于3D场景搭建

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型

几何纹理重建新SOTA!浙大提出SIFU:单图即可重建高质量3D人体模型借助公开动作序列数据,可对SIFU重建的模型进行驱动

总结

本文提出侧视图条件隐式函数和3D一致性纹理编辑方法,弥补了以往工作在2D特征转换到3D空间、纹理预测时对先验知识引入的不足,极大的提高了单张图片人体重建的精度和效果,使模型在真实世界应用中具有显著的优势,也为该领域未来的研究提供了新的思路。

参考资料:

https://arxiv.org/abs/2312.06704

今天关于《浙大提出SIFU算法:单图即可高质量重建几何纹理,新SOTA达成!》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
OM5光纤:助力迎接人工智能时代OM5光纤:助力迎接人工智能时代
上一篇
OM5光纤:助力迎接人工智能时代
展望2024年电信市场的主要动向
下一篇
展望2024年电信市场的主要动向
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    3353次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    3564次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    3594次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    4718次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    3969次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码