当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > Meta数字人2代来了!告别VR头显,iPhone一扫就行

Meta数字人2代来了!告别VR头显,iPhone一扫就行

来源:51CTO.COM 2023-05-03 19:11:23 0浏览 收藏

从现在开始,努力学习吧!本文《Meta数字人2代来了!告别VR头显,iPhone一扫就行》主要讲解了等等相关知识点,我会在golang学习网中持续更新相关的系列文章,欢迎大家关注并积极留言建议。下面就先一起来看一下本篇正文内容吧,希望能帮到你!

Meta的逼真数字人2.0再次进化,现在可以用iPhone生成了,只要拿出手机扫一扫! 

早在2019年3月,Facebook就在活动上展示了第一代数字人形象(Codec Avatar 1.0)。第一代数字人是利用多重神经网络,用 132 个摄像头的专用捕获装置生成的。

 图片 

一旦生成,在VR头显设备上的5个摄像头。每只眼部提供两个内部视角,脸部以下提供三个外部视角。 就像下面这样。 

图片 

从那时开始,Facebook一直在不断改进这些虚拟形象的逼真度,比如只需麦克风和眼球追踪技术,就可以获得更逼真的形象。最终在2020年8月进化为Codec Avatar 2.0版。 2.0版比1.0版最大的进步在于,摄像头不再需要扫描跟踪人脸,而是只要跟踪眼球的运动就行了。 

图片 

新的神经网络将VR头显的眼动追踪数据与麦克风的音频馈送相融合,推断佩戴者可能的面部表情。 将声音模型和眼动模型数据反馈至混合模型,再经过融合模型计算处理,由渲染器输出Avatar形象。

 图片 

今年5月,团队更进一步宣布,2.0版的Avatar彻底达成了「完全逼真」的效果。 「我想说的是,未来十年的一个重大挑战是,我们是否可以实现与面对面互动无法区分的远程Avatar互动。」该项目负责人之一的 Sheikh 说。

 图片 

看看上面的对比,a为真人照片,e为最终渲染生成的虚拟人,看起来好像没有怎么吹牛? 别急,上面这是实验中的比对结果,实际上应用场景下,目前Meta虚拟人的形象是这样的。

 图片 

即使是最右边「最逼真」的形象,还是卡通形象,这离「完全逼真」怕是还有点远,不过Meta说的是十年,看看演示中的形象,这个目标实现的希望还是不小的。 

而且,虚拟人技术的进步,也不仅仅体现在逼真度一个方向,大可不必沿着一条路一直走,Meta也在尝试着其他方向。 比如,摘掉VR头显? 图片 

以前,生成一个单独的Codec头像需要带一个名为「MUGSY」专门捕捉设备,上面有171个高分辨率摄像头,就是上图这个(密恐退散)。 

Meta现在说,不用带这东西了,有个iPhone就行了! 只要一台带正面深度传感器的智能手机(比如带FaceID功能的iPhone),直接扫一扫(确切地说,是好几十扫),就能生成逼真的虚拟人头像。 

首先保持面无表情,扫描一次,然后做出各种不同的表情,最多支持65种不同表情。 

Meta称,用手机完成表情扫描,平均大概需要3-4分钟。 当然这少不了算力的支持,最终生成的逼真虚拟人头像,在一台有四个高端GPU的机器上,大概需要6个小时。 当然,如果这个技术用在产品上,这些计算会交给云端GPU,无需用户自己的算力资源。  图片 

那么,为什么之前需要100来个摄像头才能完成的事,现在只需一台手机就可以做到了呢? 秘诀就是一种叫做Hypernetwork的通用模型。 这是一种神经网络,可以生成另一个神经网络的权值。在上面的例子中,就是生成特定人的Codec Avatar.

 图片 

研究人员通过扫描255个不同的人脸来训练这个模型,使用的是一种先进的捕捉装置,很像MUGSY,但是只有90个摄像头。 

虽说别的研究人员已经展示过用智能手机扫描生成的人像了,而且Meta表示,生成的结果是SOTA级别的。 

然而,现在的系统还是不能应付眼镜和长头发。并且只能到头,身体的其它部位还不行。 

当然了,Meta在达到这种保真度之前,还有很长的路要走。 现在Meta的人像都有种卡通风格。而那种逼真的感觉随着时间的推移慢慢降低了。 现在这种形象可能更适合用Quest 2玩儿Horizon Worlds的群体。

 图片 

然而,Codec Avatar可能最终只会是一个单独的选项,而不是现在这种卡通风格的升级。 Meta的CEO扎克伯格是这么描述未来的:你可能会用一个充满表现主义的人像玩儿平常的游戏,而用一个更逼真的人像来参加工作会议什么的。 

今年4月,负责Codec Avatar团队的Yaser Sheikh表示,「现在来预测Codec Avatar还有多久能投入使用是不太可能的。」 不过,他明确表示,他认为项目是有很大进步的。 

今天关于《Meta数字人2代来了!告别VR头显,iPhone一扫就行》的内容介绍就到此结束,如果有什么疑问或者建议,可以在golang学习网公众号下多多回复交流;文中若有不正之处,也希望回复留言以告知!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
被OpenAI CEO取关后,Yann LeCun再次抨击:ChatGPT对现实的把握非常肤浅被OpenAI CEO取关后,Yann LeCun再次抨击:ChatGPT对现实的把握非常肤浅
上一篇
被OpenAI CEO取关后,Yann LeCun再次抨击:ChatGPT对现实的把握非常肤浅
如何关闭 iPhone 和 Apple Watch 上的碰撞检测
下一篇
如何关闭 iPhone 和 Apple Watch 上的碰撞检测
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 毕业宝AIGC检测:AI生成内容检测工具,助力学术诚信
    毕业宝AIGC检测
    毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
    23次使用
  • AI Make Song:零门槛AI音乐创作平台,助你轻松制作个性化音乐
    AI Make Song
    AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
    33次使用
  • SongGenerator.io:零门槛AI音乐生成器,快速创作高质量音乐
    SongGenerator
    探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
    30次使用
  •  BeArt AI换脸:免费在线工具,轻松实现照片、视频、GIF换脸
    BeArt AI换脸
    探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
    33次使用
  • SEO标题协启动:AI驱动的智能对话与内容生成平台 - 提升创作效率
    协启动
    SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
    36次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码