AI生成视频还有王炸?阿里EMO惊艳登场,让小李子rap、高启强普法
有志者,事竟成!如果你在学习科技周边,那么本文《AI生成视频还有王炸?阿里EMO惊艳登场,让小李子rap、高启强普法》,就很适合你!文章讲解的知识点主要包括,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~
撰稿 | 伊风
在整个2月份,Sora 成为了备受瞩目的 AI 王牌,她发布的两个 AI 视频吸引了大量目光。然而,就在2月接近尾声时,另一位视频生成“选手”也出现在我们的视野中,给人们带来了惊喜!
阿里最新推出的视频生成框架是 EMO(Emote Portrait Alive)。EMO基于扩散模型,只需提供图像和音频,便能创造出极具表现力的肖像视频。从发布的视频中可以看出,EMO 在动作、口型和表情等方面展现出色,展示了与 Sora 相当的“可玩性”,使得用户可以制作出许多富有想象力和创意的视频作品。
EMO 驱动的肖像不仅可以唱歌、口语对白,甚至还能为你秀一段快嘴说唱。示例视频中展现了 EMO 多样的生成能力和优越的实现效果,含有阿里团队的大量“官方整活”。
通过 EMO,你可以让蒙娜丽莎不再只是神秘微笑,转而纵情高歌一首时下的热曲《flowers》;让蔡徐坤去秀一段快嘴,成为比肩姆爷的“rap god”;或者让反派高启强改邪归正加入普法队伍……不得不说,每一支视频都脑洞大开。
1.歌声驱动,人人都能当歌星

画面中 AI 生成的蒙娜丽莎,正站在她那神秘、幽静的山峦之间,远处是无际的绿植与道路。置身于这样的美景之间,蒙娜丽莎情不自禁地唱起麦莉·赛勒的《flowers》。唱到陶醉之时的蒙娜丽莎不仅会流露自信的笑容,还间或闭上眼睛,完全沉醉在歌唱之中,给人非常真实的视听体验。

Sora 视频中那位走在巴黎街头的皮衣女士也来体验了一把 EMO 的生成效果。在该视频中“Sora 女士”不仅头部运动自然,发力时眉毛的运动及换气的感觉也都让人十分惊喜。此外, EMO 对于耳环的摆动、甚至墨镜中反光的倒影也进行了较为逼真的还原。
2.二次元到三次元,多个语种都能唱

视频中银发绿瞳的精致女孩正面朝阳光,唱着宁艺卓翻唱版本的《Melody》,中英文切换时自然流畅。值得一提的是,驱动这支视频的图像也由 AI 生成,但整体呈现的效果犹如一位真实的美女主播。

画面中的“哥哥”张国荣正唱着 Eason 的那首《无条件》。有网友认为,这支视频暴露了EMO 在跟随粤语时生成的口型不够自然。不知道大家欣赏这支视频时,是否会有“音画不同步”的感觉。当然,这支视频中哥哥愉悦的积极情绪与《无条件》歌词的情感基调有断裂,这可能也是让我们感到“哪里不对”的原因之一。
3.语速快如rap god,也不留破绽

视频中还没成为中年大叔的貌美版“小李子”,正唱着阿姆的《GODZILLA》。从驱动视频来看,肖像人物的表情与说唱的节奏配合自然,中间停顿时的神情也极具感染力。
以下视频来源于
往事如歌

没有比让坤坤唱《rap god》更抽象的整活了。不知道为何,两个说唱的示例都选择了“姆爷”的歌曲,这可能也是阿里团队的一种炫技。
4.对白也能 hold 住,反派普法不是梦

视频采用了《The Dark Knight》 2008 Jocker 的经典台词,“Why so serious? Let's put a smile on that face ” 驱动了 2019 版 Jocker 。小丑脸上的油彩随着肌肉的运动而自然运动着。

这支视频让强哥和“法外狂徒张三”联动了一把。视频中的高启强为大家解读“紧急避险”的概念,看来强哥不仅可以吃鱼,饿到快死的时候吃点熊猫、金丝猴也是可以的。
视频来源:https://humanaigc.github.io/emote-portrait-alive/
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~
Gin-Gonic 限制路线
- 上一篇
- Gin-Gonic 限制路线
- 下一篇
- Golang + MongoDB 官方驱动 vs Quarkus Reactive MongoDb
-
- 科技周边 · 人工智能 | 28分钟前 | 中文版 谷歌AI 网页登录 aistudio.google.com Gmail账号
- 谷歌AI中文版入口及免注册方法
- 340浏览 收藏
-
- 科技周边 · 人工智能 | 1小时前 |
- 即梦数据安全吗?隐私保护全解析
- 138浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 豆包AI如何查错?Debug操作全解析
- 371浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 | 搜索 Threads Perplexity 合集 提问历史
- Perplexity历史查看方法及Thread管理技巧
- 138浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 豆包AI代码加密技巧与教程详解
- 221浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 即梦图片版权归属说明
- 218浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 500次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 485次学习
-
- ChatExcel酷表
- ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
- 3203次使用
-
- Any绘本
- 探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
- 3416次使用
-
- 可赞AI
- 可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
- 3446次使用
-
- 星月写作
- 星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
- 4554次使用
-
- MagicLight
- MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
- 3824次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览

