AI生成视频还有王炸?阿里EMO惊艳登场,让小李子rap、高启强普法
有志者,事竟成!如果你在学习科技周边,那么本文《AI生成视频还有王炸?阿里EMO惊艳登场,让小李子rap、高启强普法》,就很适合你!文章讲解的知识点主要包括,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~
撰稿 | 伊风
在整个2月份,Sora 成为了备受瞩目的 AI 王牌,她发布的两个 AI 视频吸引了大量目光。然而,就在2月接近尾声时,另一位视频生成“选手”也出现在我们的视野中,给人们带来了惊喜!
阿里最新推出的视频生成框架是 EMO(Emote Portrait Alive)。EMO基于扩散模型,只需提供图像和音频,便能创造出极具表现力的肖像视频。从发布的视频中可以看出,EMO 在动作、口型和表情等方面展现出色,展示了与 Sora 相当的“可玩性”,使得用户可以制作出许多富有想象力和创意的视频作品。
EMO 驱动的肖像不仅可以唱歌、口语对白,甚至还能为你秀一段快嘴说唱。示例视频中展现了 EMO 多样的生成能力和优越的实现效果,含有阿里团队的大量“官方整活”。
通过 EMO,你可以让蒙娜丽莎不再只是神秘微笑,转而纵情高歌一首时下的热曲《flowers》;让蔡徐坤去秀一段快嘴,成为比肩姆爷的“rap god”;或者让反派高启强改邪归正加入普法队伍……不得不说,每一支视频都脑洞大开。
1.歌声驱动,人人都能当歌星
画面中 AI 生成的蒙娜丽莎,正站在她那神秘、幽静的山峦之间,远处是无际的绿植与道路。置身于这样的美景之间,蒙娜丽莎情不自禁地唱起麦莉·赛勒的《flowers》。唱到陶醉之时的蒙娜丽莎不仅会流露自信的笑容,还间或闭上眼睛,完全沉醉在歌唱之中,给人非常真实的视听体验。
Sora 视频中那位走在巴黎街头的皮衣女士也来体验了一把 EMO 的生成效果。在该视频中“Sora 女士”不仅头部运动自然,发力时眉毛的运动及换气的感觉也都让人十分惊喜。此外, EMO 对于耳环的摆动、甚至墨镜中反光的倒影也进行了较为逼真的还原。
2.二次元到三次元,多个语种都能唱
视频中银发绿瞳的精致女孩正面朝阳光,唱着宁艺卓翻唱版本的《Melody》,中英文切换时自然流畅。值得一提的是,驱动这支视频的图像也由 AI 生成,但整体呈现的效果犹如一位真实的美女主播。
画面中的“哥哥”张国荣正唱着 Eason 的那首《无条件》。有网友认为,这支视频暴露了EMO 在跟随粤语时生成的口型不够自然。不知道大家欣赏这支视频时,是否会有“音画不同步”的感觉。当然,这支视频中哥哥愉悦的积极情绪与《无条件》歌词的情感基调有断裂,这可能也是让我们感到“哪里不对”的原因之一。
3.语速快如rap god,也不留破绽
视频中还没成为中年大叔的貌美版“小李子”,正唱着阿姆的《GODZILLA》。从驱动视频来看,肖像人物的表情与说唱的节奏配合自然,中间停顿时的神情也极具感染力。
以下视频来源于
往事如歌
没有比让坤坤唱《rap god》更抽象的整活了。不知道为何,两个说唱的示例都选择了“姆爷”的歌曲,这可能也是阿里团队的一种炫技。
4.对白也能 hold 住,反派普法不是梦
视频采用了《The Dark Knight》 2008 Jocker 的经典台词,“Why so serious? Let's put a smile on that face ” 驱动了 2019 版 Jocker 。小丑脸上的油彩随着肌肉的运动而自然运动着。
这支视频让强哥和“法外狂徒张三”联动了一把。视频中的高启强为大家解读“紧急避险”的概念,看来强哥不仅可以吃鱼,饿到快死的时候吃点熊猫、金丝猴也是可以的。
视频来源:https://humanaigc.github.io/emote-portrait-alive/
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

- 上一篇
- Gin-Gonic 限制路线

- 下一篇
- Golang + MongoDB 官方驱动 vs Quarkus Reactive MongoDb
-
- 科技周边 · 人工智能 | 5小时前 |
- GoogleNotebookLM升级:视频支持80语言,体验优化
- 172浏览 收藏
-
- 科技周边 · 人工智能 | 6小时前 |
- 小鹏P7全国发运,8月27日上市即交付
- 462浏览 收藏
-
- 科技周边 · 人工智能 | 7小时前 |
- 豆包AI优化Webpack配置全攻略
- 230浏览 收藏
-
- 科技周边 · 人工智能 | 8小时前 |
- AIOverviews可自定义?个性化设置教程
- 420浏览 收藏
-
- 科技周边 · 人工智能 | 8小时前 |
- AIOverviews目前不支持图表生成。
- 116浏览 收藏
-
- 科技周边 · 人工智能 | 8小时前 |
- InternVLA-A1:上海AI实验室开源具身大模型
- 440浏览 收藏
-
- 科技周边 · 人工智能 | 8小时前 |
- 文心一言职场励志文案怎么写?
- 403浏览 收藏
-
- 科技周边 · 人工智能 | 9小时前 |
- 豆包AI推荐系统代码教程分享
- 160浏览 收藏
-
- 科技周边 · 人工智能 | 9小时前 |
- Claude长文处理技巧全解析
- 324浏览 收藏
-
- 科技周边 · 人工智能 | 11小时前 |
- AutoML图像分类教程全解析
- 294浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 543次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 516次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 499次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- PandaWiki开源知识库
- PandaWiki是一款AI大模型驱动的开源知识库搭建系统,助您快速构建产品/技术文档、FAQ、博客。提供AI创作、问答、搜索能力,支持富文本编辑、多格式导出,并可轻松集成与多来源内容导入。
- 165次使用
-
- AI Mermaid流程图
- SEO AI Mermaid 流程图工具:基于 Mermaid 语法,AI 辅助,自然语言生成流程图,提升可视化创作效率,适用于开发者、产品经理、教育工作者。
- 958次使用
-
- 搜获客【笔记生成器】
- 搜获客笔记生成器,国内首个聚焦小红书医美垂类的AI文案工具。1500万爆款文案库,行业专属算法,助您高效创作合规、引流的医美笔记,提升运营效率,引爆小红书流量!
- 979次使用
-
- iTerms
- iTerms是一款专业的一站式法律AI工作台,提供AI合同审查、AI合同起草及AI法律问答服务。通过智能问答、深度思考与联网检索,助您高效检索法律法规与司法判例,告别传统模板,实现合同一键起草与在线编辑,大幅提升法律事务处理效率。
- 992次使用
-
- TokenPony
- TokenPony是讯盟科技旗下的AI大模型聚合API平台。通过统一接口接入DeepSeek、Kimi、Qwen等主流模型,支持1024K超长上下文,实现零配置、免部署、极速响应与高性价比的AI应用开发,助力专业用户轻松构建智能服务。
- 1061次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览