AI生成视频还有王炸?阿里EMO惊艳登场,让小李子rap、高启强普法
有志者,事竟成!如果你在学习科技周边,那么本文《AI生成视频还有王炸?阿里EMO惊艳登场,让小李子rap、高启强普法》,就很适合你!文章讲解的知识点主要包括,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~
撰稿 | 伊风
在整个2月份,Sora 成为了备受瞩目的 AI 王牌,她发布的两个 AI 视频吸引了大量目光。然而,就在2月接近尾声时,另一位视频生成“选手”也出现在我们的视野中,给人们带来了惊喜!
阿里最新推出的视频生成框架是 EMO(Emote Portrait Alive)。EMO基于扩散模型,只需提供图像和音频,便能创造出极具表现力的肖像视频。从发布的视频中可以看出,EMO 在动作、口型和表情等方面展现出色,展示了与 Sora 相当的“可玩性”,使得用户可以制作出许多富有想象力和创意的视频作品。
EMO 驱动的肖像不仅可以唱歌、口语对白,甚至还能为你秀一段快嘴说唱。示例视频中展现了 EMO 多样的生成能力和优越的实现效果,含有阿里团队的大量“官方整活”。
通过 EMO,你可以让蒙娜丽莎不再只是神秘微笑,转而纵情高歌一首时下的热曲《flowers》;让蔡徐坤去秀一段快嘴,成为比肩姆爷的“rap god”;或者让反派高启强改邪归正加入普法队伍……不得不说,每一支视频都脑洞大开。
1.歌声驱动,人人都能当歌星
画面中 AI 生成的蒙娜丽莎,正站在她那神秘、幽静的山峦之间,远处是无际的绿植与道路。置身于这样的美景之间,蒙娜丽莎情不自禁地唱起麦莉·赛勒的《flowers》。唱到陶醉之时的蒙娜丽莎不仅会流露自信的笑容,还间或闭上眼睛,完全沉醉在歌唱之中,给人非常真实的视听体验。
Sora 视频中那位走在巴黎街头的皮衣女士也来体验了一把 EMO 的生成效果。在该视频中“Sora 女士”不仅头部运动自然,发力时眉毛的运动及换气的感觉也都让人十分惊喜。此外, EMO 对于耳环的摆动、甚至墨镜中反光的倒影也进行了较为逼真的还原。
2.二次元到三次元,多个语种都能唱
视频中银发绿瞳的精致女孩正面朝阳光,唱着宁艺卓翻唱版本的《Melody》,中英文切换时自然流畅。值得一提的是,驱动这支视频的图像也由 AI 生成,但整体呈现的效果犹如一位真实的美女主播。
画面中的“哥哥”张国荣正唱着 Eason 的那首《无条件》。有网友认为,这支视频暴露了EMO 在跟随粤语时生成的口型不够自然。不知道大家欣赏这支视频时,是否会有“音画不同步”的感觉。当然,这支视频中哥哥愉悦的积极情绪与《无条件》歌词的情感基调有断裂,这可能也是让我们感到“哪里不对”的原因之一。
3.语速快如rap god,也不留破绽
视频中还没成为中年大叔的貌美版“小李子”,正唱着阿姆的《GODZILLA》。从驱动视频来看,肖像人物的表情与说唱的节奏配合自然,中间停顿时的神情也极具感染力。
以下视频来源于
往事如歌
没有比让坤坤唱《rap god》更抽象的整活了。不知道为何,两个说唱的示例都选择了“姆爷”的歌曲,这可能也是阿里团队的一种炫技。
4.对白也能 hold 住,反派普法不是梦
视频采用了《The Dark Knight》 2008 Jocker 的经典台词,“Why so serious? Let's put a smile on that face ” 驱动了 2019 版 Jocker 。小丑脸上的油彩随着肌肉的运动而自然运动着。
这支视频让强哥和“法外狂徒张三”联动了一把。视频中的高启强为大家解读“紧急避险”的概念,看来强哥不仅可以吃鱼,饿到快死的时候吃点熊猫、金丝猴也是可以的。
视频来源:https://humanaigc.github.io/emote-portrait-alive/
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

- 上一篇
- Gin-Gonic 限制路线

- 下一篇
- Golang + MongoDB 官方驱动 vs Quarkus Reactive MongoDb
-
- 科技周边 · 人工智能 | 8小时前 |
- 腾讯混元3Dv2.5新版3D模型震撼发布
- 307浏览 收藏
-
- 科技周边 · 人工智能 | 9小时前 |
- Llama4震撼发布,Meta开源多模态AI霸主
- 417浏览 收藏
-
- 科技周边 · 人工智能 | 17小时前 | 深蓝汽车
- 深蓝汽车4月销量2.01万辆,同比增58%
- 170浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 16次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 13次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 12次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 16次使用
-
- Brev AI
- 探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
- 17次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览