Midjourney 5.2震撼发布!原画生成3D场景,无限缩放无垠宇宙
亲爱的编程学习爱好者,如果你点开了这篇文章,说明你对《Midjourney 5.2震撼发布!原画生成3D场景,无限缩放无垠宇宙》很感兴趣。本篇文章就来给大家详细解析一下,主要介绍一下,希望所有认真读完的童鞋们,都有实质性的提高。
Midjourney和Stable Diffusion,已经卷到没边了!
几乎在Stable Diffusion XL 0.9发布的同一时间,Midjourney宣布推出了5.2版本。
此次5.2版本最亮眼的更新在于zoom out功能,它可以无限扩展原始图像,同时保持跟原始图像的细节相同。
用zoom out做出的无垠宇宙动画,直接让人震惊到失语,可以说,Midjourney 5.2看得比詹姆斯韦伯太空望远镜还要远!
这个极其强大的功能,可以创造出非常神奇的图片,甚至还能被用来拍摄毫无破绽的高清变焦视频!
这个「核弹级」更新,让网友直呼:你们这个功能也太强大了,直接把我的睡眠毁了!
玩了一个小时之后,这名网友再次表示:太强大了,我要哭了……
无限缩放,像宇宙一样没有尽头——
老奶奶宇宙中有多少个老奶奶?答案是无穷个——
爱丽丝追逐着小兔子不小心掉下了「兔子洞」,便进入了仙境。
而网友用zoom out自制的这个「兔子洞」,简直如梦如幻。
还有一个AI图像设计团队——ilumine AI只用一张很小的原画,就通过Zoom Out生成了下面这个宏大的场景图片。
然后再配合自家正在开发的技术2D转3D的技术,直接做了一个3D的游戏场景。
相信等到他们的产品正式推出之后,配合Midjourney Zoom Out这种凭空扩图的功能,用一张原画直接做出3D场景。
这简直是要革了游戏行业的命了,很多游戏制作从业者应该要哭出声吧。
Zoom Out誓要碾压Adobe AI和Uncrop?
此前,Adobe’s Generative Fill的填充功能,就被网友们玩疯了,它填充的周星驰电影剧照,可谓「毫无破绽」。
而Stability AI也紧接着放出大招。它联合Clipdrop推出了Uncrop Clipdrop——一个终极图像比例编辑器。
而Midjourney的V5.2的zoom out功能,也是不遑多让,甚至更加强大。
只要通过「/image」命令输入提示,Midjourney就会根据你的prompt生成四个视觉迭代图,你可以选择自己最喜欢的一个来放大,这个过程中,整个图像都会以更高的细节被渲染。
现在,所有Upscale的图像下方都有「Zoom Out」按钮,您可以使用它们来重新生成图像。
先给定一张需要缩放的原图,点击下面的「缩放两倍」的按钮。
和之前我们介绍过的Uncrop一样,Midjourney会生成4张备选的图案。
缩放之后4张备选图案的风格都非常一致,只是在背景的细节上有些差别。
在选择了4个Upscale的图案中的一个之后,还可以接着选择放大两倍对照片进行持续缩放。
可以看得出进一步缩放之后的图案风格和细节依然非常一致,如果你想持续缩放下去,就可以做出开头哈勃望远镜的效果。
你只要不停地重复这个过程,就能生成一张巨大无比的拥有无限多细节的「巨图」。
再配上热心网友的指导,就能生成文章一开头的「无限宇宙缩放动画」:
左图如梦似幻的仙境,还可以继续扩大,让艺术和梦幻的世界无限扩张……
网友们激动得觉也不睡了,直接玩疯了。
马斯克的霹雳宇宙是这样的。
这已经是大师级的艺术作品了。
墨菲斯变成绝地武士,场景扩大后,显得更厉害了。
有网友感慨道:Midjourney v5.2模拟从极近镜头到全开镜头的摄像机运动时,简直太赞了。
下一步是不是就是把速率变成每秒24-60帧,角色变成可移动的?12个月内是不是Midjourney就会有文字转视频服务了?
当然,还有紧跟时事的网友,为马老板做了八角笼对战图。
三大软件的无限缩放功能对比
Uncrop因为是免费软件,不知道是由于官方的处于节省资源的考虑还是技术上的问题,他们是不支持无限套娃缩放的。
原图:
缩放一次之后:
第二次缩放之后就会产生黑边,拒绝套娃。
而Midjourney的套娃宇宙我们在上边已经见识过它的效果了。
PS的GF,理论上只要画布能无限扩大,也可以吧一张图片在空白处无限补全,达成无限缩放的效果。
只是实现起来要比Midjourney麻烦一些。
硬核网友手把手教你怎么做猫头鹰视频
问题来了,文章开头那段震撼的猫头鹰飞行变焦视频,是怎么做出来的?
大师级网友「歸藏」给出了手把手教我们的详细教程。
首先,生成一张猫头鹰图,然后用下面的1.5倍Zoom Out按钮。
在连续重复这个过程7次之后,得到了7张视频的关键帧图像。
把他们排序之后,登陆app.cunwayml.com,在左边导航找到创建视频这个Tab,然后找到Frame Interpolation这个功能。
然后用我们做好的这7张图,拖进左边的位置上传,检查顺序无误后就可以点击Generate生成视频了。
一段时间之后就可以看到这段视频的预览效果,不过,普通用户只能导出720P。
太长不看版:V5.2更新的8大功能
简而言之,这次V5.2更新,可以概括为如下8大功能。
1 方形重构(Square Reframe)
-扩大图片大小
-选择制作方形
这次该更新附带的一个「制作正方形」工具,可以改变以正方形以外的纵横比制作图像的形状。
宽高比为16:9的原始图像
方形图像
使用这个工具,就可以调整任何照片的大小,重构图片,社交媒体上怎么方便展示,就怎么调整。
2 标准变焦(Standard Zoom 1.5 - 2x)
选择缩放1.5倍或2倍。
这个功能适合短距离变焦,可以为照片添加更多细节。
3 无限缩放「Endless Zoom (Re-Zoom a Pic) 」
这个功能可以围绕特定角色,为图片制作全新的大背景。
4 自定义缩放重构(Custom Zoom Reframing)
无论是艺术家、设计师还是品牌,都可以自定义图像大小,让图片适应任何在线平台。
5 风格化(Stylize)
Midjourney经过训练,可以创建具有艺术闪光和丰富视觉美感的图像,这是它与Stable Diffusion的最大区别。
以前,用户可以在提示的末尾添加「–styleize X」(图 X 的范围从 0-1000),但 V5.2采用了该模型现有的风格化功能,并在真实感和天赋方面将它们增加到11。
6 变化模式(Variation Mode)
Midjourney V5.2还附带了一个名为「变化模式」的新功能,可以用户反复打磨想要应用于输出的视觉细微差别。
在prompt中使用「低变化」模式,就能生成一致的角色形象,而如果选择「高变化」,就会导致与原始输出的较大的视觉差别,四张图片就会更加具有创意和艺术表现力。
7 不同的个人照片(Vary Individual Pics)
给它一张你的原始图片,你可以选择生成好四个类似的你,或者风格变化非常大的你。
8 更短提示(/Shorten Prompts)
关于Midjourney,人们往往有一个误解:如果在prompt中使用更多单词,就会看到更好或更详细的结果。
但其实,过于冗长的提示往往会抵消每个单词的影响,从而导致输出的图片并不一定符合用户的想法。
而这次Midjourney更新的缩短」命令功能,就可以分析prompt的成分,为我们提供了一些替代方案的建议。
通过全新的prompts,往往能让原始图片生成更惊艳的结果。
今天带大家了解了的相关知识,希望对你有所帮助;关于科技周边的技术知识我们会一点点深入介绍,欢迎大家关注golang学习网公众号,一起学习编程~

- 上一篇
- realme真我GT系列:续航能力与影像体验双提升

- 下一篇
- 如何提高Go语言开发中的代码可读性和可维护性
-
- 科技周边 · 人工智能 | 1小时前 |
- 即梦ai高清封面导出攻略即梦ai缩略图生成秘籍
- 148浏览 收藏
-
- 科技周边 · 人工智能 | 2小时前 |
- 尊界S800配置曝光:4座三电机对决5座双电机
- 432浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- RSAC2024速览,20款网络安全新品发布
- 158浏览 收藏
-
- 科技周边 · 人工智能 | 4小时前 |
- 理想汽车7国招聘副总裁,加速出海战略
- 224浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 美图AI抠图
- 美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
- 6次使用
-
- PetGPT
- SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
- 6次使用
-
- 可图AI图片生成
- 探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
- 41次使用
-
- MeowTalk喵说
- MeowTalk喵说是一款由Akvelon公司开发的AI应用,通过分析猫咪的叫声,帮助主人理解猫咪的需求和情感。支持iOS和Android平台,提供个性化翻译、情感互动、趣味对话等功能,增进人猫之间的情感联系。
- 36次使用
-
- Traini
- SEO摘要Traini是一家专注于宠物健康教育的创新科技公司,利用先进的人工智能技术,提供宠物行为解读、个性化训练计划、在线课程、医疗辅助和个性化服务推荐等多功能服务。通过PEBI系统,Traini能够精准识别宠物狗的12种情绪状态,推动宠物与人类的智能互动,提升宠物生活质量。
- 35次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览