使用SD WebUI和PAI-DSW实现AI图像扩大的功能
学习科技周边要努力,但是不要急!今天的这篇文章《使用SD WebUI和PAI-DSW实现AI图像扩大的功能》将会介绍到等等知识点,如果你想深入学习科技周边,可以关注我!我会持续更新相关文章的,希望对大家都能有所帮助!
教程简述
在本教程中,您将学习如何在阿里云交互式建模(PAI-DSW)中,使用Stable-Diffusion-WebUI实现AI扩图功能。
随着AIGC技术的不断发展,AI扩图成为了一种创新玩法。通过给AI一张图片,AI能够预测和补充图像边界,生成更大尺寸的图像。AI扩图能够拯救废片,将半身照扩展为全身照,但有时也会出现翻车情况,生成的图像让人哭笑不得。
本教程使用Stable Diffusion WebUI实现AI扩图功能效果展示如下:
基于本教程可以体验:
新用户可免费领取价值万元的人工智能平台PAI 试用资源
学会如何快速在阿里云上创建一个交互式训练开发环境。
学会如何在DSW中启动WebUI。
学会如何在DSW实现AI扩图功能。
使用PAI-DSW快速启动SD WebUI
1. 准备环境和资源
1.1 领取交互式建模PAI-DSW免费试用权益
前往活动页面,领取交互式建模PAI-DSW产品免费试用资源包
- 对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用:https://free.aliyun.com/);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会按量进行计费,计费标准详见阿里云产品定价。
1.2 创建PAI-DSW实例
- 前往人工智能平台PAI控制台,链接:https://pai.console.aliyun.com/
- 开通人工智能PAI并创建默认工作空间。请参见开通并创建默认工作空间。
- 在人工智能平台PAI控制台内,选择交互式建模PAI-DSW,或点击链接
4.点击创建实例(如上图)
5.自定义输入实例名称
6.选择实例机型,GPU分类-ecs.gn6v-c8g1.2xlarge(支持资源包抵扣),若无此机型库存可更换地域尝试;
7.选择镜像,stable-diffusion-webui-develop:1.0.0-pytorch2.01-gpu-py310-cu117-ubuntu22.04
8.点击“下一步”
9.确认【资源配置】及【镜像】如图所示,点击创建实例;
10.大约等到3-5分钟,实例状态变为「运行中」,实例创建完成;
1.3 在DSW中打开教程文件
- 单击需要打开的实例操作列下的打开,进入PAI-DSW实例开发环境。
- 在Notebook页签的Launcher页面,单击快速开始区域Tool下的浏览Gallery,打开Gallery页面
3.在DSW Gallery页面中,搜索并找到AI扩图神器:放飞你的想象力教程,单击教程卡片中的在DSW中打开。
4.右侧出现文件夹“demos”,点击“demos”文件夹,点击“stable_diffusion_inpaint”文件夹,点击“stable_diffusion_inpaint.ipynb”文件,打开已编写好的Notebook最佳实践教程,具体步骤如下图所示
5.完成以上步骤,顺利打开AI扩图神器:放飞你的想象力 Notebook最佳实践。
1.4 运行教程文件
- 在打开的教程文件stable_diffusion_inpaint.ipynb文件中,您可以直接看到教程文本,您可以在教程文件中直接运行每个代码片段。当成功运行结束一个步骤命令后,再顺次运行下个步骤的命令。
2.本教程一共3个运行步骤:
- 下载stable-diffusion-webui开源库
- 下载模型
- 启动WebUI
3.当第3步启动WebUI运行完成后,在返回的运行详情结果中单击URL链接,进入WebUI页面。后续您可以在该页面完成AI扩图。
2. 完成部署开始体验AI扩图
为了实现AI扩图的能力,需要在Stable Diffusion WebUI页面进行如下配置。
2.1 进入图生图界面
进入图生图界面,Stable Diffusion模型和模型的VAE保持默认即可。
2.2 基本配置
图生图配置,完成图片上传和图生图参数配置。具体参考下图。
1.缩放模式:选择填充。
2.重绘幅度:选择1.0。 — 通常来说,重绘幅度参数越大,生成的图片和原来的图片相似度越低,但使用controlnet inpaint扩图时,需要拉满。
3.宽度和高度:填写扩图后的大小。
- 请根据原图尺寸以及扩图需求来设置尺寸。注意,扩图时原图片的比例不能保持相同。
- 本例设置宽度为1024,高度为512,期待看到图像水平延展的结果。
2.3 ControlNet配置
接下来,需要配置ControlNet,参数如下:
- 选择启用、Upload independent control image和Pixel Perfect。前两者是为了让ControlNet通过图片控制生图,后者是为了改善生成效果。这里上传跟上文一样的图片。
- Controltype:选择局部重绘。
- 预处理器:选择inpaint_only。
- 模型:选择control_v11p_sd15_inpaint,这是SD1.5的ControlNet扩图模型。
- ControlMode:选择Controlnet更重要。
- 画面缩放模式:选择调整大小并填充。
2.4 输入prompt,完成AI扩图
按照个人喜好,输入正向及负向prompt,完成AI扩图,以下为示例参考。
heart-shape balloons——心形气球
Christmas tree——圣诞树
本次活动主题:AI扩图后,图片里有一颗树。请由人工智能平台PAI(PAI-DSW)完成AI扩图后,上传符合活动主题的作品至活动页面 >> 「和PAI一起,每周玩转AI」第五期:使用 PAI-DSW 实现AI扩图功能
3. 资源清理及后续
3.1 清理
- 在实验完成后,可前往对应产品控制台,停止或删除实例(两个操作均可),避免实例持续处于运行中,在超出免费试用额度后,带来额外的扣费;
- 后续仍考虑使用该实例>>停止;后续不再使用该实例>>删除,成功停止后即停止资源消耗。
3.2 后续
在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。
原文链接:https://developer.aliyun.com/article/1417423?utm_content=g_1000388102
本文为阿里云原创内容,未经允许不得转载。
文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《使用SD WebUI和PAI-DSW实现AI图像扩大的功能》文章吧,也可关注golang学习网公众号了解相关技术文章。

- 上一篇
- 强制删除Mac桌面上的文件?

- 下一篇
- 如何在Windows 10上设置定时关机
-
- 科技周边 · 人工智能 | 8小时前 |
- 腾讯混元3Dv2.5新版3D模型震撼发布
- 307浏览 收藏
-
- 科技周边 · 人工智能 | 9小时前 |
- Llama4震撼发布,Meta开源多模态AI霸主
- 417浏览 收藏
-
- 科技周边 · 人工智能 | 17小时前 | 深蓝汽车
- 深蓝汽车4月销量2.01万辆,同比增58%
- 170浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- AI Make Song
- AI Make Song是一款革命性的AI音乐生成平台,提供文本和歌词转音乐的双模式输入,支持多语言及商业友好版权体系。无论你是音乐爱好者、内容创作者还是广告从业者,都能在这里实现“用文字创造音乐”的梦想。平台已生成超百万首原创音乐,覆盖全球20个国家,用户满意度高达95%。
- 16次使用
-
- SongGenerator
- 探索SongGenerator.io,零门槛、全免费的AI音乐生成器。无需注册,通过简单文本输入即可生成多风格音乐,适用于内容创作者、音乐爱好者和教育工作者。日均生成量超10万次,全球50国家用户信赖。
- 13次使用
-
- BeArt AI换脸
- 探索BeArt AI换脸工具,免费在线使用,无需下载软件,即可对照片、视频和GIF进行高质量换脸。体验快速、流畅、无水印的换脸效果,适用于娱乐创作、影视制作、广告营销等多种场景。
- 12次使用
-
- 协启动
- SEO摘要协启动(XieQiDong Chatbot)是由深圳协启动传媒有限公司运营的AI智能服务平台,提供多模型支持的对话服务、文档处理和图像生成工具,旨在提升用户内容创作与信息处理效率。平台支持订阅制付费,适合个人及企业用户,满足日常聊天、文案生成、学习辅助等需求。
- 16次使用
-
- Brev AI
- 探索Brev AI,一个无需注册即可免费使用的AI音乐创作平台,提供多功能工具如音乐生成、去人声、歌词创作等,适用于内容创作、商业配乐和个人创作,满足您的音乐需求。
- 17次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览