当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 使用SD WebUI和PAI-DSW实现AI图像扩大的功能

使用SD WebUI和PAI-DSW实现AI图像扩大的功能

来源:搜狐 2024-02-07 08:51:49 0浏览 收藏

学习科技周边要努力,但是不要急!今天的这篇文章《使用SD WebUI和PAI-DSW实现AI图像扩大的功能》将会介绍到等等知识点,如果你想深入学习科技周边,可以关注我!我会持续更新相关文章的,希望对大家都能有所帮助!

教程简述

在本教程中,您将学习如何在阿里云交互式建模(PAI-DSW)中,使用Stable-Diffusion-WebUI实现AI扩图功能。

随着AIGC技术的不断发展,AI扩图成为了一种创新玩法。通过给AI一张图片,AI能够预测和补充图像边界,生成更大尺寸的图像。AI扩图能够拯救废片,将半身照扩展为全身照,但有时也会出现翻车情况,生成的图像让人哭笑不得。

本教程使用Stable Diffusion WebUI实现AI扩图功能效果展示如下:

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

基于本教程可以体验:

新用户可免费领取价值万元的人工智能平台PAI 试用资源

学会如何快速在阿里云上创建一个交互式训练开发环境。

学会如何在DSW中启动WebUI。

学会如何在DSW实现AI扩图功能。

使用PAI-DSW快速启动SD WebUI

1. 准备环境和资源

1.1 领取交互式建模PAI-DSW免费试用权益

前往活动页面,领取交互式建模PAI-DSW产品免费试用资源包

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

  • 对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用:https://free.aliyun.com/);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会按量进行计费,计费标准详见阿里云产品定价。

1.2 创建PAI-DSW实例

  1. 前往人工智能平台PAI控制台,链接:https://pai.console.aliyun.com/
  2. 开通人工智能PAI并创建默认工作空间。请参见开通并创建默认工作空间。
  3. 在人工智能平台PAI控制台内,选择交互式建模PAI-DSW,或点击链接

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

4.点击创建实例(如上图)

5.自定义输入实例名称

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

6.选择实例机型,GPU分类-ecs.gn6v-c8g1.2xlarge(支持资源包抵扣),若无此机型库存可更换地域尝试;

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

7.选择镜像,stable-diffusion-webui-develop:1.0.0-pytorch2.01-gpu-py310-cu117-ubuntu22.04

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

8.点击“下一步”

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

9.确认【资源配置】及【镜像】如图所示,点击创建实例;

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

10.大约等到3-5分钟,实例状态变为「运行中」,实例创建完成;

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

1.3 在DSW中打开教程文件

  1. 单击需要打开的实例操作列下的打开,进入PAI-DSW实例开发环境。
  2. Notebook页签的Launcher页面,单击快速开始区域Tool下的浏览Gallery,打开Gallery页面

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

3.在DSW Gallery页面中,搜索并找到AI扩图神器:放飞你的想象力教程,单击教程卡片中的在DSW中打开。

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

4.右侧出现文件夹“demos”,点击“demos”文件夹,点击“stable_diffusion_inpaint”文件夹,点击“stable_diffusion_inpaint.ipynb”文件,打开已编写好的Notebook最佳实践教程,具体步骤如下图所示

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

5.完成以上步骤,顺利打开AI扩图神器:放飞你的想象力 Notebook最佳实践。

1.4 运行教程文件

  1. 在打开的教程文件stable_diffusion_inpaint.ipynb文件中,您可以直接看到教程文本,您可以在教程文件中直接运行每个代码片段。当成功运行结束一个步骤命令后,再顺次运行下个步骤的命令。

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

2.本教程一共3个运行步骤:

  1. 下载stable-diffusion-webui开源库
  2. 下载模型
  3. 启动WebUI

3.当第3步启动WebUI运行完成后,在返回的运行详情结果中单击URL链接,进入WebUI页面。后续您可以在该页面完成AI扩图。

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

2. 完成部署开始体验AI扩图

为了实现AI扩图的能力,需要在Stable Diffusion WebUI页面进行如下配置。

2.1 进入图生图界面

进入图生图界面,Stable Diffusion模型和模型的VAE保持默认即可。

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

2.2 基本配置

图生图配置,完成图片上传和图生图参数配置。具体参考下图。

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

1.缩放模式:选择填充。

2.重绘幅度:选择1.0。 — 通常来说,重绘幅度参数越大,生成的图片和原来的图片相似度越低,但使用controlnet inpaint扩图时,需要拉满。

3.宽度和高度:填写扩图后的大小。

  • 请根据原图尺寸以及扩图需求来设置尺寸。注意,扩图时原图片的比例不能保持相同。
  • 本例设置宽度为1024,高度为512,期待看到图像水平延展的结果。

2.3 ControlNet配置

接下来,需要配置ControlNet,参数如下:

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

  • 选择启用、Upload independent control image和Pixel Perfect。前两者是为了让ControlNet通过图片控制生图,后者是为了改善生成效果。这里上传跟上文一样的图片。
  • Controltype:选择局部重绘。
  • 预处理器:选择inpaint_only。
  • 模型:选择control_v11p_sd15_inpaint,这是SD1.5的ControlNet扩图模型。
  • ControlMode:选择Controlnet更重要。
  • 画面缩放模式:选择调整大小并填充。

2.4 输入prompt,完成AI扩图

按照个人喜好,输入正向及负向prompt,完成AI扩图,以下为示例参考。

heart-shape balloons——心形气球

Christmas tree——圣诞树

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

本次活动主题:AI扩图后,图片里有一颗树。请由人工智能平台PAI(PAI-DSW)完成AI扩图后,上传符合活动主题的作品至活动页面 >> 「和PAI一起,每周玩转AI」第五期:使用 PAI-DSW 实现AI扩图功能

3. 资源清理及后续

3.1 清理

  • 在实验完成后,可前往对应产品控制台,停止或删除实例(两个操作均可),避免实例持续处于运行中,在超出免费试用额度后,带来额外的扣费

基于 PAI-DSW 使用 SD WebUI 实现AI扩图功能

  • 后续仍考虑使用该实例>>停止;后续不再使用该实例>>删除,成功停止后即停止资源消耗。

3.2 后续

在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。

原文链接:https://developer.aliyun.com/article/1417423?utm_content=g_1000388102

本文为阿里云原创内容,未经允许不得转载。

文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《使用SD WebUI和PAI-DSW实现AI图像扩大的功能》文章吧,也可关注golang学习网公众号了解相关技术文章。

版本声明
本文转载于:搜狐 如有侵犯,请联系study_golang@163.com删除
强制删除Mac桌面上的文件?强制删除Mac桌面上的文件?
上一篇
强制删除Mac桌面上的文件?
如何在Windows 10上设置定时关机
下一篇
如何在Windows 10上设置定时关机
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ljg-skills -
    ljg-skills
    ljg-skills 是李继刚开源的 AI 技能与提示词集合,面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板,适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。
    2520次使用
  • MELO音乐 - AI 音乐生成平台,支持多模态创作能力
    MELO音乐
    MELO音乐是一站式AI视频与音乐制作助手,对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐,MELO为你免费谱曲,轻松做同款!
    2332次使用
  • UniScribe - AI 免费在线音视频转文字平台
    UniScribe
    UniScribe 是一款 AI 音视频转文字与内容整理工具,支持上传音频、视频文件或粘贴 YouTube 链接,自动生成转写文本、摘要、思维导图和关键问题,并支持多格式导出,适合会议记录、课程学习、访谈整理和内容创作复盘。
    2275次使用
  • 剧云 - 免费 AI 智能中文剧本创作平台
    剧云
    剧云是专业中文剧本创作平台,安全稳定运行十余年,集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能,数据安全防护,轻松高效创作剧本。
    2477次使用
  • 万象有声 - AI 一站式有声内容创作平台
    万象有声
    万象有声,一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具,可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验,让有声书制作更简单!
    2452次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码