当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > AI自助写真生成 | PAI x EasyPhoto,让你轻松营造节日氛围

AI自助写真生成 | PAI x EasyPhoto,让你轻松营造节日氛围

来源:搜狐 2023-12-27 14:45:30 0浏览 收藏

编程并不是一个机械性的工作,而是需要有思考,有创新的工作,语法是固定的,但解决问题的思路则是依靠人的思维,这就需要我们坚持学习和更新自己的知识。今天golang学习网就整理分享《AI自助写真生成 | PAI x EasyPhoto,让你轻松营造节日氛围》,文章讲解的知识点主要包括,如果你对科技周边方面的知识点感兴趣,就不要错过golang学习网,在这可以对大家的知识积累有所帮助,助力开发能力的提升。

活动地址:https://developer.aliyun.com/topic/aigc_pai/newyear

教程简述

生成式AI技术批量产出真/像/美的个人写真应用非常受欢迎。近期上线的EasyPhoto 作为一款开源的 SD WebUI 插件,提供更灵活、易用的开发方式,受到大量开发者们的关注和好评,用户可通过上传若干张同一人的照片,即可快速训练 LoRA 模型,并结合用户自定义的模板图片,最终生成真、像、美的写真照片。

EasyPhoto 是一个Webui UI插件,用于生成AI肖像画。基于StableDiffusion + 人物定制Lora + ControlNet 的方式实现,支持低代码操作、自定义风格,内置丰富模版,让更多开发者可以灵活地开发自己的风格化的艺术照生成。 本次AIGC创作活动基于阿里云人工智能平台PAI,低代码高效率启动EasyPhoto,实现节日氛围美图的快速生成。

基于本教程可以体验:

新用户可免费领取价值万元的人工智能平台PAI试用资源

基于交互式建模PAI-DSW 训练个人专属的 LoRA 模型

创作全新的节日AI写真,让您体验到圣诞节、新年等节日充满个性化氛围的感觉

提交作品Redmi Watch3、小米手环8等赢取精美好礼!

使用PAI 快速启动 EasyPhoto

1. 准备工作

1.1 领取交互式建模PAI-DSW免费试用权益

前往本次「hi 2024!AI新年写真大挑战」活动页面,领取交互式建模PAI-DSW产品免费试用资源包

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 对于交互式建模 PAI-DSW 的新用户,阿里云提供了5000CU*H 的免费试用资源,可以在活动页面中直接领取(试用规则请参照阿里云免费试用:https://free.aliyun.com/);或可以购买交互式建模 PAI-DSW 资源包参与活动,购买链接:PAI-DSW 100CU*H资源包,价格 59 元起;如不购买资源包,PAI-DSW 会按量进行计费,计费标准详见阿里云产品定价。

1.2 创建PAI-DSW实例

  1. 前往人工智能平台PAI控制台,链接:https://pai.console.aliyun.com/
  2. 开通人工智能PAI并创建默认工作空间。请参见开通并创建默认工作空间。
  3. 在人工智能平台PAI控制台内,选择交互式建模PAI-DSW

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

4.点击创建实例(如上图)

5.自定义输入实例名称,如“easyphoto”

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

在选择实例机型时,可以考虑使用GPU分类的ecs.gn6v-c8g1.2xlarge(支持资源包抵扣)或ecs.gn7i-c8g1.2xlarge

(支持资源包抵扣)。若这两个机型库存可更换地域尝试,或选择其他付费机型(不支持免费试用)。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

7.选择镜像,stable-diffusion-webui-develop:1.0.0-pytorch2.01-gpu-py310-cu117-ubuntu22.04

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

8.点击“下一步”

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

9.确认【资源配置】及【镜像】如图所示,点击创建实例;

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

10.大约等到3-5分钟,实例状态变为「运行中」,实例创建完成;

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

1.3 在PAI-DSW中打开EasyPhoto教程,体验零代码完成AI开发

  1. 打开链接:基于EasyPhoto的AI新年-圣诞写真大挑战 (WebUI版),点击右上角「在阿里云DSW打开」

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

2.选择先前创建好的实例,点击实例名称

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

3.进入notebook开发界面,逐步点击运行按钮;依次运行 1.环境安装 节的单元格(3个 定义函数-下载代码-下载模型),可下载并安装预置的带有EasyPhoto插件的WebUI,即所依赖的模型。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

4.运行 2.启动WebUI 节的单元格,可打开WebUI。

5.单击生成的链接进入WebUI

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 打开WebUI,进入体验环节,在WebUI里运行EasyPhoto;

2. 开始体验

您可以使用本教程生成自己的节日写真/动图,我们提供了如下的功能:

  • 人物写真(Photo Inference)
  • 指定图片的人物写真 (Photo2Photo)
  • 指定文本的人物写真 (Text2Photo)
  • 人物动图(Video Inference)
  • 指定文本的人物动图 (Text2Video)
  • 指定图片的人物动图 (Image2Video)
  • 指定视频的人物动图 (Video2Video)

大体上,人物写真/动图的生成分为以下两个步骤:

  • Step1: 训练属于人物的数字分身
  • Step2: 基于数字分身进行图像/视频生成

生成图片请参考2.2板块,生成视频请参考2.3板块。

2.1 数字分身训练

  • Step1: 点击EasyPhoto选项卡
  • Step2: 点击Upload Photos 上传自己的训练图片 (5-20张清晰的人像,最好为半身/正面)

如果没有10张个人清晰人像照片,可以选择蒙娜丽莎照片作为测试。蒙娜丽莎照片的下载链接为:https://pai-aigc-photog.oss-cn-hangzhou.aliyuncs.com/webui/mona.zip

  • Step3: 点击Start Training (在弹框中输入任意的user id (英文))

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

我们为您内置了写实/动漫风格的两种基模型供您选择,您也可以根据喜好选择自己的基模型。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

⚠️请注意,如在训练过程中出现如图所示的前端断连,不用担心,您可在notebook后台看见训练进度。待训练完成后刷新前端页面可以进行模型推理。

  • 前端断连(连接超时 确保后台在训练即可):

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 训练完成提醒:
  • SDWebUI 前端

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • notebook后端

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

2.2 图像推理 (Photo Inference)

您可使用Photo Inference 进行图像推理,我们支持:

  • 指定图像的人物写真(Photo2Photo)
  • 指定文本的人物写真(Text2Photo)

2.2.1 人物写真的指定图像

  • Step 1: 切到Photo inference选项卡
  • Step 2: 选择一种合适的图片上传方式
  • 从模版中选择(Template Gallery),需在Gallery中选择一张图片
  • 自行上传单张(Single Image Upload)
  • 批量上传模版(Batch Image Upload)

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 3: 选择基模型和UserId对应的LoRA模型 (可点击 刷新 图标 获得所有的UserID列表)

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 使用Infer With IPA时 无需训练自己的数字分身,直接在弹出的图片框中上传一张图进行生成。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 4: 可在Advanced Option选项卡中设置相关的参数
  • 可打开background restore,并调整重绘幅度,对模版图片进行重绘来达到不同的生成效果。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 5: 点击Start Generation 进行模型推理,生成专属于您的AI写真
  • 稍等约1-2分钟后,图片生成完成,可下载存储图片;

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step6: 您可进一步选择生成图片,单击Text Options,选择一个合适的模版添加艺术字效果,生成的结果将出现在Results 的右侧。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 将图片提交至活动页,参与评奖活动;

⚠️ 若出现如下提示,请设置ControlNet 数目>=4。在控制台退出并重启WebUI进行设置。

  • Step1: 选择 设置 菜单
  • Step2: 在左侧菜单栏中找到ControlNet
  • Step3: 将Multi-ControlNet数目设置>=4
  • Step4: 点击保存设置
  • Step5: 回到notebook页面,停止并重新启动SDWebUI

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

2.2.2 指定文本的人物写真

  • Step 1: 切到Text2Photo选项卡
  • Step 2: 选择一种合适的场景
  • Step 3: 修改相关的文本描述

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step4: 设置生成图像分辨率
  • Step5: 进一步选择/上传 控制图像(姿态控制 OpenPose)

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step6: 与图生图一致的设置 基模型/User_id 及其他参数,进行图像生成,并在生成完成后自行添加艺术字效果。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

* 您可以参考这里的使用方式来进一步训练自己的节日场景,多样化的生成人像写真~

2.3 视频推理 (Video Inference)

您可使用Video Inference 进行视频推理,我们支持:

  • 指定文本的人物动图(Text2Video)
  • 指定图像的人物动图(Image2Video)
  • 指定视频的人物动图(Video2Video)

2.3.1 指定文本的人物动图

  • Step 1: 切到Video inference选项卡
  • Step 2: 选择一个合适的场景,并修改相应的prompy(与 指定文本的人物写真 操作相同)
  • Step 3: 设置图像大小,或上传一个用于控制的视频,并选择合适的控制方式。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 4: 设置基模型、user_id 以及相关的参数。

⚠️ 我们默认打开了lcm 用于视频生成的加速,您可关闭该选项用更多的生成步数来生成更细节的视频结果。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 5: 点击 Start Generation 来生成视频
  • 如前端错误,后台显示生成完成,您可单击 List Recent Conversion Results 来下载/查看 生成的历史视频。(无需刷新)

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step 6: 点击 Text Option 来对生成视频添加艺术字效果。您可以选择某一帧,或将艺术字效果应用于整段视频。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

2.3.2 指定图像的人物动图

  • Step1: 上传一张 人物图 (可通过 按钮 将生成的人物写真发送至此)/ 上传首、尾图

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • Step2: 设置基模型、user_id 及相关参数。点击Start Generation 可进行视频的生成。并使用Text Options进行艺术字的添加。

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

2.3.3 指定视频的人物动图

  • Step1: 上传一段人物视频
  • Step2: 设置基模型、user_id 及相关参数。点击Start Generation 可进行视频的生成。并使用Text Options进行艺术字的添加。

3. 资源清理及后续

3.1 清理

  • 在实验完成后,可前往对应产品控制台,停止或删除实例(两个操作均可),避免实例持续处于运行中,在超出免费试用额度后,带来额外的扣费

保姆级教程 | PAI x EasyPhoto,节日氛围AI写真生成

  • 后续仍考虑使用该实例>>停止;后续不再使用该实例>>删除,成功停止后即停止资源消耗。

3.2 后续

在试用有效期期间,您还可以继续使用DSW实例进行模型训练和推理验证。

附:

欢迎共建 EasyPhoto, Github地址:https://github.com/aigc-apps/sd-webui-EasyPhoto

原文链接:https://developer.aliyun.com/article/1401917?utm_content=g_1000386818

本文为阿里云原创内容,未经允许不得转载。

到这里,我们也就讲完了《AI自助写真生成 | PAI x EasyPhoto,让你轻松营造节日氛围》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!

版本声明
本文转载于:搜狐 如有侵犯,请联系study_golang@163.com删除
谷歌开发的AI模型能提高30%的交通效率,用于交通疏导谷歌开发的AI模型能提高30%的交通效率,用于交通疏导
上一篇
谷歌开发的AI模型能提高30%的交通效率,用于交通疏导
Xbox 和 Inworld AI 将合作,利用 AI 技术为游戏创建 NPC
下一篇
Xbox 和 Inworld AI 将合作,利用 AI 技术为游戏创建 NPC
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • PPTFake答辩PPT生成器:一键生成高效专业的答辩PPT
    PPTFake答辩PPT生成器
    PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
    6次使用
  • SEO标题Lovart AI:全球首个设计领域AI智能体,实现全链路设计自动化
    Lovart
    SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
    6次使用
  • 美图AI抠图:行业领先的智能图像处理技术,3秒出图,精准无误
    美图AI抠图
    美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
    26次使用
  • SEO标题PetGPT:智能桌面宠物程序,结合AI对话的个性化陪伴工具
    PetGPT
    SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
    24次使用
  • 可图AI图片生成:快手可灵AI2.0引领图像创作新时代
    可图AI图片生成
    探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
    51次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码