当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 通义万象图生图如何控制相似度?

通义万象图生图如何控制相似度?

2026-05-21 22:44:18 0浏览 收藏
想精准掌控AI生成图像与原图在构图、主体、色彩或细节上的相似程度?通义万相图生图提供了一套多维协同的精细调控体系:通过调节70–95区间内的“相似度滑块”锚定语义结构,启用“构图保护”锁定关键区域,结合“种子图复用+迭代提相似度”实现渐进式收敛,利用双参考图解耦控制结构与风格,再辅以“局部重绘掩码”对不同区域施加差异化的保真强度——无论你是要做高保真头像重绘、线稿转绘,还是创意延展中保留核心视觉骨架,这套方法都能帮你把“像不像”的主动权牢牢握在手中。

通义万象的图生图功能怎么控制和原图的相似度?

如果您已上传一张参考图像,希望在生成新图时精确控制其与原图在构图、主体、色彩或细节层面的相似程度,则需通过通义万相图生图功能中的多维参数协同调节。以下是实现该目标的具体操作路径:

一、启用并调节“相似度滑块”参数

该参数直接作用于模型对原始图像语义结构与空间分布的采样强度,数值越高,生成结果越严格遵循原图的主体位置、比例关系与关键区域像素分布;数值过低则易导致主体偏移或构图重构。

1、完成参考图像上传后,在右侧参数设置区找到标有“相似度”或“保持原图结构”的滑块控件。

2、将滑块拖动至指定数值:70–80适用于保留主体与大致布局但允许风格与细节自由延展;85–95适用于高保真复刻,如头像重绘或线稿转绘场景;低于60时系统将弱化图像锚点,转向以提示词为主导的生成逻辑。

3、确认滑块旁显示实时数值(如相似度:85),该值将在生成请求中作为核心约束条件提交至Wan2.7-Image模型。

二、开启“构图保护”并锁定关键区域

此功能通过激活图像分割与注意力掩码机制,强制模型在生成过程中维持原图中选定区域的空间稳定性,尤其适用于人物姿态、建筑轮廓或产品摆放等不可变形要素的保留。

1、在上传图像预览下方点击“启用构图保护”开关,界面将自动加载边缘检测与语义热力图。

2、使用鼠标框选需强保留的区域(例如人脸、LOGO、主视觉中心),系统生成白色半透明遮罩层并标注锁定区域已生效提示。

3、勾选“保持宽高比”与“禁止主体裁剪”两项辅助选项,防止因尺寸适配导致构图失真。

三、使用“种子图复用+相似图迭代”机制

该方法不依赖单次滑块设定,而是通过连续生成过程建立可追溯的图像演化链,每一轮输出均可作为下一轮的输入,并叠加相似度递增策略,实现渐进式结构收敛。

1、首次生成后,在结果图卡片右下角点击“复用图片”按钮,系统自动载入该图作为新参考图。

2、在新界面中将相似度滑块提升5–10个单位(例如从80调至85),并在提示词末尾追加指令:强化面部五官结构一致性,抑制背景元素变异

3、重复执行“生成→复用→提相似度→加约束指令”流程,最多进行三次迭代,每次生成结果均会显示与初始原图的结构匹配度评估值(如构图相似性:92%)。

四、上传双参考图进行风格-结构解耦控制

当需分离“保留什么”与“改变什么”时,该方法通过引入第二张图像明确指定风格迁移目标,使模型在结构上锚定第一张图、在纹理/色调/笔触上对齐第二张图,从而实现结构相似度与视觉表现度的独立调控。

1、在相似图像生成界面点击“添加风格参考图”,上传第二张图像(如理想风格的线稿、油画或国风作品)。

2、在参数区分别设置:结构参考权重:90%(对应首图)、风格参考权重:70%(对应次图)。

3、在提示词中明确分隔指令:“按第一张图构图,仅替换为第二张图的水墨晕染质感与留白节奏”。系统将据此分配跨图像注意力权重。

五、调整“重绘强度”与“局部重绘掩码”精度

该方法适用于对原图局部相似度进行差异化控制,例如保持人物面部高度一致但允许服饰完全重绘,或固定建筑骨架而更新材质与光照效果。

1、点击生成结果图下方的“局部重绘”按钮,进入掩码编辑模式。

2、使用画笔工具涂抹需高相似度保留的区域(如面部、文字标识),系统自动识别并标记为高保真重绘区;涂抹其余区域设为自由生成区

3、在重绘参数中分别设定:高保真区重绘强度:20%(仅微调噪点与色偏),自由区重绘强度:85%(彻底替换内容)。

文中关于通义万象的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《通义万象图生图如何控制相似度?》文章吧,也可关注golang学习网公众号了解相关技术文章。

HTML5视频如何提升硬件解码性能HTML5视频如何提升硬件解码性能
上一篇
HTML5视频如何提升硬件解码性能
自定义注解控制测试顺序详解
下一篇
自定义注解控制测试顺序详解
查看更多
最新文章
资料下载
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    4742次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    5096次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    4971次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    6930次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    5335次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码