当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像

Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像

来源：搜狐 2023-11-30 18:08:03 0浏览收藏

编程并不是一个机械性的工作，而是需要有思考，有创新的工作，语法是固定的，但解决问题的思路则是依靠人的思维，这就需要我们坚持学习和更新自己的知识。今天golang学习网就整理分享《Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像》，文章讲解的知识点主要包括，如果你对科技周边方面的知识点感兴趣，就不要错过golang学习网，在这可以对大家的知识积累有所帮助，助力开发能力的提升。

即使在家里，Stable Diffusion XL Turbo（SDXL Turbo）也可以以惊人的速度创建详细的图像。

周二，Stability AI公司发布了一款名为“稳定扩散XL Turbo”的人工智能图像合成模型。该模型能够根据书面提示迅速生成图像。实际上，该模型的速度非常快，以至于该公司将其宣传为“实时”图像生成器，因为它还能够迅速转换来自网络摄像头等来源的图像

SDXL Turbo的主要创新在于它能够在一个步骤中产生图像输出，比其前身所需的20-50个步骤显着减少。Stability AI将这种效率的飞跃归功于一种被称为对抗性扩散蒸馏（ADD）的技术。ADD使用分数提取，其中模型从现有的图像合成模型中学习，以及对抗性损失，这增强了模型区分真实图像和生成图像的能力，提高了输出的真实性。

在周二发表的一篇专注于ADD技术的研究论文中，Stability AI详细介绍了该模型的内部工作原理。SDXL Turbo的优点之一是它与生成对抗网络（GAN）相似，特别是在产生单步图像输出方面。

SDXL Turbo的图像并不像SDXL在更高分辨率下生成的图像那样详细，因此它并不能完全替代之前的型号。然而，它以其惊人的速度节省了时间

为了进行尝试，我们使用 Automatic111 在Nvidia RTX 3060上本地运行SDXL Turbo（权重与SDXL权重一样下降），它可以在大约4秒内生成3步1024×1024图像，而具有类似细节的20步SDXL图像则需要26.4秒。较小的图像生成速度要快得多（对于512×768而言，不到1秒），当然，更强大的显卡，如RTX 3090或4090，也将允许更快的生成时间。与Stability的营销相反，我们发现SDXL Turbo图像在每张图像大约3-5步处具有最佳细节。

SDXL Turbo的生成速度就是所谓的“实时”。Stability AI表示，在NVIDIA A100（一款强大的AI调整图形处理器）上，该模型可以在207ms内生成一张512×512图像，包括编码、单个去噪步骤和解码。如果能够解决一致性问题，这样的速度可能会导致实时生成AI视频过滤器或实验性视频游戏图像生成。在这种情况下，一致性意味着在多个帧或代之间保持相同的主题。

Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像

目前，SDXL Turbo是在非商业研究许可证下提供的，限制其用于个人非商业目的。这一举措已经在Stable Diffusion社区受到了一些批评，但Stability AI表示对商业应用持开放态度，并邀请感兴趣的各方联系以获取更多信息。

与此同时，Stability AI面临着内部管理问题，一位投资者最近敦促首席执行官埃马德·莫斯塔克（Emad Mostaque）辞职。据报道，Stability AI管理层一直在探索将公司出售给更大实体的可能性，但这并没有影响Stability AI发布新产品的速度。就在上周，该公司推出了一款名为“稳定视频扩散”（Stable Video Diffusion）的软件，可以将静止图像转换成短视频剪辑

Stability AI在其图像编辑平台Clipdrop上提供了SDXL Turbo功能的测试版演示。你也可以在 Hugging Face 上免费试用一个非官方的现场演示。显然，所有常见的警告都适用，包括缺乏训练数据的来源和滥用的可能性。即使有这些悬而未决的问题，人工智能图像合成的技术进步肯定不会放缓。

如果你的朋友们喜欢的话，请关注一下“知新了了”！

到这里，我们也就讲完了《Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像》的内容了。个人认为，基础知识的学习和巩固，是为了更好的将其运用到项目中，欢迎关注golang学习网公众号，带你了解更多关于的知识点！

版本声明

本文转载于：搜狐如有侵犯，请联系study_golang@163.com删除