当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > 使用纹理对比度检测检测AI生成的图像

使用纹理对比度检测检测AI生成的图像

来源：51CTO.COM 2024-04-28 08:36:44 0浏览收藏

积累知识，胜过积蓄金银！毕竟在科技周边开发的过程中，会遇到各种各样的问题，往往都是一些细节知识点还没有掌握好而导致的，因此基础知识点的积累是很重要的。下面本文《使用纹理对比度检测检测AI生成的图像》，就带大家讲解一下知识点，若是你对本文感兴趣，或者是想搞懂其中某个知识点，就请你继续往下看吧~

在本篇文章中我们将介绍如何开发一个深度学习模型来检测人工智能生成的图像。

使用纹理对比度检测检测AI生成的图像

许多用于检测人工智能生成图像的深度学习方法都根据图像生成的方式或者图像的特性/语义来确定，通常这些模型只能识别人工智能生成的特定对象，比如人、脸、汽车等。

然而，这项名为“Rich and Poor Texture Contrast: A Simple yet Effective Approach for AI-generated Image Detection”的研究提出的方法克服了这些挑战，具有更广泛的适用性。我们将深入探讨这篇研究论文，阐明它是如何有效解决了其他检测人工智能生成图像方法所面临的问题。

泛化性问题

当我们使用一个模型(比如ResNet-50)来识别人工智能生成的图像时，模型会根据图像的语义进行学习。如果我们训练一个模型来识别人工智能生成的汽车图像，使用真实图像和人工智能生成的不同汽车图像进行训练，那么该模型将只能从这些数据中获取有关汽车的信息，而对于其他物体则无法进行准确识别。

虽然可以对各种对象的数据进行训练，但这种方式耗时较长，而且仅能在未知数据上达到大约72%的准确率。尽管可以通过增加训练次数和数据量来提高准确性，但我们无法无限地获取训练数据。

也就是说目前检测模型的泛化性有很大的问题，为了解决这个问题，论文提出了以下的方法

Smash&Reconstruction

这篇论文介绍了一种独特的方法，用于防止模型在训练过程中从图像的形状中学习到人工智能生成的特征。作者提出了一种名为Smash&Reconstruction的方法来实现这一目标。

在这种方法中，图像被分成预定大小的小块，然后对它们进行重新排列，以生成新的图像。这只是一个简单的概述，因为在形成生成模型的最终输入图像之前，还需要进行额外的步骤。

使用纹理对比度检测检测AI生成的图像

将图像分割成小块后，我们将小块分成两组，一组是纹理丰富的小块，另一组是纹理较差的小块。

图像中细节丰富的区域，如物体或两个对比色区域之间的边界，就成为一个丰富的纹理块。与主要是背景的纹理区域(如天空或静止的水)相比，丰富的纹理区域在像素上有很大的变化。

计算纹理丰富的指标

首先将图像分成预先确定大小的小块，如上图所示。然后找到这些图像块的像素梯度(即找出水平方向、对角线方向和反对角线方向上的像素值之差并将它们相加)，并将它们分离成丰富纹理块和纹理较差块。

与纹理较差的块相比，纹理丰富的块具有更高的像素梯度值，计算图像梯度值得公式如下：

使用纹理对比度检测检测AI生成的图像

在像素对比度的基础上对图像进行分离，得到两幅合成图像。这一过程是本文称之为“Smash&Reconstruction”的完整过程。

使用纹理对比度检测检测AI生成的图像

这样就让模型学习到得是纹理的细节，而不是物体的内容表征

fingerprint

大多数基于指纹的方法受到图像生成技术的限制，这些模型/算法只能检测由特定方法/类似方法(如扩散、GAN或其他基于CNN的图像生成方法)生成的图像。

为了精确地解决这个问题，论文已经将这些图像块划分为丰富或贫乏的纹理。然后作者又提出了一种识别人工智能生成图像指纹的新方法，这也就是论文的标题。他们提出在应用30个高通滤波器后，找到图像中丰富和贫乏纹理斑块之间的对比度。

丰富和贫乏的纹理块之间的对比度有什么帮助呢？

为了更好理解，我们将图像并排比较，真实图像和人工智能生成的图像。

使用纹理对比度检测检测AI生成的图像

这两张图像使用肉眼观看也是很难查看他们的去别的对吧

论文首先使用Smash&Reconstruction 过程:

使用纹理对比度检测检测AI生成的图像

使用纹理对比度检测检测AI生成的图像

在每个图像上应用30个高通滤波器后，它们之间的对比度:

使用纹理对比度检测检测AI生成的图像

使用纹理对比度检测检测AI生成的图像

从这些结果中我们可以看到，人工智能生成的图像与真实图像的对比度相比，纹理斑块丰富和贫乏的对比度要高得多。

这样我们用肉眼就可以看到区别了，所以可以将对比度的结果放入可训练模型，并将结果数据输入分类器，这样就是我们这篇论文的模型架构：

使用纹理对比度检测检测AI生成的图像

分类器的结构如下:

使用纹理对比度检测检测AI生成的图像

论文中提到了30个高通滤波器，这些滤波器最初是为隐写分析而引入的。

注：图片隐写的方式有很多种。广义上，只要通过某种方式将信息隐藏到图片中而难以通过普通方式发现，就可以称为图片隐写，对于隐写分析有很多相关的研究，有兴趣的可以查阅相关资料。

这里的过滤器是使用卷积方法应用于图像的矩阵值，所使用的滤波器是高通滤波器，它只允许图像的高频特征通过它。高频特征通常包括边缘、精细细节和强度或颜色的快速变化。

使用纹理对比度检测检测AI生成的图像

除(f)和(g)外，所有滤波器在重新应用于图像之前都以一定角度旋转，因此总共形成30个滤波器。这些矩阵的旋转是用仿射变换完成的，而仿射变换是用SciPy完成的。

总结

论文的结果已经达到了92%的验证精度，并且据说如果训练的更多还会有更好的结果，这是一个非常有意思的研究，我还找到了训练的代码，有兴趣的可以深入研究：

论文：https://arxiv.org/abs/2311.12397

代码：https://github.com/hridayK/Detection-of-AI-generated-images

以上就是本文的全部内容了，是否有顺利帮助你解决问题？若是能给你带来学习上的帮助，请大家多多支持golang学习网！更多关于科技周边的相关知识，也可关注golang学习网公众号。

人工智能深度学习

版本声明

本文转载于：51CTO.COM 如有侵犯，请联系study_golang@163.com删除

go-colly 库能做什么？

go-colly 库能做什么？

上一篇: go-colly 库能做什么？

如何使用 time.Format() 获取序数指示器？

下一篇: 如何使用 time.Format() 获取序数指示器？

查看更多

最新文章

科技周边 · 人工智能 | 11小时前 | 人工智能 · mcp · ai agent · 工具接入 · 安全审计 · AI Agent MCP Model Context Protocol 工具清单资源上下文权限审计

MCP 服务接入工作流：从工具清单到权限审计的 AI Agent 落地路线

378浏览收藏
科技周边 · 人工智能 | 12小时前 | 人工智能 · ai agent · 工具调用 · 结构化输出 · 工程排查 · AI Agent Schema 结构化输出超时重试工具调用兜底回答

AI Agent 工具调用失败排查：从 Schema 到超时兜底的完整工作流

195浏览收藏
科技周边 · 人工智能 | 15小时前 | 人工智能 · rag · 知识库检索 · RAG 向量检索 AI知识库混合召回结果重排

AI 知识库检索不到答案排查：从分块到重排的 RAG 修复流程

453浏览收藏
科技周边 · 人工智能 | 18小时前 | 人工智能 · AI工程 · 成本控制 · 人工智能成本控制 AI接口 token预算 Batch API

AI 批量调用成本控制：从请求日志到预算阈值的完整工作流

202浏览收藏
科技周边 · 人工智能 | 1天前 | 人工智能 · rag · 知识库 · AI工程实践 · 人工智能 RAG 知识库问答向量检索引用检查

AI 知识库回答跑偏怎么办：RAG 检索、重排和引用检查完整流程

419浏览收藏
科技周边 · 人工智能 | 1天前 | 人工智能 · ai agent · 工程实践 · AI Agent 上下文管理人工确认多智能体交接摘要

AI Agent 交接跑偏怎么办：从意图检查到交接摘要一步步排查

170浏览收藏
科技周边 · 人工智能 | 2天前 | 人工智能 · 质量检查 · AI应用 · 提示词工程 · 回归测试 · 大模型应用回归测试人工复核 AI提示词评分规则上线检查

AI 提示词回归测试实战：小样本集、评分规则和上线前对比

475浏览收藏
科技周边 · 人工智能 | 4天前 | 人工智能 · tracing · ai agent · 可观测性 · 工具调用 · 可观测性 AI Agent Tracing 工具调用 OpenAI Agents SDK

AI Agent Tracing 实战：工具调用、护栏和人工确认怎么追踪

292浏览收藏
科技周边 · 人工智能 | 4天前 | 人工智能 · ai agent · 工具调用 · 权限治理 · 人工智能审计日志 AI Agent 权限分级工具调用人工确认

AI Agent 工具权限分级实战：读、写、发布三类操作怎么管

379浏览收藏
科技周边 · 人工智能 | 4天前 | 人工智能 · AI应用 · 结构化输出 · 内容质检 · 提示词工程 · AI 提示词结构化输出 JSON Schema 质检流水线人工兜底

AI 输出质检流水线实战：规则检查、结构化结果和人工兜底

394浏览收藏
科技周边 · 人工智能 | 4天前 | 人工智能 · rag · 知识库 · 工程实践 · 向量检索 · 元数据 RAG embedding 向量检索 AI知识库文档分块

AI 知识库分块实战：按标题层级切文档，减少回答跑偏

101浏览收藏
科技周边 · 人工智能 | 5天前 | 人工智能 · AI应用 · 工程实践 · 工具调用 · 人工智能智能体参数校验 AI工具调用 JSON Schema

AI 工具调用落地实战：JSON Schema、参数校验和人工兜底

233浏览收藏

查看更多

课程推荐

前端进阶之JavaScript设计模式

设计模式是开发人员在软件开发过程中面临一般问题时的解决方案，代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景，打造一站式知识长龙服务，适合有JS基础的同学学习。

543次学习
GO语言核心编程课程

本课程采用真实案例，全面具体可落地，从理论到实践，一步一步将GO核心编程技术、编程思想、底层实现融会贯通，使学习者贴近时代脉搏，做IT互联网时代的弄潮儿。

516次学习
简单聊聊mysql8与网络通信

如有问题加微信：Le-studyg；在课程中，我们将首先介绍MySQL8的新特性，包括性能优化、安全增强、新数据类型等，帮助学生快速熟悉MySQL8的最新功能。接着，我们将深入解析MySQL的网络通信机制，包括协议、连接管理、数据传输等，让

500次学习
JavaScript正则表达式基础与实战

在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。

487次学习
从零制作响应式网站—Grid布局

本系列教程将展示从零制作一个假想的网络科技公司官网，分为导航，轮播，关于我们，成功案例，服务流程，团队介绍，数据部分，公司动态，底部信息等内容区块。网站整体采用CSSGrid布局，支持响应式，有流畅过渡和展现动画。

485次学习

查看更多

AI推荐

ljg-skills

ljg-skills 是李继刚开源的 AI 技能与提示词集合，面向大模型使用者整理了一批可复用的 prompt、角色设定和任务技能模板，适合用于学习提示词设计、搭建个人 AI 工作流和沉淀团队常用智能体能力。

490次使用
MELO音乐

MELO音乐是一站式AI视频与音乐制作助手，对标suno, udio的高品质体验。提供伴奏生成、原创写词、无损导出、哼唱识曲、混音变声等全套音频与短视频编辑工具。无论是流行Kpop、电音说唱、民谣古风、摇滚儿歌还是商用轻音乐，MELO为你免费谱曲，轻松做同款！

500次使用
UniScribe

UniScribe 是一款 AI 音视频转文字与内容整理工具，支持上传音频、视频文件或粘贴 YouTube 链接，自动生成转写文本、摘要、思维导图和关键问题，并支持多格式导出，适合会议记录、课程学习、访谈整理和内容创作复盘。

470次使用
剧云

剧云是专业中文剧本创作平台，安全稳定运行十余年，集成AI编剧、剧本医生审核、人物小传、剧情关系图、大纲编写、多人协作、Word导入导出、版权管控功能，数据安全防护，轻松高效创作剧本。

642次使用
万象有声

万象有声，一个专为有声创作者打造的新一代智能有声内容创作平台。平台提供专业的智能拆章、智能画本编辑、AI配音、AI生成音效、后期制作、智能对轨、智能审听等有声创作全流程工具，可以帮助创作者高效、低成本创作出引人入胜的有声作品。立即体验，让有声书制作更简单！

616次使用

查看更多

相关文章

GPT-4王者加冕！读图做题性能炸天，凭自己就能考上斯坦福

2023-04-25 501浏览
单块V100训练模型提速72倍！尤洋团队新成果获AAAI 2023杰出论文奖

2023-04-24 501浏览
ChatGPT 真的会接管世界吗？

2023-04-13 501浏览
VR的终极形态是「假眼」？Neuralink前联合创始人掏出新产品：科学之眼！

2023-04-30 501浏览
实现实时制造可视性优势有哪些？

2023-04-15 501浏览

Golang学习网：公益在线Go学习平台，帮助Go学习者快速成长！

技术交流群

Copyright 2023 http://www.17golang.com/ All Rights Reserved ｜苏ICP备2023003363号-1

关注公众号

Golang学习网

微信登录更方便

密码登录
注册账号

登录即同意用户协议和隐私政策

返回登录

重置密码