当前位置:首页 > 文章列表 > 科技周边 > 人工智能 > 北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

来源:51CTO.COM 2023-09-11 21:15:37 0浏览 收藏

学习知识要善于思考,思考,再思考!今天golang学习网小编就给大家带来《北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了》,以下内容主要包含等知识点,如果你正在学习或准备学习科技周边,就都不要错过本文啦~让我们一起来看看吧,能帮助到你就更好了!

近年来,对视觉感知系统安全性评估的研究已经逐渐深入,已经有研究人员成功地开发了基于眼镜、贴纸、衣物等不同载体的可见光模态安全评估技术,并且还有一些对红外模态的新尝试。然而,这些技术都只能应用于单一的模态

随着人工智能技术的发展,可见光-热红外成像技术已广泛应用于治安监控、自动驾驶等安全关键任务中。可见光成像在白天能提供丰富的纹理信息,而红外成像则能在夜间清晰显示目标的热辐射分布。二者结合使用,视觉感知系统可以实现24小时全覆盖,并且不受环境限制,具备许多优势。因此,需要研究针对多模态视觉感知系统的统一安全评估方法

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

然而,实现多模态评估极具挑战性。首先,在不同成像机制下打击方法通用难。以前的方法都分别基于特定目标模态成像特点提出,在其他模态下很难起到作用。再者,平衡隐身性能、制作成本和灵活应用难。对于可见光和更难的红外模态双重有效已是不易,实现低成本便捷制作与使用更是难上加难。

面对诸多挑战,来自北航人工智能研究院的研究者挖掘可见光 - 红外模态间通用的形状属性,创新性地提出 「跨模态通用对抗补丁」,实现可见光 - 红外同步隐身。其遴选易获取、成本低、隔热性能优异的材料制作便捷贴片,即拆即用,在填补当前物理世界可见光 - 红外多模态检测系统鲁棒性评估技术缺失的同时,兼顾物理实现的简易性与即时性。实验证明了该方法在不同检测模型与模态下的有效性,以及多场景下的泛化性。目前,该论文已被 ICCV 2023 接收。

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

请点击以下链接查看论文:https://arxiv.org/abs/2307.07859

代码链接:https://github.com/Aries-iai/Cross-modal_Patch_Attack

技术要点

该研究以进化算法为基础框架,从形状建模、形状优化和模态平衡三个角度进行方案设计和效果改进。具体流程如下图所示:

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

1. 基于样条插值的多锚点形状建模

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

对于基础形状建模部分,研究人员设计了一种点优化建模新范式。通过改变点的坐标,可以直接调整补丁的形状,而不受方向、距离等限制的影响。这样有效地增大了补丁形状的搜索空间。为了确保形状的自然性,研究人员还利用了样条插值方法来实现平滑连接,使得样条更紧密地跟随控制点

2. 边界限定形状优化算法基于差分进化的原理

实现打击需要有效的优化手段,为此研究人员从时间成本、实际效果等角度考量,以进化算法作为基本框架,并从边界设定、适应度函数两个角度改进:

需要进行改写的内容是:(1)边界设定:通过对锚点进行边界设定,可以提高形变的有效性,降低时间成本。其具体设定如下:不会在曲线段内形成循环或自交;在曲线段内不容易出现尖点;不会出现在无效区域

以锚点北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了为例,下图蓝色部分为边界设定图例,橙色部分为错误实例:

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

关于锚点北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了的边界判定 北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了 数学表达如下所示:

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

(2)适应度函数:本研究不同于以往仅针对单一模态进行打击评估的工作,而是聚焦于可见光-红外两个模态,并且意识到两个模态之间存在天然的平衡效果差异问题。为了避免过度优化单一模态而忽视另一模态,研究人员提出了一种创新的跨模态适应度函数,该函数基于检测器的置信度得分感知,旨在鼓励探索成功的方向并平衡两个模态之间的效果差异。最终,根据评分进行优胜劣汰。为了考虑到初始阶段和后期阶段的打击难度差异,该函数使用指数函数代替线性函数,以更加凸显不同阶段的打击进度差异性

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

算法迭代该探索过程直至两模态都打击成功,输出最优形状策略。完整优化流程如下所示:

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

实验结果

实验一:针对不同系列检测器的跨模态打击性能验证

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

实验二:针对形状的消融实验

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

实验三:对于跨模态适应度函数的消融实验

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

实验四:物理实施偏差下的方法鲁棒性验证

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

实验五:不同物理条件下的方法有效性验证

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了

在不同的角度、距离、姿势和场景下进行性能验证,并将结果可视化呈现

总结

本研究的核心是自然形状优化,并结合形变补丁和跨模态打击,设计了一种物理环境下可见光 - 红外多模态鲁棒性评估方法。该方法可以评估多模态(可见光 - 红外)目标检测系统的鲁棒性,并根据评估结果有效地修正检测器模型,同时提高可见光和红外两种模态下目标图像检测的准确性。该方法在物理环境中实施和应用,为多模态检测系统的鲁棒性评估和改进做出了贡献

以上就是《北航打破模态壁垒,跨可见光-红外模态的通用物理对抗打击方法来了》的详细内容,更多关于模型,数据的资料请关注golang学习网公众号!

版本声明
本文转载于:51CTO.COM 如有侵犯,请联系study_golang@163.com删除
新标题:揭秘大模型运行缓慢的原因:人类思维算法的新方向新标题:揭秘大模型运行缓慢的原因:人类思维算法的新方向
上一篇
新标题:揭秘大模型运行缓慢的原因:人类思维算法的新方向
老黄给H100“打鸡血”:英伟达推出大模型加速包,Llama2推理速度翻倍
下一篇
老黄给H100“打鸡血”:英伟达推出大模型加速包,Llama2推理速度翻倍
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    508次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    497次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • PPTFake答辩PPT生成器:一键生成高效专业的答辩PPT
    PPTFake答辩PPT生成器
    PPTFake答辩PPT生成器,专为答辩准备设计,极致高效生成PPT与自述稿。智能解析内容,提供多样模板,数据可视化,贴心配套服务,灵活自主编辑,降低制作门槛,适用于各类答辩场景。
    12次使用
  • SEO标题Lovart AI:全球首个设计领域AI智能体,实现全链路设计自动化
    Lovart
    SEO摘要探索Lovart AI,这款专注于设计领域的AI智能体,通过多模态模型集成和智能任务拆解,实现全链路设计自动化。无论是品牌全案设计、广告与视频制作,还是文创内容创作,Lovart AI都能满足您的需求,提升设计效率,降低成本。
    13次使用
  • 美图AI抠图:行业领先的智能图像处理技术,3秒出图,精准无误
    美图AI抠图
    美图AI抠图,依托CVPR 2024竞赛亚军技术,提供顶尖的图像处理解决方案。适用于证件照、商品、毛发等多场景,支持批量处理,3秒出图,零PS基础也能轻松操作,满足个人与商业需求。
    26次使用
  • SEO标题PetGPT:智能桌面宠物程序,结合AI对话的个性化陪伴工具
    PetGPT
    SEO摘要PetGPT 是一款基于 Python 和 PyQt 开发的智能桌面宠物程序,集成了 OpenAI 的 GPT 模型,提供上下文感知对话和主动聊天功能。用户可高度自定义宠物的外观和行为,支持插件热更新和二次开发。适用于需要陪伴和效率辅助的办公族、学生及 AI 技术爱好者。
    25次使用
  • 可图AI图片生成:快手可灵AI2.0引领图像创作新时代
    可图AI图片生成
    探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
    52次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码