当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > ICLR 2024 | 联邦学习后门攻击的模型关键层

ICLR 2024 | 联邦学习后门攻击的模型关键层

来源：机器之心 2024-04-11 16:12:28 0浏览收藏

小伙伴们对科技周边编程感兴趣吗？是否正在学习相关知识点？如果是，那么本文《ICLR 2024 | 联邦学习后门攻击的模型关键层》，就很适合你，本篇文章讲解的知识点主要包括。在之后的文章中也会多多分享相关知识点，希望对大家的知识积累有所帮助！

联邦学习使用多个参与方可以在数据隐私得到保护的情况下训练模型。但是由于服务器无法监控参与者在本地进行的训练过程，参与者可以篡改本地训练模型，从而对联邦学习的整体模型构成安全隐患，如后门攻击。

本文重点关注如何在有防御保护的训练框架下，对联邦学习发起后门攻击。本文发现后门攻击的植入与部分神经网络层的相关性更高，并将这些层称为后门攻击关键层。在联邦学习中，参与训练的客户端分布在不同的设备上，它们各自训练自己的模型，然后将更新的模型参数上传至服务器进行聚合。由于参与训练的客户端不可信，存在一定风险，因此服务器

基于后门关键层的发现，本文提出通过攻击后门关键层绕过防御算法检测，从而可以控制少量的参与者进行高效的后门攻击。

ICLR 2024 | 联邦学习后门攻击的模型关键层

论文题目：Backdoor Federated Learning By Poisoning Backdoor-Critical Layers

论文链接：https://openreview.net/pdf?id=AJBGSVSTT2

代码链接：https://github.com/zhmzm/Poisoning_Backdoor-critical_Layers_Attack

方法

ICLR 2024 | 联邦学习后门攻击的模型关键层

本文提出层替换方法识别后门关键层。具体方法如下：

第一步，先将模型在干净数据集上训练至收敛，并保存模型参数记为良性模型。再将良性模型的复制在含有后门的数据集上训练，收敛后保存模型参数并记为恶意模型。
第二步，取良性模型中一层参数替换到包含后门的恶意模型中，并计算所得到的模型的后门攻击成功率。将得到的后门攻击成功率与恶意模型的后门攻击成功率 BSR 做差得到 △BSR，可得到该层对后门攻击的影响程度。对神经网络中每一层使用相同的方法，可得到一个记录所有层对后门攻击影响程度的列表。
第三步，对所有层按照对后门攻击的影响程度进行排序。将列表中影响程度最大的一层取出并加入后门攻击关键层集合，并将恶意模型中的后门攻击关键层（在集合中的层）参数植入良性模型。计算所得到模型的后门攻击成功率。如果后门攻击成功率大于所设阈值 τ 乘以恶意模型后门攻击成功率，则停止算法。若不满足，则继续将列表所剩层中最大的一层加入后门攻击关键层直到满足条件。