论文英文名字 | Backdoor attacks-resilient aggregation based on Robust Filtering of Outliers in federated learning for image classification |
---|---|
论文中文名字 | 图像分类联邦学习中基于异常值鲁棒过滤的后门攻击弹性聚合 |
作者 | Nuria Rodríguez Barroso, Eugenio Martínez-Cámara, M. Victoria Luzón, Francisco Herrera |
来源 | Knowledge-Based Systems, Volume 245 [CCF 人工智能 C 类期刊] |
年份 | 2022 年 6 月 |
作者动机 | FL 设置中的客户端的模型更新遵循高斯分布,并且那些在该分布中具有异常行为的客户端很有可能是对抗性客户端。 |
阅读动机 | |
创新点 | 单变量异常值检测 |
内容总结
基于异常值鲁棒过滤的模型中毒后门攻击防御
学习轮 t 中全局模型的更新公式:
模型替换的目的:用其后门模型 $L_{adv}^t$
替换全局模型 $G^t$
假设
- 客户端的模型更新遵循某个学习轮的高斯分布,因为全局聚合模型倾向于收敛到一个共同的解决方案。基于中心极限定理直观地证明了这一点,该定理指出独立随机变量的总和非常接近高斯分布。让客户局部权重的分布是每个随机变量,然后,它们的线性组合接近于高斯分布。因此,聚合超过聚合,结果将收敛到高斯分布。特别是,更新的每个维度的数据分布收敛到单变量高斯分布。
- 由于对抗性客户端的模型更新具有双重目标,我们假设它代表特定学习轮次的客户端更新分布中的异常值。
RFOut-1d 联邦聚合算子
(Robust Filtering of 1-dimensional Outliers)
由于更新的高维性 (通常来自神经网络),并且为了避免通过应用降维技术产生的信息丢失,我们对模型更新的每个维度执行单变量异常检测。
对于每个维度 $i\in\{1,...,m\}$
,其中 m 是模型更新向量的维度,我们考虑每个客户端在该维度上的局部模型更新形成的向量 $L_i=(L_1^t[i],L_2^t[i],...,L_n^t[i])$
,其中 n 是参与聚合的客户数量。
异常检测方法:标准差方法
在参数的每个维度 i 中得到的聚合模型 $G^t$
为:
实验
- 数据集:Digits FEMNIST 和 CelebA
- 数据分布:non-IID
- 训练模型:一个标准的基于 CNN 的图像分类模型,由两个 CNN 层及其相应的最大池化层、一个密集层和具有 softmax 激活函数的输出层组成
实验结果
输入实例后门攻击
- RFOut-1d 总是在所有测试集中获得最高结果
模式后门攻击
- RFOut-1d 与基线相比具有更高的性能
总结
我们解决了对模型中毒后门攻击的防御,这是 FL 的一个真正的挑战。基于来自对抗性客户端的更新将代表客户端更新的高斯分布中的离群点的主张,我们提出了 RFOut-1d,一种基于联邦聚集算子中一维离群点的鲁棒过滤的防御机制。在不同的后门攻击下,在各种设置中评估 RFOut-1d,并将其与最先进的防御进行比较后,结果表明 RFOut-1d 是一种高质量的防御以及适当的联邦聚合算子,它有效地阻止了攻击的影响,同时有利于全局模型的学习。