【论文阅读笔记】Analyzing Federated Learning through an Adversarial Lens

news/2024/11/17 16:05:00/

个人阅读笔记,如有错误欢迎指出

ICML 2019        [1811.12470] Analyzing Federated Learning through an Adversarial Lens (arxiv.org)

问题:

        传统模型攻击容易被服务器通过精度检测以及权重分析检测出来,本文意在找到一种投毒方法绕过服务器的检测。

创新点:

        1、提出了一个攻击的评价指标-隐蔽性。主要在于精度上以及权重分布上。

        2、提出了以交替最小化公式的攻击方式,以实现攻击的同时尽可能逃过服务器的检测。

实验:

        数据集为IID数据

方法:

        攻击目标:主任务上尽可能减小影响,后门上实现高精度,并且能够绕过服务器检测。

        隐蔽性评价指标:

        1、精度检查:服务器在收到更新后,将每个模型更新获取到的新模型\textbf{w}_i^t = \textbf{w}_G^{t-1} + \delta_i^t​与其他所有模型更新得到的模型\textbf{w}_{G\backslash i}^t = \textbf{w}_G^{t-1} + \sum_i \delta_i^t在精度上进行比较,若低于阈值则服务器判定为攻击者。攻击者为求能够绕过此种防御,必须满足如下:

        2、权重更新分布:以当前模型更新与去掉当前模型的其他模型的距离最小值

        min_{i \in[k] \backslash m} d(\delta_m^t, \delta_i^t)以及最大值max_{i \in[k] \backslash m} d(\delta_m^t, \delta_i^t),计算其他模型的距离最小值R_{min,[k \backslash m]}^l最大值R_{max,[k \backslash m]}^l为上下界,距离最大临界为\kappa _t。攻击者需满足以下要求以绕过检测:

攻击方式:

        1、梯度放大:

        恶意的训练方首先必须克服其余正常训练方梯度更新的影响以及服务器聚合模型梯度时,对梯度更新缩放的影响,需要对更新的梯度进行放大。攻击者估计聚合器的更新为\hat{\textbf{w}}_G^t = \textbf{w}_G^{t-1}+\alpha_m \delta_m^t​,则定义\lambda = \frac{1}{\alpha_m},提交的更新为\delta_m^t = \lambda \widetilde\delta_m^t,随后服务器的更新则变为了\hat{\textbf{w}}_G^t = \textbf{w}_m^t,本轮更新之后的全局模型的估计值等于恶意训练方的本地模型(模型替换)。

        效果:第三轮后主任务以及后门任务的准确率都较高

        攻击缺陷:易于被以下检测手段捕获

        ①精度检测中远低于全局模型

        ②恶意更新的L2距离分布更稀疏范围也更小,也更尖锐

隐形模型中毒:

        1、针对精度损失问题:为了保证攻击方模型在验证集上也有较高的准确度,攻击方在进行本地模型训练的过程中,添加了基于本地正常数据的训练损失函数:

        2、针对距离度量问题:限制模型与其他模型的平均模型的欧式距离

实验结果

1、使用隐形模型中毒的攻击方在精确度检测中更难被检测到

2、隐形模型中毒的攻击方的权重更新分布与正常训练方的权重更新分布较为接近

恶意攻击模型的l2距离与其他良性模型的距离较为接近

交替最小化攻击

流程:

        1、从当前的模型参数,最小化攻击目标,训练得到一个梯度更新。

        2、利用simple boosting的思想对梯度进行增强,与当前的模型参数相加得到中间步骤的模型参数。

        3、从所得到的中间步骤的模型参数开始,最小化之前提到的两个隐形目标,最终得到一个新的模型

效果:

        1、可以绕过准确性检查方法,因为恶意模型验证数据的准确性接近全局模型。

        2、这种攻击的传播距离与良性更新的传播距离非常接近,甚至完全重叠,从而实现了两种属性的完全隐形

对拜占庭聚合机制的攻击效果:

        Krum以及Coordinate-wise median:攻击机制对两种聚合方式都有效

使用目标后门的模型投毒使得Krum不收敛

在恶意客户端学习的本地模型也具有高验证精度的交替最小化是无效的

        通过估计提高攻击性能

        攻击者对其余良性客户端的更新\delta_{[k]\backslash m}^t = \sum_{i \in[k] \backslash m} \alpha_i \delta_i^t进行估计

        估计方法为:攻击者假定自从上一次被选中后所有良性更新都相同,即\hat \delta_{[k] \backslash m}^t = \frac{\textbf{w}_G^t - \textbf{w}_G^{t'} -\delta_m^{t'}}{t-t'},当 连续被选中时,则\hat \delta_{[k] \backslash m}^t = \hat \delta_{[k] \backslash m}^{t-1}​。

                1、优化后修正:计算出权重更新后减去一个\lambda \hat \delta_{[k]\backslash m}^t,若估计值等于实际值\hat\delta_{[k]\backslash m}^t = \delta_{[k]\backslash m}^t\lambda = \frac{1}{\alpha_m}​,则这就能抵消其余更新的贡献

                2、优化前修正:攻击者从\textbf{w}_G^{t-1} + \hat \delta_{[k] \backslash m} ^t开始计算出更新的权重,而不是从\textbf{w}_G^{t-1}​。

        使用效果:使用具有优化后修正的攻击在实现对抗性目标方面更有效。使用优化后校正是无效的,导致攻击成功率较低,并影响全局模型收敛。

        数据投毒不进行缩放攻击效果有限,进行缩放时影响全局任务的精度,整体而言数据投毒效果比模型投毒差

        在一些对模型的解释技术中观测中分不清良性模型以及具有后门的恶意后门的模型的区别。

        在多攻击者的实验中会对模型的全局准确率造成影响,但是能够保证模型收敛。

        当训练的客户端较多时,并不能保证每次都被选中,但整体上攻击有效,性能稍差。


http://www.ppmy.cn/news/754167.html

相关文章

Nginx学习笔记01

一、Nginx从入门到精通_教程简介 1、重量级的课程nginx,说到nginx,是因为这套课程内容涉及非常广泛,不像其它的课程呢?将一些皮毛的功能,在课程当中,会由浅入深,从点到面,循序渐进地…

Android+Web视频直播装逼实现

一、前言 因为最近视频直播比较火,自己也想去了解,所以看了一些资料分享一下,说错了的请大家包容和指正。 二、实现原理 看图说话: 通过上图可以看到,所谓的视频直播其实就是通过录相设备将采集到视频数据以流的方式推…

手机模式

1. 普通启动模式 就是普通电源键开关机,有点废话了,呵呵。。 2. 安全模式(很多人不知道) 大家可能对安全模式不太了解,其实就和电脑上一个道理,安全模式中系统只加载系统基本服务,不会加载任何第三方服 务&#xff…

Oracle 单字段去重查询多个列的方法详解

系列文章目录 文章目录 系列文章目录前言一、使用 SELECT DISTINCT 查询:二、使用 GROUP BY 查询:总结 前言 在 Oracle 数据库中,有时候我们需要查询多个列并去除重复值。本文将介绍 Oracle 中如何使用单字段去重查询多个列的方法&#xff0…

NVS4200M显卡“超频”

默认情况下戴尔E6420配置的独立显卡NVS4200M被降频了,经实践可以通过软件将其还原至芯片的额定频率,可大幅提高显示性能。操作步骤:1.使用GPU-Z软件查看一下,我的显示“默认频率”为740和800;(本步可略&…

620集成显卡和mx250,轻薄本的新独显!MX250现身英伟达官网,核显3.5倍性能

正值英伟达旗下显卡产品线换代之际,在桌面端显卡进入光线追踪时代,笔记本高端显卡也跟随之后,定位较低的新显卡MX250、MX230也出现在英伟达官网,并展示了主要的参数。 这两款新显卡定位于取代用于轻薄笔记本和中低端产品的MX150、…

Non-linear Optimization

Non-linear Optimization Least square method1. Generalized pseudo-inverse2. Singular value decomposition (SVD) Reference: Least square method 1. Generalized pseudo-inverse Simply Define : A x b , A ∈ R m n Axb, A \in \mathbb{R}^{m\times n} Axb,A∈Rmn …

高斯混合模型GMM

1. 高斯混合模型概念 高斯混合模型(Gaussian Mixture Model)是一种聚类算法,它是多个高斯分布函数的线性组合,通常用于解决同一集合下的数据包含多种不同的分布情况。 2.高斯混合模型的一个例子 在校园里随机抽取2000个学生&#…