算法 1 分布相关攻击 DRA:给定网络 f_θ 由 θ 参数化,正则化常数 λ,轮数 T,总批次数 M,学习率 η,分类损失 L,DCG 损失 L_DCG。对抗性扰动 δ,原始图像 x,l_∞ 扰动半径 ε;步长 α;迭代次数 N。
► 微调:
for i = 1, 2…, T do
for j = 1, 2…, M do
更新模型参数:
θ = θ - η · (∇_θL(f_θ(x_j), y_j) + λ · ∇_θL_DCG)
end for
end for
返回 微调后的网络 f_θ
► 无目标攻击:
初始化 δ = Uniform(-ε, ε)。
for i = 1, 2, …, N do
δ = δ + α · sign(∇_xL(f_θ(x + δ), y_label),
δ = max(min(δ, ε), -ε)
end for
返回 δ
► 目标攻击:
初始化 δ = Uniform(-ε, ε)。
for i = 1, 2, …, N do
δ = δ - α · sign(∇_xL(f_θ(x + δ), y_target),
δ = max(min(δ, ε), -ε)
end for
返回 δ