当前位置: 开发笔记 > 编程语言 > 正文

《论文阅读：对抗训练（adversarialtraining）》

作者：dmcm0010 | 来源：互联网 | 2023-10-10 18:47

论文阅读：对抗训练（adversarialtraining）陈见耸自然语言处理、人工智能、机器学习引言对抗训练（adversarialtraining）是增强神经网络鲁棒性的重

论文阅读：对抗训练（adversarial training）
陈见耸

自然语言处理、人工智能、机器学习

引言

对抗训练（adversarial training）是增强神经网络鲁棒性的重要方式。在对抗训练的过程中，样本会被混合一些微小的扰动（改变很小，但是很可能造成误分类），然后使神经网络适应这种改变，从而对对抗样本具有鲁棒性。
在图像领域，采用对抗训练通常能提高鲁棒性，但是通常都会造成泛化性降低，也就是说，虽然对对抗样本的抵抗力提升了，但是有可能影响普通样本的分类能力。神奇的是，在语言模型领域却观察到不一致的结果——对抗训练既提高了鲁棒性也提高了泛化性。所以对抗训练还值得研究一下，毕竟对效果也是有提升的。
我们首先来看一下对抗训练的一般性原理，对抗训练可以概括为如下的最大最小化公式：

内层（中括号内）是一个最大化，其中 $X$ 表示样本的输入表示， $\delta$ 表示叠加在输入上的扰动， $f_{\theta}()$ 是神经网络函数， $y$ 是样本的标签， $L(f_{\theta}(X+\delta),y)$ 则表示在样本 $X$ 上叠加一个扰动 $\delta$ ，再经过神经网络函数，与标签 $y$ 比较得到的损失。 $max （L）$ 是优化目标，即寻找使损失函数最大的扰动，简单来讲就是添加的扰动要尽量让神经网络迷惑。
外层就是对神经网络进行优化的最小化公式，即当扰动固定的情况下，我们训练神经网络模型使得在训练数据上的损失最小，也就是说，使模型具有一定的鲁棒性能够适应这种扰动。
这个公式是一个一般性的公式，并没有讲如何设计扰动。理想情况下，最好是能直接求出 $\delta$ ，但在神经网络模型中这是不太可行的。所以大家就提出各种各样的扰动的近似求解的方法。事实上，对抗训练的研究基本上就是在寻找合适的扰动，使得模型具有更强的鲁棒性。
2. FGSM/FGM方法
FGSM和FGM方法是Goodfellow等人分别在[1]和[2]中提出的。思想很简单，就是让扰动 $\delta$ 的方向是沿着梯度提升的方向的，沿着梯度提升也就意味着让损失增大的最大。FGSM（Fast Gradient Sign Method）和FGM（Fast Gradient Method）的区别在于采用的归一化的方法不同，FGSM是通过Sign函数对梯度采取max归一化，FGM则采用的是 $L_{2}$ 归一化。max归一化是是说如果梯度某个维度上的值为正，则设为1；如果为负，则设为-1；如果为0，则设为0。 $L_{2}$ 归一化则将梯度的每个维度的值除以梯度的 $L_{2}$ 范数。理论上 $L_{2}$ 归一化更严格的保留了梯度的方向，但是max归一化则不一定和原始梯度的方向相同。
FGSM： $\delta=\epsilon\cdot Sign(g)$
FGM: $\delta=\epsilon\cdot (g/||g||_{2})$
其中， $g=\bigtriangledown_{X}(L(f_{\theta}(X),y))$ ，也就是损失函数L关于输入X的梯度，这个梯度在我们做神经网络优化的时候是很容易求出来的。
当然两种方法都有个假设，就是损失函数是线性的或者至少是局部线性的。如果不是（局部）线性的，那梯度提升的方向就不一定是最优方向了。
3. PGD方法
为了解决FGSM和FGM中的线性假设问题，论文[3]提出了使用PGD(Projected Gradient descent)方法来求解内部的最大值问题。 PGD是一种迭代攻击，相比于普通的FGSM和FGM 仅做一次迭代，PGD是做多次迭代，每次走一小步，每次迭代都会将扰动投射到规定范围内。
$g_{t}=\bigtriangledown_{X_{t}}(L(f_{\theta}(X_{t}),y))$ ，
$g_{t}$ 表示t时刻的损失关于t时刻输入的梯度。
$X_{t+1}=\Pi_{X+S}(X_{t}+\epsilon ( g_{t}/||g_{t}||))$ ，
t+1时刻输入根据t时刻的输入及t时刻的梯度求出。注意这里 $\Pi_{X+S}$ 的意思是，如果扰动超过一定的范围，就要映射回规定的范围S内。
由于每次只走很小的一步，所以局部线性假设基本成立的。经过多步之后就可以达到最优解了，也就是达到最强的攻击效果。论文还证明用PGD算法得到的攻击样本，是一阶对抗样本中最强的了。这里所说的一阶对抗样本是指依据一阶梯度的对抗样本。如果模型对PGD产生的样本鲁棒，那基本上就对所有的一阶对抗样本都鲁棒。实验也证明，利用PGD算法进行对抗训练的模型确实具有很好的鲁棒性。
PGD虽然简单，也很有效，但是存在一个问题是计算效率不高。不采用提对抗训练的方法m次迭代只会有m次梯度的计算，但是对于PGD而言，每做一次梯度下降（获取模型参数的梯度，训练模型），都要对应有K步的梯度提升（获取输出的梯度，寻找扰动）。所以相比不采用对抗训练的方法，PGD需要做m(K+1)次梯度计算。
4. FreeAT（Free Adversarial Training）
在PGD的计算过程中，每次做前向后向计算时，不管是参数的梯度还是输出的梯度，都会计算出来，只不过在梯度下降的过程中只利用参数的梯度，在梯度提升的过程中只利用输入的梯度，这实际上有很大的浪费。我们能不能在一次前向后向计算过程中，把计算出来的参数的梯度和输入的梯度同时利用上？这就是FreeAT[4]这篇文章的核心思想。
如何做呢？这里存在一个小小的麻烦，就是普通训练的方式和PGD对抗训练的方式稍微有些不同。普通训练时相邻的batch是不同的batch，而PGD对抗训练在梯度提升的计算样本时，需要对同一个mini-batch的样本，反复求梯度。 FreeAT仍然采用了PGD这种训练方式，即对于每个min-batch的样本会求K次梯度，每次求得得梯度，我们既用来更新扰动，也用来更新参数。原始的PGD训练方法，每次内层计算只用梯度来更新扰动，等K步走完之后，才重新再计算一次梯度，更新参数。这个不同可以用下图形象的表示。

需要注意的是，如果内层做K次迭代的化，对于外层计算，FreeAT会把总体的迭代epoch除以K，这样保证总体的梯度计算的次数跟普通训练一样。从外层训练的视角来看，每个min-batch被训练的次数和普通训练是相同的，只不过其被训练的顺序有些变化，K个相同的min-batch会被顺序的训练。这样带来的问题是连续相同的mini-batch对参数更新，不如随机mini-batch带来的扰动大，这有可能影响到最终模型收敛的效果。但是论文用实验证明，这种担心不太必要。详细的算法代码如下

5. YOPO（You can Only Propagate Once）
YOPO[5]的出发点是利用神经网络的结构来降低梯度计算的计算量。从PMP(Pontryagin's maximum principle)的角度看，对抗扰动只和神经网络的第一层有关。所以，论文提出固定住前面的基层，只对第一层求梯度，并据此来更新扰动。
基于这个想法，作者想复用后几层的梯度，假设p为定值：

则对扰动的更新就可以变为：

详细的算法代码如下：

虽然YOPO-m-n只完成了m次完整的正反向传播，但是却实现了mn次扰动的更新。而PGD-r算法完成r次完整的正反向传播却只能实现r次扰动的更新。这样看来，YOPO-m-n算法的效率明显更高，而实验也表明，只要使得mn略大于r，YOPO-m-n的效果就能够与PGD-r相媲美。
6. FreeLB（Free Large Batch Adversarial Training）

和FreeAT一样，FreeLB也想更高效的利用两种梯度。但是和FreeAT不一样的是，FreeLB并不是在每次梯度提升的过程中，都会对参数进行跟新，而是将参数的梯度累积起来，即算法第8行 $g_{t}$ 更新的过程。这样走过K步之后，FreeLB利用K步之后积累的参数梯度 $g_{K}$ ，对参数 $\theta$ 进行更新，即算法第13行， $\theta$ 的更新过程。 FreeLB需要进行 $N_{ep}\cdot K$ 次梯度计算，相比于PGD需要进行 $N_{ep}\cdot (K+1)$ 次梯度计算，是节省了 $N_{ep}$ 次梯度计算，但是相比于FreeAT只需要 $N_{ep}$ 次梯度计算而言，FreeLB效率的提升并不明显。所以FreeLB的优势并不在效率，而是在效果。由于FreeLB利用了多步K积累的梯度再做更新，对梯度的估计更加精准，而且不存在FreeAT那样连续利用多个相同的min-batch进行梯度更新的问题。
相比于YOPO-m-n，FreeLB也是将K步（这里指m）中的梯度综合后再更新参数，不同的是其没有更进一步的n层，即使有，也是n个完全相同的值。
为什么论文成这种算法为Large Batch呢？在梯度下降时，我们使用的梯度是基于 $X+\delta_{0}$ ,..., $X+\delta_{K-1}$ 进行计算的，这可以理解为近似的对K个不同batch的样本进行平均，所以相当于虚拟的增大了样本的数量。
论文中还指出了很重要的一点，就是对抗训练和dropout不能同时使用，加上dropout相当于改变了网络结构，会影响r的计算。如果要用的话需要在K步中都使用同一个mask。
7. 参考文献
[1] EXPLAINING AND HARNESSING ADVERSARIAL EXAMPLES
[2] ADVERSARIAL TRAINING METHODS FOR SEMI-SUPERVISED TEXT CLASSIFICATION
[3] Towards Deep Learning Models Resistant to Adversarial Attacks
[4] Adversarial Training for Free!
[5] You Only Propagate Once: Accelerating Adversarial Training via Maximal Principle
[6] FREELB: ENHANCED ADVERSARIAL TRAINING FOR NATURAL LANGUAGE UNDERSTANDING

编辑于 2020-02-01

推荐阅读

get
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
text
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
text
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
text
深度学习与神经网络——邱锡鹏

深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络：一种以（人工)）神经元为基本单元的模型深度学习：一类机器学习问题，主要解决贡献度分配问题知识结构：路线图：顶 ... [详细]

蜡笔小新 2023-10-16 05:57:42
text
顶尖AI技术人才稀缺，在校生还能追上这波浪潮吗？

作为机器学习最重要的一个分支，近年来深度学习(DeepLearning)发展势头迅猛，借助庞大的数据 ... [详细]

蜡笔小新 2023-10-12 16:30:34
text
2017亚马逊人工智能奖公布：他们的AI有什么不同？

事实上，在我们周围，“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊，我们的世界正在变成一个机器 ... [详细]

蜡笔小新 2023-10-16 19:50:15
text
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
text
聊聊中国人工智能科技产业区域竞争力分析及趋势

原文链接：聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数（2021ÿ ... [详细]

蜡笔小新 2023-10-13 11:56:40
text
【跨越鸿沟】学术界与工业界的GAP有多大？

来自：美团技术团队2020年7月31日，由中国图象图形学学会主办、视觉大数据专委会承办，北京智源人工智能研究院和美团协办的ECCV2020 ... [详细]

蜡笔小新 2023-10-12 16:28:53
random
深度学习_机器学习 vs 深度学习到底有啥区别，为什么更多人选择机器学习

本文由编程笔记#小编为大家整理，主要介绍了机器学习vs深度学习到底有啥区别，为什么更多人选择机器学习相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-12 14:41:47
random
图灵测试是什么？为什么AlphaGo那么牛却过不了？

导读：本文将介绍人工智能的检测手段——图灵测试。作者：杜振东涂铭来源：大数据DT（ID：hzdashuju&# ... [详细]

蜡笔小新 2023-10-12 14:40:31
text
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
php
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
php
TensorFlow入门上

前置准备在阅读本文之前，请确定你已经了解了神经网络的基本结构以及前向传播、后向传播的基本原理，如果尚未了解，可以查看下文。神经网络初探chrer.com也可以直接在我博客阅读Te ... [详细]

蜡笔小新 2023-10-16 10:25:39
php
【历史上的今天】1 月 8 日：谷歌推出 Google Pay；Quibi 的重生；平衡二叉树的发明者出生

整理|王启隆透过「历史上的今天」，从过去看未来，从现在亦可以改变未来。今天是2022年1月8日，在1942年的今天，英国理论物理学家霍金（StephenHawking）出生；霍金在 ... [详细]

蜡笔小新 2023-10-13 13:58:29

dmcm0010

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章