一文详解对抗训练方法EBET易博官方网站

新闻资讯 | 2023-09-17 09:07

　　主要是用于样本生成或者对抗攻击领域，主要方法是通过添加鉴别器或者根据梯度回传生成新样本，其主要是为了提升当前主干模型生成样本的能力或者鲁棒性

　　==对抗训练是一种引入噪声的训练方式，可以对参数进行正则化，提升模型鲁棒性和泛化能力==

　　就是在原始输入样本上加上一个扰动得到对抗样本，再用其进行训练，这个问题可以抽象成这样一个模型：

　　其中，是ground truth,是模型参数。意思就是即使在扰动的情况下求使得预测出的概率最大的参数，扰动可以被定义为：

　　其中代表输入样本的分布，代表输入，代表标签，是模型参数，是单个样本的loss，是扰动，是扰动空间。这个式子可以分布理解如下：

　　这就解决了两个问题：如何构建足够强的对抗样本、和如何使得分布仍然尽可能接近原始分布

　　对于CV领域，图像被认为是连续的，因此可以直接在原始图像上添加扰动；而对于NLP，它的输入是文本的本质是one-hot，而one-hot之间的欧式距离恒为，理论上不存在微小的扰动，而且，在Embedding向量上加上微小扰动可能就找不到与之对应的词了，不是真正意义上的对抗样本，因为对抗样本依旧能对应一个合理的原始输入，既然不能对Embedding向量添加扰动，可以对Embedding层添加扰动，使其产生更鲁棒的Embedding向量

　　FGM直接通过epsilon参数算出了对抗扰动，这样得到的可能不是最优的。因此PGD进行了改进，通过迭代慢慢找到最优的扰动

　　从FGSM到PGD，主要是优化对抗扰动的计算，虽然取得了更好的效果，但计算量也一步步增加。对于每个样本，FGSM和FGM都只用计算两次，一次是计算的前后向，一次是计算的前后向。而PGD则计算了K+1次，消耗了更多的计算资源。因此FreeAT被提了出来，在PGD的基础上进行训练速度的优化

　　FreeAT的思想是在对每个样本连续重复次训练，计算时复用上一步的梯度，为了保证速度，整体epoch会除以。的更新公式为：

　　FreeAT的问题在于每次的对于当前的参数都是次优的(无法最大化loss)，因为当前是由和计算出来的，是对于的最优

　　YOPO的出发点是利用神经网络的结构来降低梯度计算的计算量。从极大值原理PMP(Pontryagin’s maximum principle)出发，对抗扰动只和网络的第0层有关，即在embedding层上添加扰动。再加之层之间是解耦合的，那就不需要每次都计算完整的前后向传播

　　基于这个想法，复用后面几层的梯度，减少非必要的完整传播。可以将PGD的次攻击拆成次：

　　YOPO的假设对于ReLU-based网络来说是不成立的，因为YOPO要求损失是两次可微的，于是，FreeLB在FreeAT的基础上将每次inner-max中更新模型参数这一操作换掉，利用步之后累积的参数梯度进行更新，于是总体任务的目标函数就记为：

　　依据下面算法中的数学符号，PGD需要进行次梯度计算，FreeAT需要进行次，FreeLB需要次。虽然FreeLB在效率上并没有特别大的优势，但是其效果十分不错

　　另外，论文中指出对抗训练和dropout不能同时使用，加上dropout相当于改变了网络的结果，影响扰动的计算。如果一定要加入dropout操作，需要在K步中都使用同一个mask

　　SMART的主要想法是强制模型在neighboring data points上作出相似的预测，加入正则项后的目标函数如下所示：

　　是具体任务的损失函数，是generated neighbors of training points，在分类任务中使用对称的KL散度，即；在回归任务中使用平方损失，此时可以看到对抗发生在正则化项上，对抗的目标是最大扰动前后的输出

　　一、猫咪有声小说配音兼职的流程猫咪有声小说配音兼职是一项有趣又具有挑战性的工作。如果你对猫咪和演艺行业都有浓厚兴...

　　青岛的夜晚便如同一个风情万种的女子，用她的美丽和神秘，引诱着人们一步步走进她的怀抱。在这美丽的旅程中，你不仅可以...

　　在淘宝上有一些用户开通EBET易博真人了88vip会员，因为开通这个会员是非常划算的，它的权益比较多，比如有饿了么的会员，网易云的...

　　《重生之枭雄崛起化身商业大亨》陈耀东全文免费阅读最全章节主角：陈耀东简介：重活一世，他决心不再鲁莽行事。凭借上...

　　一、晚上副业赚钱的路子有哪些晚上是很多人寻找副业赚钱的时间段。在晚上进行副业可以充分利用闲暇时间，增加收入来源。...

　　莆田鞋公认的十大良心微商推荐，每一个都是言而有信的有名微商在浩瀚的星空下，莆田，一个因鞋业而起家的城市，与微商结下...

　　在现代社会中，APP已经成为人们移动生活的重要组成部分。但是，光有好的APP并不足以让你取得成功。正确的推广方法让...

　　网购你是直接下单吗？还是说用别人的口令和链接下单？千万不要这么做了，网购是可以领取隐藏优惠券和高额返佣的，如果你直...

　　天猫接单赚佣金的平台有很多，以下是一些比较靠谱的推荐： 1.领购物大额优惠券、赚返利佣金用氧惠~ 氧惠APP（带货...

　　在当今的电商市场中，优惠券app已经成为了很多人的必备工具。这些app可以帮助用户找到各种类型的优惠券，让用户在购...

　　Procedural Noise Adversarial Examples for Black...

　　Procedural Noise Adversarial Examples for Black-Box Attac...

　　[论文解读]Parametric Noise Injection: Trainable Ran...

　　论文题目：Parametric Noise Injection: Trainable Randomness to ...

　　原创：郑佳伟在NLP任务中，会有很多为了提升模型效果而提出的优化，为了方便记忆，所以就把这些方法都整理出来，也有...

　　Obfuscated Gradients Give a False Sense of Secu...

　　1. 介绍作为基于迭代优化攻击的基准测试已经成为评估防御的标准实践，新的防御出现了，似乎对这些强大的基于优化的攻...