当前位置: 开发笔记 > 编程语言 > 正文

【论文泛读182】一种可区分的语言模型对文本分类器的攻击

作者：秋天的紫丁香 | 来源：互联网 | 2023-10-12 02:39

贴一下汇总贴：论文阅读记录论文链接：《ADifferentiableLanguageModelAdversarialAttackonTextClass

贴一下汇总贴&＃xff1a;论文阅读记录

论文链接&＃xff1a;《A Differentiable Language Model Adversarial Attack on Text Classifiers》

一、摘要

用于自然语言处理的大型基于 Transformer 的模型的稳健性是一个重要问题&＃xff0c;因为它们的功能和广泛采用。理解和提高这些模型鲁棒性的一种方法是探索对抗性攻击场景&＃xff1a;检查输入的小扰动是否可以欺骗模型。

由于文本数据的离散性&＃xff0c;广泛用于计算机视觉的基于梯度的对抗方法本身并不适用。克服这个问题的标准策略是开发令牌级别的转换&＃xff0c;它不考虑整个句子。

在本文中&＃xff0c;我们提出了一种新的黑盒句子级攻击。我们的方法对预训练的语言模型进行微调以生成对抗性示例。建议的可微损失函数取决于替代分类器分数和通过深度学习模型计算的近似编辑距离。

我们表明&＃xff0c;在计算指标和人工评估方面&＃xff0c;所提出的攻击在各种 NLP 问题上都优于竞争对手。此外&＃xff0c;由于使用了微调的语言模型&＃xff0c;生成的对抗样本很难被检测到&＃xff0c;因此当前的模型并不健壮。因此&＃xff0c;很难防御提议的攻击&＃xff0c;而其他攻击则不然。

二、结论

由于输入数据的离散性和损失函数的不可微性&＃xff0c;为自然语言处理构建对抗性攻击是一个具有挑战性的问题。我们的想法是将从一个掩蔽语言模型(MLM)中取样与调整其参数相结合&＃xff0c;以产生真正的对抗性例子。为了调整MLM的参数&＃xff0c;我们使用了基于两个可微替代的损失函数——序列之间的距离和被攻击的分类器。这导致了建议的DILMA方法。如果我们只从MLM取样&＃xff0c;我们会得到一个简单的基线取样傻瓜。

为了评估分类序列上对抗攻击的效率&＃xff0c;我们提出了一种结合WER和目标分类器精度的度量。对于不同的自然语言处理数据集&＃xff0c;我们的方法表现出良好的性能。此外&＃xff0c;与竞争方法相反&＃xff0c;我们的方法战胜了用于防御敌对攻击的常用策略。人类和语言评估也显示了提议的攻击的充分性。

三、model

DILMA架构的培训包括以下步骤。步骤1:从输入x的预训练语言模型(LM)生成器中获取逻辑P。步骤2:使用Gumbel-Softmax估计器从多项式分布P中采样x0。为了提高发电质量&＃xff0c;我们可以多次采样。第三步:得到替代概率C(x0)和近似编辑距离DL(x0&＃xff0c;x)。第四步:计算损失&＃xff0c;做一个倒传。步骤5:使用计算的梯度更新LM的参数。

在这里插入图片描述

损失函数&＃xff08;loss function&＃xff09;&＃xff1a;
在这里插入图片描述
DILMA算法&＃xff1a;

推荐阅读

io
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
io
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
io
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
io
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
io
GPT-3发布，动动手指就能自动生成代码的神器来了！

近日，OpenAI发布了最新的NLP模型GPT-3，该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB，参数个数高达1750亿，训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站，用户只需用英语描述需求，前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年，OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型，在限定条件下以2:0完胜人类冠军。 ... [详细]

蜡笔小新 2023-12-11 11:04:43
web
Python实验报告文档中的文件和数据格式化操作

本文介绍了Python语言程序设计中文件和数据格式化的操作，包括使用np.savetext保存文本文件，对文本文件和二进制文件进行统一的操作步骤，以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]

蜡笔小新 2023-12-10 17:02:16
io
深度学习黑话

OCR：用字符识别方法将形状翻译成计算机文字的过程Matlab：商业数学软件；CUDA：CUDA™是一种由NVIDIA推 ... [详细]

蜡笔小新 2023-10-17 17:55:01
io
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
io
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
config
CodeBERT理解

1.动机大型的预训练模型，比如ELMo、GPT、Bert等提高了NLP任务的最新技术。这些预训练模型在NLP的成功驱动了多模态预训练模型，比如ViBE ... [详细]

蜡笔小新 2023-10-15 13:33:18
io
【BERT】BERT的嵌入层是如何实现的？看完你就明白了

作者：__编译：ronghuaiyang导读非常简单直白的语言解释了BERT中的嵌入层的组成以及实现的方式。介绍在本文中，我将解释BERT ... [详细]

蜡笔小新 2023-10-15 11:40:54
io
深度学习下，中文分词是否还有必要？——ACL 2019论文阅读笔记

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要4分钟跟随小博主，每天进步一丢丢来自：NLP太难了公众号 ... [详细]

蜡笔小新 2023-10-14 20:17:51
web
基于神经网络的智能对话系统（二）——机器学习背景知识

2.机器学习背景知识本章简要回顾了深度学习和强化学习，这些学习与后续章节中的会话AI最相关。2.1机器学习基础Mitchell（1997）将机器学习广义地定义为包括任何计算机程序， ... [详细]

蜡笔小新 2023-10-14 15:37:52
python
拯救万千学子于水深火热之中！Facebook开源无梯度优化工具

乾明发自凹非寺量子位出品|公众号QbitAI机器学习啥最苦？十有八九找参数！不少研究生，都被卡在这个环节上，久久不能毕业。现 ... [详细]

蜡笔小新 2023-10-13 15:46:29
io
python开源人工智能项目_6个最受欢迎的人工智能学习项目！开源！

本文将给大家介绍五个十分可怕但还鲜为人知的人工智能机器学习项目，囊括了一些潜在的机器学习以及人工智能的新想法。它们基本都是Python项目。1.LiveLossPlo ... [详细]

蜡笔小新 2023-10-13 13:48:49

秋天的紫丁香

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章