[论文阅读]PrototypeAugmentationandSelfSupervisionforIncrementalLearning

作者：渴死的鱼2502872325 | 来源：互联网 | 2023-10-12 18:10

论文地址：https:openaccess.thecvf.comcontentCVPR2021htmlZhu_Prototype_Augmentation_and_S

论文地址&＃xff1a;https://openaccess.thecvf.com/content/CVPR2021/html/Zhu_Prototype_Augmentation_and_Self-Supervision_for_Incremental_Learning_CVPR_2021_paper.html
代码&＃xff1a;https://github.com/Impression2805/CVPR21_PASS
发表于&＃xff1a;CVPR 21

Abstract

尽管深层神经网络在许多单个任务中的表现令人印象深刻&＃xff0c;但在增量学习新任务时&＃xff0c;深层神经网络会遭受灾难性的遗忘。最近&＃xff0c;人们提出了各种增量学习方法&＃xff0c;一些方法依靠存储数据或复杂的生成模型取得了可接受的性能。然而&＃xff0c;存储以前任务的数据受到内存或隐私问题的限制&＃xff0c;而生成模型在训练中通常是不稳定和低效的。在本文中&＃xff0c;我们提出了一个简单的基于非示范的方法&＃xff0c;名为PASS&＃xff0c;以解决增量学习中的灾难性遗忘问题。一方面&＃xff0c;我们提出为每个旧类记忆一个代表类的原型&＃xff0c;并在深度特征空间中采用原型增强(protoAug)来保持以前任务的决策边界。另一方面&＃xff0c;我们采用自监督学习(SSL)来为其他任务学习更多的通用和可转移的特征&＃xff0c;这表明SSL在增量学习中的有效性。在基准数据集上的实验结果表明&＃xff0c;我们的方法明显优于基于非示范的方法&＃xff0c;并且与基于示范的方法相比取得了相当的性能。

I. Motivation

在这里插入图片描述
本文的方法包含两个部分&＃xff1a;Prototype Augmentation与Self-Supervision。对于PA&＃xff0c;其解决的是决策边界在训练新任务后发生漂移&＃xff0c;从而导致灾难性遗忘的问题&＃xff0c;属于比较经典的motivation&＃xff0c;没有什么好说的&＃xff1b;而这里的自监督SS就比较有意思了&＃xff0c;文中指出对于旧任务最优的参数可能对于新任务而言是一种糟糕的参数初始化&＃xff0c;因此使用自监督学习来学习更具有可转移性的特征&＃xff0c;这样既能使新任务的特征更容易被学习&＃xff0c;同时也能尽可能去保证旧任务的特征不被破坏。

II. Method

在这里插入图片描述
图中的左右两部分分别展示了SS与PA的步骤。对于自监督&＃xff0c;具体做法是对输入新类样本进行旋转&＃xff0c;从而制造"伪"新类&＃xff0c;通过让分类头尝试去区分新类与伪新类从而达到更自然特征过渡的目的&＃xff1b;对于原型扩充&＃xff0c;其实就是给原型向量添加高斯噪声。

III. Prototype Augmentation

本文没有显式的去存储旧类的原始图像&＃xff0c;所以可以认为是一种无示范的方法。不过&＃xff0c;对于现在大多数的无示范方法&＃xff0c;虽然没有去存储旧类样本本身&＃xff0c;取而代之的值存储旧类的原型向量(即该类所有样本的特征平均)。而对该原型向量的扩充方式也很简单&＃xff0c;就是加个高斯噪声&＃xff1a; $Ftold,kold&＃61;μtold,kold&＃43;e∗rF_{t_{o l d}, k_{o l d}}&＃61;\mu_{t_{o l d}, k_{o l d}}&＃43;e * r$

IV. SSL based Label Augmentation

本文的自监督思想主要来源于此文[1]。具体做法是&＃xff0c;对于 $K$ 个新类的所有任务样本&＃xff0c;对其进行数据扩充&＃xff0c;也就是旋转90,180,270度&＃xff1a; $Xt′&＃61;rotate⁡(Xt,θ),θ∈{90,180,270}\mathbf{X}_{t}^{\prime}&＃61;\operatorname{rotate}\left(\mathbf{X}_{t}, \theta\right), \theta \in\{90,180,270\}$ 。按照我们以往的认知&＃xff0c;将一个样本旋转后&＃xff0c;其类别是保持不变的。但是这里将经过三种不同旋转方式处理后的样本视为了三种"新类"&＃xff0c;并赋予相应的新类标签 $Yt′\mathbf{Y}_{t}^{\prime}$ (而非 $Yt\mathbf{Y}_{t}$ )。文中指出这一做法可以放松学习过程中的不变约束&＃xff0c;从而提升任务的性能。这种解释相当于也是加入自监督提升性能的"套路"。

推荐阅读

less
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
filter
阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾

本文介绍了阿里Treebased Deep Match(TDM)的学习笔记，同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法，再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用，并介绍了TDM的背景和优势。最后，文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]

蜡笔小新 2023-12-14 19:24:58
io
推荐系统遇上深度学习(十七）详解推荐系统中的常用评测指标

原创：石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人，希望在平日的工作学习中，挖掘数据的价值， ... [详细]

蜡笔小新 2023-12-13 19:35:25
io
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
io
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
io
EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析

本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程，并分析了其所需的资源容量。通过解决错误提示和调整内存大小，成功存储了波形数据。然后，讨论了储存环逐束团信号的意义，以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大，每天需要近250G，一年需要90T。然而，储存环逐束团信号具有重要意义，可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]

蜡笔小新 2023-12-14 17:43:56
main
实现下拉列表，点击其他位置自动隐藏效果的三种方式比较

目录实现效果：实现环境实现方法一：基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]

蜡笔小新 2023-12-14 15:03:14
io
baresip android编译、运行教程1语音通话

本文介绍了如何在安卓平台上编译和运行baresip android，包括下载相关的sdk和ndk，修改ndk路径和输出目录，以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]

蜡笔小新 2023-12-14 10:53:48
io
使用在线工具jsonschema2pojo根据json生成java对象

本文介绍了使用在线工具jsonschema2pojo根据json生成java对象的方法。通过该工具，用户只需将json字符串复制到输入框中，即可自动将其转换成java对象。该工具还能解析列表式的json数据，并将嵌套在内层的对象也解析出来。本文以请求github的api为例，展示了使用该工具的步骤和效果。 ... [详细]

蜡笔小新 2023-12-13 21:23:45
io
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
config
iOS超签签名服务器搭建及其优劣势

本文介绍了搭建iOS超签签名服务器的原因和优势，包括不掉签、用户可以直接安装不需要信任、体验好等。同时也提到了超签的劣势，即一个证书只能安装100个，成本较高。文章还详细介绍了超签的实现原理，包括用户请求服务器安装mobileconfig文件、服务器调用苹果接口添加udid等步骤。最后，还提到了生成mobileconfig文件和导出AppleWorldwideDeveloperRelationsCertificationAuthority证书的方法。 ... [详细]

蜡笔小新 2023-12-11 20:23:23
io
【Vue】表单 input 绑定

网址：https:vue.docschina.orgv2guideforms.html表单input绑定基础用法可以通过使用v-model指令，在 ... [详细]

蜡笔小新 2023-12-11 18:07:28
io
统一知识图谱学习和建议：更好地理解用户偏好

本文介绍了一种将知识图谱纳入推荐系统的方法，以提高推荐的准确性和可解释性。与现有方法不同的是，本方法考虑了知识图谱的不完整性，并在知识图谱中传输关系信息，以更好地理解用户的偏好。通过大量实验，验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]

蜡笔小新 2023-12-11 11:11:02
io
顾客信息表mysql_客户基本信息数据库表

{moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]

蜡笔小新 2023-10-17 23:09:27
io
AstridDAO 专访：波卡稳定币黑马 BAI

加入Pol ... [详细]

蜡笔小新 2023-10-17 18:14:14

渴死的鱼2502872325

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章