当前位置: 开发笔记 > 编程语言 > 正文

跨批次记忆在度量学习DML中的应用

作者：学习小菜鸟 | 来源：互联网 | 2023-10-13 15:57

度量学习DML之ContrastiveLoss及其变种_程大海的博客-CSDN博客度量学习DML之TripletLoss_程大海的博客-CSDN博客度量学习DML之Lifted

度量学习DML之Contrastive Loss及其变种_程大海的博客-CSDN博客

度量学习DML之Triplet Loss_程大海的博客-CSDN博客

度量学习DML之Lifted Structure Loss_程大海的博客-CSDN博客

度量学习DML之Circle Loss_程大海的博客-CSDN博客

度量学习DML之Cross-Batch Memory_程大海的博客-CSDN博客

度量学习DML之MoCO_程大海的博客-CSDN博客

数据增强之SpecAugment_程大海的博客-CSDN博客

数据增强之MixUp_程大海的博客-CSDN博客

度量学习的目标&＃xff1a;
相似的或者属于同一类的样本提取到的embedding向量之间具有更高的相似度&＃xff0c;或者具有更小的空间距离
对于out-of samples的样本&＃xff0c;也就是未见过的样本&＃xff0c;希望也能提取到有效的embedding&＃xff0c;也就是模型的泛化能力更好

Cross-Batch Memory&＃xff08;无痛涨点&＃xff09;

论文&＃xff1a;《Cross-Batch Memory for Embedding Learning》

参考&＃xff1a;跨越时空的难样本挖掘 - 知乎

通过前面分析的几种pair-based的损失函数可能看到&＃xff0c;基于pair的损失函数通常在mini-batch中挖掘具有高价值的样本来进行模型训练&＃xff0c;这样一来&＃xff0c;在训练时使用的batch size越大&＃xff0c;得到的模型的性能就越好&＃xff0c;这在上述的一些论文中大部分作者都会提及到。但是&＃xff0c;现实情况是&＃xff0c;受限于计算资源、显卡显存、显卡数量等的限制&＃xff0c;绝大部分用户在实际使用过程中根本无法达到有些论文SOTA结果使用的batch size&＃xff0c;作者也通过实验验证了batch size对模型性能的影响&＃xff1a;

Cross-Batch Memory的作者带来了一个优雅的解决方案。通过论文的题目可以看到&＃xff0c;这是一个跨batch的方法。在我们的一般认知中&＃xff0c;神经网络在训练过程中&＃xff0c;不同迭代轮数得到的模型是完全不同的&＃xff0c;他们之间基本上无法进行直接比较。比如对于同一张人脸图像&＃xff0c;使用epoch&＃61;100和epoch&＃61;101分别提取两个embedding&＃xff0c;然后比较他们之间的相似性&＃xff0c;结果必然是非常不相似。但是本文作者在实验中发现了一个有意思的现象&＃xff0c;就是随着网络模型训练的逐渐稳定&＃xff0c;对于同一个样本在不同迭代之间得到的feature差异是趋于稳定的&＃xff0c;作者给这个差异起了个名字叫漂移&＃xff08;Drift&＃xff09;&＃xff0c;通过计算同一样本在两个迭代之间的欧式距离来衡量feature在不同迭代之间的漂移&＃xff1a;

作者实验发现&＃xff0c;当网络模型趋于稳定是&＃xff0c;即使两个迭代之间相差了1000轮&＃xff0c;对于同一样本得到的特征之间的欧氏距离相差也是非常小的。作者把特征的这种现象叫做“slow drift”&＃xff0c;“slow drift”自然而然的带来了一种启发&＃xff0c;就是当网络模型趋于稳定之后&＃xff0c;能不能使用连续的多个batch的输出结果组成的embedding集合&＃xff0c;在这个集合之上进行难样本挖掘来训练网络。毕竟对于一张224 * 224的三通道图像来说&＃xff0c;一个256维的embedding占用的显存是微乎其微的。通过这种巧妙的方式&＃xff0c;无痛的增大了计算Loss时的batch。

参考&＃xff1a;深度度量学习&＃xff0d;论文简评 - 知乎

参考&＃xff1a;深度度量学习中的损失函数 - 知乎

参考&＃xff1a;https://github.com/KevinMusgrave/pytorch-metric-learning

参考&＃xff1a;PyTorch Metric Learning

推荐阅读

const
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
scala
程度|也就是_论文精读：Neural Architecture Search without Training

篇首语：本文由编程笔记#小编为大家整理，主要介绍了论文精读：NeuralArchitectureSearchwithoutTraining相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 16:33:20
web
navicat生成er图_实践案例丨ACL2020 KBQA 基于查询图生成回答多跳复杂问题

摘要：目前复杂问题包括两种：含约束的问题和多跳关系问题。本文对ACL2020KBQA基于查询图生成的方法来回答多跳复杂问题这一论文工作进行了解读 ... [详细]

蜡笔小新 2023-10-16 15:31:07
io
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
io
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
const
clone的fork与pthread_create创建线程有何不同

本文讨论了clone的fork与pthread_create创建线程的不同之处。进程是一个指令执行流及其执行环境，其执行环境是一个系统资源的集合。在调用系统调用fork创建一个进程时，子进程只是完全复制父进程的资源，这样得到的子进程独立于父进程，具有良好的并发性。但是二者之间的通讯需要通过专门的通讯机制，另外通过fork创建子进程系统开销很大。因此，在某些情况下，使用clone或pthread_create创建线程可能更加高效。 ... [详细]

蜡笔小新 2023-12-12 20:00:06
io
统一知识图谱学习和建议：更好地理解用户偏好

本文介绍了一种将知识图谱纳入推荐系统的方法，以提高推荐的准确性和可解释性。与现有方法不同的是，本方法考虑了知识图谱的不完整性，并在知识图谱中传输关系信息，以更好地理解用户的偏好。通过大量实验，验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]

蜡笔小新 2023-12-11 11:11:02
io
3年半巨亏242亿！商汤高估了深度学习，下错了棋？

转自：新智元三年半研发开支近70亿，累计亏损242亿。AI这门生意好像越来越不好做了。近日，商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]

蜡笔小新 2023-10-17 16:41:52
io
微信回应「10 元就能在朋友圈改定位」；谷歌官方首次提及 Android 11；Node 8.16.2 发布 | 极客头条...

微信回应「10元就能在朋友圈改定位」；谷歌官方首次提及Android11；Node8.16.2发布|极客头条,Go语言社区,Golang程序员人脉社 ... [详细]

蜡笔小新 2023-10-15 15:22:56
random
YOLOV4 Pytorch版本训练自建数据集和预测

1.程序下载本文程序核心部分完全参考开源代码：https:github.comWongKinYiuPyTorch_YOLOv4。只是从一种学习的角度去写了我的代码仓库，在基础上增加 ... [详细]

蜡笔小新 2023-10-14 15:32:06
include
九度OnlineJudge之1002：Grading问题的解决方法

本文介绍了九度OnlineJudge中的1002题目“Grading”的解决方法。该题目要求设计一个公平的评分过程，将每个考题分配给3个独立的专家，如果他们的评分不一致，则需要请一位裁判做出最终决定。文章详细描述了评分规则，并给出了解决该问题的程序。 ... [详细]

蜡笔小新 2023-12-14 13:00:09
io
baresip android编译、运行教程1语音通话

本文介绍了如何在安卓平台上编译和运行baresip android，包括下载相关的sdk和ndk，修改ndk路径和输出目录，以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]

蜡笔小新 2023-12-14 10:53:48
tree
使用在线工具jsonschema2pojo根据json生成java对象

本文介绍了使用在线工具jsonschema2pojo根据json生成java对象的方法。通过该工具，用户只需将json字符串复制到输入框中，即可自动将其转换成java对象。该工具还能解析列表式的json数据，并将嵌套在内层的对象也解析出来。本文以请求github的api为例，展示了使用该工具的步骤和效果。 ... [详细]

蜡笔小新 2023-12-13 21:23:45
include
李逍遥寻找仙药的迷阵之旅

本文讲述了少年李逍遥为了救治婶婶的病情，前往仙灵岛寻找仙药的故事。他需要穿越一个由M×N个方格组成的迷阵，有些方格内有怪物，有些方格是安全的。李逍遥需要避开有怪物的方格，并经过最少的方格，找到仙药。在寻找的过程中，他还会遇到神秘人物。本文提供了一个迷阵样例及李逍遥找到仙药的路线。 ... [详细]

蜡笔小新 2023-12-12 13:59:33
include
文件压缩解压的哈夫曼树实现

本文介绍了使用哈夫曼树实现文件压缩和解压的方法。首先对数据结构课程设计中的代码进行了分析，包括使用时间调用、常量定义和统计文件中各个字符时相关的结构体。然后讨论了哈夫曼树的实现原理和算法。最后介绍了文件压缩和解压的具体步骤，包括字符统计、构建哈夫曼树、生成编码表、编码和解码过程。通过实例演示了文件压缩和解压的效果。本文的内容对于理解哈夫曼树的实现原理和应用具有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-11 14:13:46

学习小菜鸟

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章