英文论文（sci）解读复现【NO.5】让RepVGG再次变得更强大：一种量化感知方法

作者：rukal2502900501_324 | 来源：互联网 | 2023-10-13 09:25

此前出了目标检测算法改进专栏，但是对于应用于什么场景，需要什么改进方法对应与自己的应用场景有效果，并且多少改进点能发什么水平的文章

此前出了目标检测算法改进专栏&＃xff0c;但是对于应用于什么场景&＃xff0c;需要什么改进方法对应与自己的应用场景有效果&＃xff0c;并且多少改进点能发什么水平的文章&＃xff0c;为解决大家的困惑&＃xff0c;此系列文章旨在给大家解读发表高水平学术期刊中的
SCI论文&＃xff0c;并对相应的SCI期刊进行介绍&＃xff0c;帮助大家解答疑惑&＃xff0c;助力科研论文投稿。解读的系列文章&＃xff0c;本人会进行
创新点代码复现&＃xff0c;有需要的朋友可关注私信我获取。

一、摘要

性能和推理速度之间的折衷对于实际应用是至关重要的。结构重新参数化获得了更好的折衷&＃xff0c;并且它正在成为现代卷积神经网络中越来越受欢迎的成分。尽管如此&＃xff0c;当需要INT 8推断时&＃xff0c;其量化性能通常太差而无法部署&＃xff08;例如&＃xff0c;ImageNet上的top-1精度下降超过20%&＃xff09;。在本文中&＃xff0c;我们深入研究了这种失效的潜在机制&＃xff0c;即原始设计不可避免地增大了量化误差。我们提出了一个简单、健壮、有效的补救措施&＃xff0c;以获得一个量化友好的结构&＃xff0c;同时也享有重新参数化的好处。我们的方法极大地弥补了RepVGG的INT 8和FP 32精度之间差距。在没有花里胡哨的情况下&＃xff0c;通过标准的训练后量化&＃xff0c;ImageNet上排名前1的精度下降减少到2%以内。

二、网络模型及核心创新点

揭示了在量化RepVGG 等基于重新参数化的架构时性能崩溃的根本原因。

设计了RepVGG的量化友好替代品&＃xff08;即QARepVGG&＃xff09;&＃xff0c;其在权重和激活分布方面具有根本差异&＃xff0c;同时保留了速度和性能权衡突出的优势。

我们提出的方法在不同的模型尺度和不同的视觉任务上都有很好的泛化能力&＃xff0c;实现了出色的后量化性能&＃xff0c;可以随时部署。此外&＃xff0c;我们的模型在FP32精度方面与RepVGG相当。

三、实验效果&＃xff08;部分展示&＃xff09;

我们的实验主要集中在ImageNet数据集上。最后&＃xff0c;基于最近流行的检测器YOLOv6 验证了该方法的通用性&＃xff0c;该检测器广泛采用了重新参数化设计。

1.所有模型均经过120个时期的训练&＃xff0c;全球批量为256。我们使用的SGD优化器动量为0.9&＃xff0c;权重衰减为10−4。学习速率初始化为0.1&＃xff0c;然后按照余弦策略衰减到零。我们还遵循简单的数据扩充&＃xff0c;如[11]。所有实验均在8个Tesla-V100 GPU上完成。

我们观察到具有群卷积的RepVGG的表现要差得多。PTQ后RepVGG-B2 g4的准确度从78.5%下降至13.7%&＃xff08;64.8%↓&＃xff09;。然而&＃xff0c;我们的QARepVGG-B2 g4仅损失0.7%的准确度&＃xff0c;表明其对其他规模和变体的稳健性。

2.消融研究-变体架构设计。我们研究了不同设计的量化性能&＃xff0c;结果如表5所示。

注意&＃xff0c;当BN被完全移除时&＃xff0c;模型不能收敛。虽然BN后的设置只有71.1%的INT8 top-1精度&＃xff0c;但其FP32精度较低。量化间隙随着模型容量的增长&＃xff08;从A0到B0&＃xff09;而增大&＃xff0c;这不赞成这种方法。

五、实验结论

通过理论和定量分析&＃xff0c;我们剖析了著名的基于重参数化的结构RepVGG的量子化失败.它的结构缺陷不可避免地放大了量化误差&＃xff0c;并且累积地产生较差的结果。我们重新设计了QARepVGG&＃xff0c;它可以生成有利于量化的权重和激活分布。QARepVGG大大简化了最终部署的量化过程。强调建筑设计中的量化意识应引起重视。

注&＃xff1a;论文原文出自本文仅用于学术分享&＃xff0c;如有侵权&＃xff0c;请联系后台作删文处理。

解读的系列文章&＃xff0c;本人已进行创新点代码复现&＃xff0c;有需要的朋友欢迎关注私信我获取
❤
。

推荐阅读

架构设计
程度|也就是_论文精读：Neural Architecture Search without Training

篇首语：本文由编程笔记#小编为大家整理，主要介绍了论文精读：NeuralArchitectureSearchwithoutTraining相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 16:33:20
js
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
js
Learning to Paint with Model-based Deep Reinforcement Learning

本文介绍了一种基于模型的深度强化学习方法，通过结合神经渲染器，教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等，以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战，包括绘制纹理丰富的图像等。通过对比实验的结果，作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]

蜡笔小新 2023-12-11 10:27:44
js
深度学习黑话

OCR：用字符识别方法将形状翻译成计算机文字的过程Matlab：商业数学软件；CUDA：CUDA™是一种由NVIDIA推 ... [详细]

蜡笔小新 2023-10-17 17:55:01
less
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
const
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
const
Linux 内核 4.17-rc1 发布，关闭了合并窗口

LinusTorvalds发布了 Linux4.17-rc1，关闭了合并窗口。Linux4.17的主 ... [详细]

蜡笔小新 2023-10-16 20:41:28
const
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
post
用c语言实现线画、填充图元生成算法多边形_【游戏场景剔除】剔除算法综述...

之前在做场景优化的过程中，看了不少论文和博客阐述不同剔除算法的原理和过程，自己参照着算法去实现了Hiz和软件剔除。一直想写一篇关于剔除算法的综述 ... [详细]

蜡笔小新 2023-10-16 13:24:11
post
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
post
PhysioNet生理信号处理（三）WFDB Toolbox for Matlab的安装和使用方法

本文介绍了PhysioNet网站提供的生理信号处理工具箱WFDB Toolbox for Matlab的安装和使用方法。通过下载并添加到Matlab路径中或直接在Matlab中输入相关内容，即可完成安装。该工具箱提供了一系列函数，可以方便地处理生理信号数据。详细的安装和使用方法可以参考本文内容。 ... [详细]

蜡笔小新 2023-12-13 20:46:48
import
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
import
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
merge
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
merge
ICRA2019最佳论文 Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio

文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议：ICRA2019标题：《MakingSenseofVision ... [详细]

蜡笔小新 2023-10-17 12:49:25

rukal2502900501_324

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章