基于PaddlePaddle的ConvNeXt复现

作者：瑞景地产王琴 | 来源：互联网 | 2023-07-31 15:21

转自AIStudio，原文链接：基于PaddlePaddle的ConvNeXt复现-飞桨AIStudioAConvNetforthe2020s1.简

转自AI Studio&＃xff0c;原文链接&＃xff1a;基于PaddlePaddle的ConvNeXt复现 - 飞桨AI Studio

A ConvNet for the 2020s

1. 简介

这是一个 PaddlePaddle 实现的 ConvNeXt。

ConvNeXts完全由标准的ConvNet模块构成&＃xff0c;在精确度和可扩展性方面与Transformers竞争&＃xff0c;达到87.8%的ImageNet top-1精确度&＃xff0c;在COCO检测和ADE20K分割方面优于Swin Transformers&＃xff0c;同时保持了标准ConvNet的简单性和效率。

在ConvNeXt中&＃xff0c;它的优化策略借鉴了Swin-Transformer。具体的优化策略包括&＃xff1a;

&＃xff08;1&＃xff09;将训练Epoch数从90增加到300&＃xff1b;

&＃xff08;2&＃xff09;优化器从SGD改为AdamW&＃xff1b;

&＃xff08;3&＃xff09;更复杂的数据扩充策略&＃xff0c;包括Mixup&＃xff0c;CutMix&＃xff0c;RandAugment&＃xff0c;Random Erasing等&＃xff1b;

&＃xff08;4&＃xff09;增加正则策略&＃xff0c;例如随机深度&＃xff0c;标签平滑&＃xff0c;EMA等。

论文: A ConvNet for the 2020s

参考repo: ConvNeXt

在此非常感谢s9xie和HannaMao等人贡献的ConvNeXt&＃xff0c;提高了本repo复现论文的效率。

2. 数据集

数据集为ImageNet&＃xff0c;训练集包含1281167张图像&＃xff0c;验证集包含50000张图像。

│imagenet ├──train │ ├── n01440764 │ │ ├── n01440764_10026.JPEG │ │ ├── n01440764_10027.JPEG │ │ ├── ...... │ ├── ...... ├──val │ ├── n01440764 │ │ ├── ILSVRC2012_val_00000293.JPEG │ │ ├── ILSVRC2012_val_00002138.JPEG │ │ ├── ...... │ ├── ......

3. 复现精度

您可以从ImageNet 官网申请下载数据。

模型	top1 acc (参考精度)	top1 acc (复现精度)	权重 \| 训练日志
convnext_tiny	0.821	0.821	checkpoint-best.pd \| log.txt

权重及训练日志下载地址&＃xff1a;百度网盘 or work/checkpoint-best.pd

4. 准备数据与环境

4.1 准备环境

硬件和框架版本等环境的要求如下&＃xff1a;

硬件&＃xff1a;4 * RTX3090
框架&＃xff1a;
- PaddlePaddle >&＃61; 2.2.0

下载代码

In [1]

%cd /home/aistudio/# !git clone https://github.com/flytocc/ConvNeXt-paddle.git!unzip ConvNeXt-paddle-main.zip

安装paddlepaddle

# 需要安装2.2及以上版本的Paddle&＃xff0c;如果 # 安装GPU版本的Paddle pip install paddlepaddle-gpu&＃61;&＃61;2.2.0 # 安装CPU版本的Paddle pip install paddlepaddle&＃61;&＃61;2.2.0

更多安装方法可以参考&＃xff1a;Paddle安装指南。

安装requirements

In [2]

%cd /home/aistudio/ConvNeXt-paddle-main !pip install -r requirements.txt

4.2 准备数据

如果您已经ImageNet1k数据集&＃xff0c;那么该步骤可以跳过&＃xff0c;如果您没有&＃xff0c;则可以从ImageNet官网申请下载。

如果只是希望快速体验模型训练功能&＃xff0c;可以参考&＃xff1a;飞桨训推一体认证&＃xff08;TIPC&＃xff09;开发文档

4.3 准备模型

如果您希望直接体验评估或者预测推理过程&＃xff0c;可以直接根据第2章的内容下载提供的预训练模型&＃xff0c;直接体验模型评估、预测、推理部署等内容。

5. 复现思路

5.1 使用paddle api实现模型结构

ConvNeXt Block

class Block(nn.Layer):r""" ConvNeXt Block. There are two equivalent implementations:(1) DwConv -> LayerNorm (channels_first) -> 1x1 Conv -> GELU -> 1x1 Conv; all in (N, C, H, W)(2) DwConv -> Permute to (N, H, W, C); LayerNorm (channels_last) -> Linear -> GELU -> Linear; Permute backWe use (2) as we find it slightly faster in PyTorchArgs:dim (int): Number of input channels.drop_path (float): Stochastic depth rate. Default: 0.0layer_scale_init_value (float): Init value for Layer Scale. Default: 1e-6."""def __init__(self, dim, drop_path&＃61;0., layer_scale_init_value&＃61;1e-6):super().__init__()self.dwconv &＃61; nn.Conv2D(dim, dim, 7, padding&＃61;3,groups&＃61;dim) # depthwise convself.norm &＃61; nn.LayerNorm(dim, epsilon&＃61;1e-6)# pointwise/1x1 convs, implemented with linear layersself.pwconv1 &＃61; nn.Linear(dim, 4 * dim)self.act &＃61; nn.GELU()self.pwconv2 &＃61; nn.Linear(4 * dim, dim)if layer_scale_init_value > 0:self.gamma &＃61; self.create_parameter(shape&＃61;[dim],default_initializer&＃61;Constant(value&＃61;layer_scale_init_value))else:self.gamma &＃61; Noneself.drop_path &＃61; DropPath(drop_path) if drop_path > 0. else nn.Identity()def forward(self, x):input &＃61; xx &＃61; self.dwconv(x)x &＃61; x.transpose([0, 2, 3, 1]) # (N, C, H, W) -> (N, H, W, C)x &＃61; self.norm(x)x &＃61; self.pwconv1(x)x &＃61; self.act(x)x &＃61; self.pwconv2(x)if self.gamma is not None:x &＃61; self.gamma * xx &＃61; x.transpose([0, 3, 1, 2]) # (N, H, W, C) -> (N, C, H, W)x &＃61; input &＃43; self.drop_path(x)return x

6. 开始使用

6.1 模型预测

测试图片

In [10]

%cd /home/aistudio/ConvNeXt-paddle-main%run predict.py \--model convnext_tiny \--infer_imgs ./demo/ILSVRC2012_val_00020010.JPEG \--resume /home/aistudio/work/checkpoint-best.pd

最终输出结果为

[{&＃39;class_ids&＃39;: [178, 211, 85, 236, 246], &＃39;scores&＃39;: [0.8764159083366394, 0.0005395704065449536, 0.0005327172111719847, 0.000466014607809484, 0.0004493744927458465], &＃39;file_name&＃39;: &＃39;/home/aistudio/ConvNeXt-paddle-main/demo/ILSVRC2012_val_00020010.JPEG&＃39;, &＃39;label_names&＃39;: [&＃39;Weimaraner&＃39;, &＃39;vizsla, Hungarian pointer&＃39;, &＃39;quail&＃39;, &＃39;Doberman, Doberman pinscher&＃39;, &＃39;Great Dane&＃39;]}]

表示预测的类别为Weimaraner&＃xff08;魏玛猎狗&＃xff09;&＃xff0c;ID是178&＃xff0c;置信度为0.8764159083366394。

6.2 模型训练

单机多卡训练

export CUDA_VISIBLE_DEVICES&＃61;0,1,2,3 python -m paddle.distributed.launch --gpus&＃61;"0,1,2,3" \main.py \--model convnext_tiny --drop_path 0.1 \--batch_size 128 --lr 4e-3 --accum_iter 8 \--warmup_epochs 20 \--model_ema --model_ema_eval --dist_eval \--data_path /path/to/imagenet/ \--cls_label_path_train /path/to/train_list.txt \--cls_label_path_val /path/to/val_list.txt \--output_dir output/convnext_tiny

ps: 如果未指定cls_label_path_train/cls_label_path_val&＃xff0c;会读取data_path下train/val里的图片作为train-set/val-set。

部分训练日志如下所示。

[11:46:22.948892] Epoch: [96] [ 840/2502] eta: 0:15:25 lr: 0.003310 loss: 3.6854 (3.5704) time: 0.5759 data: 0.0005 [11:46:33.860486] Epoch: [96] [ 860/2502] eta: 0:15:14 lr: 0.003310 loss: 3.6475 (3.5700) time: 0.5454 data: 0.0005

6.3 模型评估

python eval.py \--model convnext_tiny \--batch_size 128 \--data_path /path/to/imagenet/ \--cls_label_path_val /path/to/val_list.txt \--resume $TRAINED_MODEL

ps: 如果未指定cls_label_path_val&＃xff0c;会读取data_path/val里的图片作为val-set。

7. 模型推理部署

7.1 基于Inference的推理

可以参考模型导出&＃xff0c;

将该模型转为 inference 模型只需运行如下命令&＃xff1a;

In [11]

%run export_model.py \--model convnext_tiny \--output_dir ./output/ \--resume /home/aistudio/work/checkpoint-best.pd

In [12]

%run infer.py \--model_file ./output/model.pdmodel \--params_file ./output/model.pdiparams \--input_file ./demo/ILSVRC2012_val_00020010.JPEG

输出结果为

[{&＃39;class_ids&＃39;: [178, 211, 85, 236, 246], &＃39;scores&＃39;: [0.876124918460846, 0.0005408977158367634, 0.0005338680348359048, 0.0004670217458624393, 0.0004502409719862044], &＃39;file_name&＃39;: &＃39;./demo/ILSVRC2012_val_00020010.JPEG&＃39;, &＃39;label_names&＃39;: [&＃39;Weimaraner&＃39;, &＃39;vizsla, Hungarian pointer&＃39;, &＃39;quail&＃39;, &＃39;Doberman, Doberman pinscher&＃39;, &＃39;Great Dane&＃39;]}]

表示预测的类别为Weimaraner&＃xff08;魏玛猎狗&＃xff09;&＃xff0c;ID是178&＃xff0c;置信度为0.876124918460846。与predict.py结果的误差在正常范围内。

7.2 基于Serving的服务化部署

Serving部署教程可参考&＃xff1a;链接。

8. 自动化测试脚本

详细日志在test_tipc/output

TIPC: TIPC: test_tipc/README.md

首先安装auto_log&＃xff0c;需要进行安装&＃xff0c;安装方式如下&＃xff1a; auto_log的详细介绍参考https://github.com/LDOUBLEV/AutoLog。

git clone https://github.com/LDOUBLEV/AutoLog cd AutoLog/ pip3 install -r requirements.txt python3 setup.py bdist_wheel pip3 install ./dist/auto_log-1.2.0-py3-none-any.whl

进行TIPC&＃xff1a;

bash test_tipc/prepare.sh test_tipc/config/ConvNeXt/convnext_tiny.txt &＃39;lite_train_lite_infer&＃39;bash test_tipc/test_train_inference_python.sh test_tipc/config/ConvNeXt/convnext_tiny.txt &＃39;lite_train_lite_infer&＃39;

TIPC结果&＃xff1a;

如果运行成功&＃xff0c;在终端中会显示下面的内容&＃xff0c;具体的日志也会输出到test_tipc/output/文件夹中的文件中。

Run successfully with command - python3.7 main.py --model&＃61;convnext_tiny --data_path&＃61;./dataset/ILSVRC2012/ --cls_label_path_train&＃61;./dataset/ILSVRC2012/train_list.txt --cls_label_path_val&＃61;./dataset/ILSVRC2012/val_list.txt --dist_eval --output_dir&＃61;./test_tipc/output/norm_train_gpus_0_autocast_null/convnext_tiny --epochs&＃61;2 --batch_size&＃61;8 ! Run successfully with command - python3.7 eval.py --model&＃61;convnext_tiny --data_path&＃61;./dataset/ILSVRC2012/ --cls_label_path_val&＃61;./dataset/ILSVRC2012/val_list.txt --resume&＃61;./test_tipc/output/norm_train_gpus_0_autocast_null/convnext_tiny/checkpoint-latest.pd ! Run successfully with command - python3.7 export_model.py --model&＃61;convnext_tiny --resume&＃61;./test_tipc/output/norm_train_gpus_0_autocast_null/convnext_tiny/checkpoint-latest.pd --output&＃61;./test_tipc/output/norm_train_gpus_0_autocast_null ! Run successfully with command - python3.7 infer.py --use_gpu&＃61;True --use_tensorrt&＃61;False --precision&＃61;fp32 --model_file&＃61;./test_tipc/output/norm_train_gpus_0_autocast_null/model.pdmodel --batch_size&＃61;1 --input_file&＃61;./dataset/ILSVRC2012/val --params_file&＃61;./test_tipc/output/norm_train_gpus_0_autocast_null/model.pdiparams > ./test_tipc/output/python_infer_gpu_usetrt_False_precision_fp32_batchsize_1.log 2>&1 ! ......

更多详细内容&＃xff0c;请参考&＃xff1a;TIPC测试文档。

9. 复现心得

在并入PaddleClas时&＃xff0c;碰到缺少梯度累加和EMA的问题。所以我自己实现了一个版本。

梯度累加

EMA

10. License

This project is released under the MIT license.

11. 参考链接与文献

A ConvNet for the 2020s: https://arxiv.org/abs/2201.03545
ConvNeXt: https://github.com/facebookresearch/ConvNeXt

推荐阅读

sum
利用PyTorch快速实现分类任务

关于如何快速定义自己的数据集，可以参考我的前一篇文章PyTorch中快速加载自定义数据（入门）_晨曦473的博客-CSDN博客刚开始学习P ... [详细]

蜡笔小新 2023-10-17 18:12:24
select
世界人工智能大赛OCR赛题方案！

Datawhale干货作者：阿水，北京航空航天大学，Datawhale成员本文以世界人工智能创新大赛（AIWIN）手写体OCR识别竞赛为实践背景，给出了OCR实践的常见思路和流 ... [详细]

蜡笔小新 2023-10-11 18:31:00
version
词表|句子_自然语言处理（NLP）基于序列到序列的中英机器翻译

篇首语：本文由编程笔记#小编为大家整理，主要介绍了自然语言处理（NLP）基于序列到序列的中-英机器翻译相关的知识，希望对你有一定的参考价值。【自然语言处理&#x ... [详细]

蜡笔小新 2023-10-10 10:04:54
version
使用nodejs爬取b站番剧数据，计算最佳追番推荐

本文介绍了如何使用nodejs爬取b站番剧数据，并通过计算得出最佳追番推荐。通过调用相关接口获取番剧数据和评分数据，以及使用相应的算法进行计算。该方法可以帮助用户找到适合自己的番剧进行观看。 ... [详细]

蜡笔小新 2023-12-14 20:44:52
int
STL迭代器的种类及其功能介绍

本文介绍了标准模板库(STL)定义的五种迭代器的种类和功能。通过图表展示了这几种迭代器之间的关系，并详细描述了各个迭代器的功能和使用方法。其中，输入迭代器用于从容器中读取元素，输出迭代器用于向容器中写入元素，正向迭代器是输入迭代器和输出迭代器的组合。本文的目的是帮助读者更好地理解STL迭代器的使用方法和特点。 ... [详细]

蜡笔小新 2023-12-10 15:17:25
copy
颜色迁移（reinhard VS welsh）

不要谈什么天分，运气，你需要的是一个截稿日，以及一个不交稿就能打爆你狗头的人，然后你就会被自己的才华吓到。------ ... [详细]

蜡笔小新 2023-10-17 21:20:36
int
[翻译]PyCairo指南裁剪和masking

裁剪和masking在PyCairo指南的这个部分，我么将讨论裁剪和masking操作。裁剪裁剪就是将图形的绘制限定在一定的区域内。这样做有一些效率的因素࿰ ... [详细]

蜡笔小新 2023-10-17 17:18:21
version
R语言openxlsx、car、rmarkdown包安装报错: 句法分析器2行里不能有多字节字符；解决WARNING: Rtools is required to build R packages

每次打开Rstudio这里会警告句法分析器2行里不能有多字节字符当安装car包时报错，安装Markdown包一直加载不出来，查了一下安装上了Rtool ... [详细]

蜡笔小新 2023-10-17 15:41:58
int
Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法

本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数，可以设置密码的有效期、最小间隔时间、最小长度，并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]

蜡笔小新 2023-12-14 17:57:01
int
Java猜拳小游戏代码

本文介绍了一个Java猜拳小游戏的代码，通过使用Scanner类获取用户输入的拳的数字，并随机生成计算机的拳，然后判断胜负。该游戏可以选择剪刀、石头、布三种拳，通过比较两者的拳来决定胜负。 ... [详细]

蜡笔小新 2023-12-14 15:39:08
int
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
sum
P1651 塔 (动态规划) 的最大高度计算方法

本文介绍了P1651题目的描述和要求，以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术，将问题转化为求解差值的问题，并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]

蜡笔小新 2023-12-13 19:52:19
filter
语义分割系列3SegNet（pytorch实现）

SegNet手稿最早是在2015年12月投出，和FCN属于同时期作品。稍晚于FCN，既然属于后来者，又是与FCN同属于语义分割网络 ... [详细]

蜡笔小新 2023-10-17 10:14:20
filter
百度AI Studio人流密度常规赛火热进行中，快来报名！

早晨七点半。北京初秋的凉风叫醒了住在望京西的你，睁开眼睛，一想到又要为人类的信息化事业贡献满满的正能量，你不禁哼唱起那句“早晨起来 ... [详细]

蜡笔小新 2023-10-12 18:57:29
version
Jupyter 使用Anaconda 虚拟环境内核

Anaconda虚拟环境中使用JupyterNotebook安装好Anaconda之后，进入AnacondaPrompt，创建虚拟环境， ... [详细]

蜡笔小新 2023-10-12 18:48:11

瑞景地产王琴

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章