计算机视觉CV技术指南文章汇总

前言

本文汇总了过去本公众号原创的、国外博客翻译的、从其它公众号转载的、从知乎转载的等一些比较重要的文章，并按照论文分享、技术总结三个方面进行了一个简单分类。点击每篇文章标题可阅读详细内容

欢迎关注公众号 CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。

今年是进入计算机视觉领域的第四年，做公众号的第一年，写了不少原创文章，从国外博客上翻译了不少我认为比较不错的文章，也从知乎上找了不少不错的文章在经作者授权后转载到公众号。

整体上来说，这一年基本保持初心，始终在做一个专注于计算机视觉技术总结、最近技术跟踪、最新论文分享和经典论文解读的公众号。公众号从未采用夸大的标题，宁可不更，也不会强行找一篇无用文章、无用新闻来更新。

今年公众号创立了一个计算机视觉的微信交流群，目前群内氛围还算不错，基本有问有答，想要加群的朋友可以扫描文末的二维码添加编辑微信，经邀请后加群。

与此同时，公众号与一部分互联网企业进行了合作，发布一些计算机视觉的招聘岗位，读者可通过公众号直接内推给HR。

今年主要更新的内容是论文分享和技术总结。

论文分享方面主要介绍论文的研究背景、创新思路和简要介绍创新方法。基本不涉及到代码解读，只提供官方代码的链接，这主要是考虑到对读者负责。计算机是一个对动手能力要求特别高的领域，如果你觉得论文中的方法可以用在你自己的项目或研究上，你应该自己去结合源码完整地阅读整篇论文，这是一种做研究或做项目的正确态度。如果习惯于阅读别人解读得非常详尽的文章，无异于衣来伸手饭来张口，白白丢失了锻炼自己能力的机会，其结果将是始终不具备自学的能力，做事效率极低。

技术总结方面主要对现有的一些技术进行总结，如目标检测、语义分割中的常见的特征金字塔、注意力机制等，神经网络中的初始化方法、归一化方法、损失函数等，各个方向上的一些技术等。通过这些总结，读者能够非常清晰地了解这些方法之间的优缺点，改进思路等。吐槽一句，几乎每篇技术总结都花费了将近两三天的时间，一天时间全面搜寻相关文章，尽可能总结全面，一天时间思考如何写，一天时间完成整体写作，每次更新完一篇技术总结文章，都极其劳累，连玩手机的精力都没有。

接下来一年将继续进行论文分享、技术总结，此外，将会扩展一些代码技术方面的内容。今年始终没有面向读者约稿，这是因为公众号收入比较低，给不出稿费。

如果有读者愿意免费分享的话，可以向公众号提供自己原创的一些技术总结、经验、论文解读等文章，让更多人一起学习进步，共同推动计算机视觉领域的发展。与此同时，读者朋友们也可以把公众号当作是一个自我激励的平台，如一周或两周分享一篇文章到公众号，让自己始终保持不断输入不断输出的状态。公众号也会记录大家供稿的次数，日后若公众号有比较不错的收入，将会向那些给公众号多次供稿的读者们发一些稿费。

补充一句：希望大家养成锻炼身体的习惯，每次更新公众号，都要在座位上四五个小时一动不动，实在辛苦。如果读者朋友们看到觉得不错的文章，可以文末点个赞，会让我更有创作动力。

论文分享

ICCV2021 | 简单有效的长尾视觉识别新方案：蒸馏自监督(SSD)

ICCV2021 | Swin Transformer: 使用移位窗口的分层视觉Transformer

ICCV2021 | SOTR:使用transformer分割物体

ICCV2021 | PnP-DETR：用Transformer进行高效的视觉分析

ICCV2021 | Vision Transformer中相对位置编码的反思与改进

ICCV2021 | 重新思考视觉transformers的空间维度

ICCV2021 | TOOD：任务对齐的单阶段目标检测

ICCV2021 | 用于视觉跟踪的学习时空型transformer

ICCV2021 | 渐进采样式Vision Transformer

ICCV2021 | Tokens-to-Token ViT:在ImageNet上从零训练Vision Transformer

ICCV2021 | 梯度归一化用于GAN

ICCV2021 | 医学影像等小数据集的非自然图像领域能否用transformer？

ICCV2021 | TransFER：使用Transformer学习关系感知的面部表情表征

ICCV2021 | SMCA：即插即用的共同注意力模型，可使DETR收敛加速10倍

ICCV2021 | MicroNet：以极低的 FLOPs 改进图像识别

ICCV2021 | 深度理解CNN

ICCV2021 Oral | AdaFocus：利用空间冗余性实现高效视频识别

CVPR2021 | TrivialAugment：不用调优的SOTA数据增强策略

CVPR2020 | D3S: 判别式单镜头分割跟踪器

CVPR2021 | SETR: 使用 Transformer 从序列到序列的角度重新思考语义分割

CVPR2021 | 开放世界检测综述

CVPR2021 | 开放世界的目标检测

CVPR2021 | TransCenter: transformer用于多目标跟踪算法

CVPR2021 | Transformer用于End-to-End视频实例分割

CVPR2021提出的一些新数据集汇总

CVPR2021|特征金字塔的新方式YOLOF

CVPR2021 | 重新思考BatchNorm中的Batch

CVPR2021|一个高效的金字塔切分注意力模块PSA

CVPR2021 | 华为诺亚实验室提出Transformer in Transformer

CVPR2021 | 继SE,CBAM后的一种新的注意力机制Coordinate Attention

CVPR2021 | 开放世界的目标检测

CVPR2021 | TimeSformer-视频理解的时空注意模型

CVPR2021 | 一个高效的金字塔切分注意力模块PSA

CVPR2021 | PVT--无卷积密集预测的多功能backbone

CVPR2021 | 特征金字塔的新方式YOLOF

CVPR2021 | 华为诺亚实验室提出Transformer in Transformer

CVPR2021 | 行人搜索中的第一个anchor-free模型

从CVPR 2021的论文看计算机视觉的现状

Panoptic SegFormer：端到端的 Transformer 全景分割通用框

MobileVIT：轻量级视觉Transformer+移动端部署

AAAI2021 | 任意方向目标检测中的动态Anchor学习

ICML2021 | 二值化网络训练方法

NeurlPS2021 | WBF：继NMS和Soft-NMS后的过滤候选框新方法

ML2021 | PatrickStar：通过基于块的内存管理实现预训练模型的并行训练

ImageNet上表现好的模型迁移到其它数据集上也会更好吗

速度提升2倍，超强悍CPU级骨干网络PP-LCNet出世

OCR开源神器PaddleOCR再升级:效果提升7%、速度增加220%

经典论文系列 | 缩小Anchor-based和Anchor-free检测之间差距的方法：自适应训练样本选择

经典论文系列 | 胶囊网络：新的深度学习网络

经典论文系列 | 实例分割中的新范式-SOLO

经典论文系列--GhostNet：廉价操作生成更多特征

经典论文系列 | 重新思考在ImageNet上的预训练

经典论文系列 | Group Normalization & BN的缺陷

经典论文系列 | 目标检测--CornerNet & 又名 anchor boxes的缺陷

经典论文系列 | NLN: Non-Local Neural Network

经典论文系列 | BatchNorm

经典论文系列| transformer解读

经典模型系列 | Inception系列之Inception_v1

经典模型系列 | Inception系列之Inception_v2-v3

经典模型系列 | Inception系列之Inception_v4

经典模型系列 | MobileNet系列之MobileNet_v1

经典模型系列 | MobileNet系列之MobileNet_v2

经典模型系列 | MobileNet系列之MobileNet_v3

经典模型系列 | ShuffleNet系列之ShuffleNet_v1

经典模型系列 | ShuffleNet系列之ShuffleNet_v2

经典模型系列 | DenseNet

2021-视频监控中的多目标跟踪综述

图像修复必读的 10 篇论文

Anchor-free目标检测论文汇总

实例分割综述总结综合整理版

单阶段实例分割综述

视频理解综述：动作识别、时序动作定位、视频Embedding

语义分割综述

基于 U-Net 的医学影像分割算法综述

计算机视觉 10 年发展之观察：1.5万篇论文的大综述！

单目深度估计方法综述

近十年的VI-SLAM算法综述与发展

2021年小目标检测最新研究综述

综述专栏 | 姿态估计综述

深度学习中的人体姿态估计概述

Few-shot Learning 小白入门笔记

少样本目标检测

教程 | 单级式目标检测方法概述：YOLO与SSD

增量学习深度神经网络

欢迎关注公众号 CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。

在公众号中回复关键字 “入门指南“可获取计算机视觉入门所有必备资料。

技术总结

归一化方法总结

神经网络的初始化方法总结 | 又名“如何选择合适的初始化方法”

欠拟合与过拟合技术总结

NMS总结

损失函数技术总结

注意力机制技术总结

特征金字塔技术总结

池化技术总结

数据增强方法总结

论文创新的常见思路总结

CV方向的高效阅读英文文献方法总结

高效阅读英文文献的方法总结（二）

CNN结构演变总结（一）经典模型

CNN结构演变总结（二）轻量化模型

CNN结构演变总结（三）设计原则

CNN可视化技术总结（一）特征图可视化

CNN可视化技术总结（二）卷积核可视化

CNN可视化技术总结（三）类可视化

CNN可视化技术总结（四）可视化工具与项目

计算机视觉专业术语总结(一)构建计算机视觉的知识体系

计算机视觉中的数据预处理与模型训练技巧总结

计算机视觉中的传统特征提取方法总结

计算机视觉中的图像标注工具总结

神经网络中的泛化总结

计算机视觉入门路线

PyTorch和TensorFlow在模型可用性、部署便捷度和生态系统方面的对比

Pytorch 数据流中常见Trick总结

工程Tricks | PyTorch有什么节省显存的小技巧？

使用 PyTorch Lightning 将深度学习管道速度提高 10 倍

Pytorch高效训练的十条建议

使用 Ray 将 PyTorch 模型加载速度提高 340 倍

PyTorch 中的 ModuleList 和 Sequential: 区别和使用场景

PNNX: PyTorch 神经网络交换格式

Pytorch Lightning Flash 简介

TorchShard 简介

聊聊Pytorch中的dataloader

GPU多卡并行训练总结（以pytorch为例）

Pytorch代码调试工具--torchsnooper

资源分享 | PyTea：不用运行代码，静态分析pytorch模型的错误

CB Loss：基于有效样本的类别不平衡损失

基于深度学习的图像分割：网络结构设计

计算机视觉中的transformer模型创新思路总结

给模型加入先验知识的常见方法总结

计算机视觉中的自注意力

特征选择的通俗讲解！

HOG和SIFT图像特征提取简述

全面理解目标检测中的anchor

目标检测中回归损失函数总结

小目标检测常用方法总结

资源分享 | SAHI：超大图片中对小目标检测的切片辅助超推理库

干货 | CV 面试问题详解宝典--目标检测篇

深入了解目标检测深度学习算法的技术细节

目标检测mAP的计算 & COCO的评价指标

YOLOR 与 YOLOX的battle

YOLOv4论文总结和分析

不带Anchors和NMS的目标检测

使用Dice loss实现清晰的边界检测

视觉目标检测和识别之过去，现在及可能

在计算机视觉领域，都是怎么检测烟雾的？

AI 框架部署方案之模型转换

AI框架的演进趋势和MindSpore的构想

AI 模型部署概述

卷积神经网络压缩方法总结

卷积神经网络的复杂度分析

多标签分类概述

Siamese network总结

如何理解计算机视觉中的图神经网络

深度学习编译之模型即时翻译技术

提高机器学习模型性能的常用策略

Softmax 函数和它的误解

Batch Size对神经网络训练的影响

padding在深度学习模型中重要吗？

神经网络训练不收敛或训练失败的原因总结

神经网络超参数的调参方法总结

深度学习有哪些trick？

为什么GEMM是深度学习的核心

使用深度神经网络为什么8位足够？

可视化的BatchNorm--它的工作方式以及为什么神经网络需要它

在边缘设备上拟合大型神经网络的方法总结

如何使用 TensorFlow 量化神经网络

边缘 AI 平台的比较

OpenCV高性能计算基础介绍

优化OpenCV视频的读取速度

FLOPS与FLOPs区别

为什么FLOPs小的模型反而推理时间较长？

资源分享 | Glint360K: 全球最大人脸数据集, 共36万类别、1800万图像

资源分享 | 一个集图像分割的所有论文、benchmarks、数据集、项目代码等资源的github项目

资源分享 | 使用 FiftyOne 加快您的论文写作速度

论文的科学写作与哲学

CV算法工程师的一年工作经验与感悟

在做算法工程师的道路上，你掌握了什么概念或技术使你感觉自我提升突飞猛进？

欢迎关注公众号 CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。

计算机视觉CV技术指南文章汇总

论文分享

技术总结

深度学习中的Vision Transformer (ViT)详解

腾讯BERT推理模型TurboTransformers的快速推理能力

aw多模态融合,多模态话语分析

【论文】ICLR 2020 九篇满分论文！！！

干货 | 携程AI推理性能的自动化优化实践

阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾

【机器学习】生成式对抗网络模型综述

浏览器中的异常检测算法及其在深度学习中的应用

从高级程序员到CTO的4次能力跃迁！如何选择适合的技术负责人？

知识图谱表示吱吱了了

人工智能推理能力与假设检验

navicat生成er图_实践案例丨ACL2020 KBQA 基于查询图生成回答多跳复杂问题

【年终总结】告别2022，携手2023

同事工资打听话题，如何提高自己的薪水

2022年手机选购指南：高性价比手机推荐及挑选技巧