热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

计算机视觉CV技术指南文章汇总

前言本文汇总了过去本公众号原创的、国外博客翻译的、从其它公众号转载的、从知乎转载的等一些比较重要的文章,并按照论文分享、技术总结三个方面进行了一个简单分类。点击每篇文章标题可阅

前言 

本文汇总了过去本公众号原创的、国外博客翻译的、从其它公众号转载的、从知乎转载的等一些比较重要的文章,并按照论文分享、技术总结三个方面进行了一个简单分类。点击每篇文章标题可阅读详细内容

 

欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。

今年是进入计算机视觉领域的第四年,做公众号的第一年,写了不少原创文章,从国外博客上翻译了不少我认为比较不错的文章,也从知乎上找了不少不错的文章在经作者授权后转载到公众号。

整体上来说,这一年基本保持初心,始终在做一个专注于计算机视觉技术总结、最近技术跟踪、最新论文分享和经典论文解读的公众号。公众号从未采用夸大的标题,宁可不更,也不会强行找一篇无用文章、无用新闻来更新。

今年公众号创立了一个计算机视觉的微信交流群,目前群内氛围还算不错,基本有问有答,想要加群的朋友可以扫描文末的二维码添加编辑微信,经邀请后加群。

与此同时,公众号与一部分互联网企业进行了合作,发布一些计算机视觉的招聘岗位,读者可通过公众号直接内推给HR。

今年主要更新的内容是论文分享和技术总结。

论文分享方面主要介绍论文的研究背景、创新思路和简要介绍创新方法。基本不涉及到代码解读,只提供官方代码的链接,这主要是考虑到对读者负责。计算机是一个对动手能力要求特别高的领域,如果你觉得论文中的方法可以用在你自己的项目或研究上,你应该自己去结合源码完整地阅读整篇论文,这是一种做研究或做项目的正确态度。如果习惯于阅读别人解读得非常详尽的文章,无异于衣来伸手饭来张口,白白丢失了锻炼自己能力的机会,其结果将是始终不具备自学的能力,做事效率极低。

技术总结方面主要对现有的一些技术进行总结,如目标检测、语义分割中的常见的特征金字塔、注意力机制等,神经网络中的初始化方法、归一化方法、损失函数等,各个方向上的一些技术等。通过这些总结,读者能够非常清晰地了解这些方法之间的优缺点,改进思路等。吐槽一句,几乎每篇技术总结都花费了将近两三天的时间,一天时间全面搜寻相关文章,尽可能总结全面,一天时间思考如何写,一天时间完成整体写作,每次更新完一篇技术总结文章,都极其劳累,连玩手机的精力都没有。

接下来一年将继续进行论文分享、技术总结,此外,将会扩展一些代码技术方面的内容。今年始终没有面向读者约稿,这是因为公众号收入比较低,给不出稿费。

如果有读者愿意免费分享的话,可以向公众号提供自己原创的一些技术总结、经验、论文解读等文章,让更多人一起学习进步,共同推动计算机视觉领域的发展。与此同时,读者朋友们也可以把公众号当作是一个自我激励的平台,如一周或两周分享一篇文章到公众号,让自己始终保持不断输入不断输出的状态。公众号也会记录大家供稿的次数,日后若公众号有比较不错的收入,将会向那些给公众号多次供稿的读者们发一些稿费。

补充一句:希望大家养成锻炼身体的习惯,每次更新公众号,都要在座位上四五个小时一动不动,实在辛苦。如果读者朋友们看到觉得不错的文章,可以文末点个赞,会让我更有创作动力。

论文分享


ICCV2021 | 简单有效的长尾视觉识别新方案:蒸馏自监督(SSD)

ICCV2021 | Swin Transformer: 使用移位窗口的分层视觉Transformer

ICCV2021 | SOTR:使用transformer分割物体

ICCV2021 | PnP-DETR:用Transformer进行高效的视觉分析

ICCV2021 | Vision Transformer中相对位置编码的反思与改进

ICCV2021 | 重新思考视觉transformers的空间维度

ICCV2021 | TOOD:任务对齐的单阶段目标检测

ICCV2021 | 用于视觉跟踪的学习时空型transformer

ICCV2021 | 渐进采样式Vision Transformer

ICCV2021 | Tokens-to-Token ViT:在ImageNet上从零训练Vision Transformer

ICCV2021 | 梯度归一化用于GAN

ICCV2021 | 医学影像等小数据集的非自然图像领域能否用transformer?

ICCV2021 | TransFER:使用Transformer学习关系感知的面部表情表征

ICCV2021 | SMCA:即插即用的共同注意力模型,可使DETR收敛加速10倍

ICCV2021 | MicroNet:以极低的 FLOPs 改进图像识别

ICCV2021 | 深度理解CNN

ICCV2021 Oral | AdaFocus:利用空间冗余性实现高效视频识别

 


CVPR2021 | TrivialAugment:不用调优的SOTA数据增强策略

CVPR2020 | D3S: 判别式单镜头分割跟踪器

CVPR2021 | SETR: 使用 Transformer 从序列到序列的角度重新思考语义分割

CVPR2021 | 开放世界检测综述

CVPR2021 | 开放世界的目标检测

CVPR2021 | TransCenter: transformer用于多目标跟踪算法

CVPR2021 | Transformer用于End-to-End视频实例分割

CVPR2021提出的一些新数据集汇总

CVPR2021|特征金字塔的新方式YOLOF

CVPR2021 | 重新思考BatchNorm中的Batch

CVPR2021|一个高效的金字塔切分注意力模块PSA

CVPR2021 | 华为诺亚实验室提出Transformer in Transformer

CVPR2021 | 继SE,CBAM后的一种新的注意力机制Coordinate Attention

CVPR2021 | 开放世界的目标检测

CVPR2021 | TimeSformer-视频理解的时空注意模型

CVPR2021 | 一个高效的金字塔切分注意力模块PSA

CVPR2021 | PVT--无卷积密集预测的多功能backbone

CVPR2021 | 特征金字塔的新方式YOLOF

CVPR2021 | 华为诺亚实验室提出Transformer in Transformer

CVPR2021 | 行人搜索中的第一个anchor-free模型

从CVPR 2021的论文看计算机视觉的现状

 


Panoptic SegFormer:端到端的 Transformer 全景分割通用框

MobileVIT:轻量级视觉Transformer+移动端部署

AAAI2021 | 任意方向目标检测中的动态Anchor学习

ICML2021 | 二值化网络训练方法

NeurlPS2021 | WBF:继NMS和Soft-NMS后的过滤候选框新方法

ML2021 | PatrickStar:通过基于块的内存管理实现预训练模型的并行训练

ImageNet上表现好的模型迁移到其它数据集上也会更好吗

速度提升2倍,超强悍CPU级骨干网络PP-LCNet出世

OCR开源神器PaddleOCR再升级:效果提升7%、速度增加220%

 


经典论文系列 | 缩小Anchor-based和Anchor-free检测之间差距的方法:自适应训练样本选择

经典论文系列 | 胶囊网络:新的深度学习网络

经典论文系列 | 实例分割中的新范式-SOLO

经典论文系列--GhostNet:廉价操作生成更多特征

经典论文系列 | 重新思考在ImageNet上的预训练

经典论文系列 | Group Normalization & BN的缺陷

经典论文系列 | 目标检测--CornerNet  & 又名 anchor boxes的缺陷

经典论文系列 | NLN: Non-Local Neural Network

经典论文系列 | BatchNorm

经典论文系列| transformer解读

经典模型系列 | Inception系列之Inception_v1

经典模型系列 | Inception系列之Inception_v2-v3

经典模型系列 | Inception系列之Inception_v4

经典模型系列 | MobileNet系列之MobileNet_v1

经典模型系列 | MobileNet系列之MobileNet_v2

经典模型系列 | MobileNet系列之MobileNet_v3

经典模型系列 | ShuffleNet系列之ShuffleNet_v1

经典模型系列 | ShuffleNet系列之ShuffleNet_v2

经典模型系列 | DenseNet

 


2021-视频监控中的多目标跟踪综述

图像修复必读的 10 篇论文

Anchor-free目标检测论文汇总

实例分割综述总结综合整理版

单阶段实例分割综述

视频理解综述:动作识别、时序动作定位、视频Embedding

语义分割综述

基于 U-Net 的医学影像分割算法综述

计算机视觉 10 年发展之观察:1.5万篇论文的大综述!

单目深度估计方法综述

近十年的VI-SLAM算法综述与发展

2021年小目标检测最新研究综述

综述专栏 | 姿态估计综述

深度学习中的人体姿态估计概述

Few-shot Learning 小白入门笔记

少样本目标检测

教程 | 单级式目标检测方法概述:YOLO与SSD

增量学习深度神经网络

欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。

在公众号中回复关键字 “入门指南“可获取计算机视觉入门所有必备资料。

 

技术总结


归一化方法总结

神经网络的初始化方法总结 | 又名“如何选择合适的初始化方法”

欠拟合与过拟合技术总结

NMS总结           

损失函数技术总结

注意力机制技术总结

特征金字塔技术总结   

池化技术总结    

数据增强方法总结   

论文创新的常见思路总结

CV方向的高效阅读英文文献方法总结

高效阅读英文文献的方法总结(二)

CNN结构演变总结(一)经典模型

CNN结构演变总结(二)轻量化模型

CNN结构演变总结(三)设计原则

CNN可视化技术总结(一)特征图可视化

CNN可视化技术总结(二)卷积核可视化

CNN可视化技术总结(三)类可视化

CNN可视化技术总结(四)可视化工具与项目

计算机视觉专业术语总结(一)构建计算机视觉的知识体系

计算机视觉中的数据预处理与模型训练技巧总结

计算机视觉中的传统特征提取方法总结

计算机视觉中的图像标注工具总结

神经网络中的泛化总结

计算机视觉入门路线

 


PyTorch和TensorFlow在模型可用性、部署便捷度和生态系统方面的对比

Pytorch 数据流中常见Trick总结

工程Tricks | PyTorch有什么节省显存的小技巧?

使用 PyTorch Lightning 将深度学习管道速度提高 10 倍

Pytorch高效训练的十条建议

使用 Ray 将 PyTorch 模型加载速度提高 340 倍

PyTorch 中的 ModuleList 和 Sequential: 区别和使用场景

PNNX: PyTorch 神经网络交换格式

Pytorch Lightning Flash 简介

TorchShard 简介

聊聊Pytorch中的dataloader

GPU多卡并行训练总结(以pytorch为例)

Pytorch代码调试工具--torchsnooper

资源分享 | PyTea:不用运行代码,静态分析pytorch模型的错误

 


CB Loss:基于有效样本的类别不平衡损失

基于深度学习的图像分割:网络结构设计

计算机视觉中的transformer模型创新思路总结

给模型加入先验知识的常见方法总结

计算机视觉中的自注意力

特征选择的通俗讲解!

HOG和SIFT图像特征提取简述

全面理解目标检测中的anchor

目标检测中回归损失函数总结

小目标检测常用方法总结

资源分享 | SAHI:超大图片中对小目标检测的切片辅助超推理库

干货 | CV 面试问题详解宝典--目标检测篇

深入了解目标检测深度学习算法的技术细节

目标检测mAP的计算 & COCO的评价指标

YOLOR 与 YOLOX的battle

YOLOv4论文总结和分析

不带Anchors和NMS的目标检测

使用Dice loss实现清晰的边界检测

视觉目标检测和识别之过去,现在及可能

在计算机视觉领域,都是怎么检测烟雾的?

 


AI 框架部署方案之模型转换

AI框架的演进趋势和MindSpore的构想

AI 模型部署概述

卷积神经网络压缩方法总结

卷积神经网络的复杂度分析

多标签分类概述

Siamese network总结

如何理解计算机视觉中的图神经网络

深度学习编译之模型即时翻译技术

提高机器学习模型性能的常用策略

Softmax 函数和它的误解

Batch Size对神经网络训练的影响

padding在深度学习模型中重要吗?

神经网络训练不收敛或训练失败的原因总结

神经网络超参数的调参方法总结

深度学习有哪些trick?

为什么GEMM是深度学习的核心

使用深度神经网络为什么8位足够?

可视化的BatchNorm--它的工作方式以及为什么神经网络需要它

在边缘设备上拟合大型神经网络的方法总结

如何使用 TensorFlow 量化神经网络

边缘 AI 平台的比较

 


OpenCV高性能计算基础介绍

优化OpenCV视频的读取速度

FLOPS与FLOPs区别

为什么FLOPs小的模型反而推理时间较长?

资源分享 | Glint360K: 全球最大人脸数据集, 共36万类别、1800万图像

资源分享 | 一个集图像分割的所有论文、benchmarks、数据集、项目代码等资源的github项目

资源分享 | 使用 FiftyOne 加快您的论文写作速度

论文的科学写作与哲学

CV算法工程师的一年工作经验与感悟

在做算法工程师的道路上,你掌握了什么概念或技术使你感觉自我提升突飞猛进?

 

欢迎关注公众号 CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。

在公众号中回复关键字 “入门指南“可获取计算机视觉入门所有必备资料。

 
 

推荐阅读
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • 本文介绍了腾讯最近开源的BERT推理模型TurboTransformers,该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想,通过简化问题和加速开发,实现了快速推理能力。同时,文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题,并提出了合并计算的解决方案。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 从高级程序员到CTO的4次能力跃迁!如何选择适合的技术负责人?
    本文讲解了从高级程序员到CTO的4次能力跃迁,以及如何选择适合的技术负责人。在初创期、发展期、成熟期的每个阶段,创业公司需要不同级别的技术负责人来实现复杂功能、解决技术难题、提高交付效率和质量。高级程序员的职责是实现复杂功能、编写核心代码、处理线上bug、解决技术难题。而技术经理则需要提高交付效率和质量。 ... [详细]
  • 知识图谱表示概念:知识图谱是由一些相互连接的实体和他们的属性构成的。换句话说,知识图谱是由一条条知识组成,每条知识表示为一个SPO三元组(Subject-Predicate-Obj ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • navicat生成er图_实践案例丨ACL2020 KBQA 基于查询图生成回答多跳复杂问题
    摘要:目前复杂问题包括两种:含约束的问题和多跳关系问题。本文对ACL2020KBQA基于查询图生成的方法来回答多跳复杂问题这一论文工作进行了解读 ... [详细]
  • 【年终总结】告别2022,携手2023
    2023新年祝福虎年去,兔年到,㊗各位粉丝蹦蹦跳跳~2022年是IT进阶之旅创办的第四年,值此兔年除夕之夜,对本年度各位居士 ... [详细]
  • 本文讨论了同事工资打听的话题,包括同工不同酬现象、打探工资的途径、为什么打听别人的工资、职业的本质、商业价值与工资的关系,以及如何面对同事工资比自己高的情况和凸显自己的商业价值。故事中的阿巧发现同事的工资比自己高后感到不满,通过与老公、闺蜜交流和搜索相关关键词来寻求解决办法。 ... [详细]
  • 在2022年,随着信息化时代的发展,手机市场上出现了越来越多的机型选择。如何挑选一部适合自己的手机成为了许多人的困扰。本文提供了一些配置及性价比较高的手机推荐,并总结了选择手机时需要考虑的因素,如性能、屏幕素质、拍照水平、充电续航、颜值质感等。不同人的需求不同,因此在预算范围内找到适合自己的手机才是最重要的。通过本文的指南和技巧,希望能够帮助读者节省选购手机的时间。 ... [详细]
author-avatar
爱旅游的星琴
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有