热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

cornernetdetectingobjectsaspairedkeypoints论文阅读

论文地址:https:arxiv.orgpdf1808.01244.pdf代码地址:https:github.comumich-vlCornerNet

论文地址:https://arxiv.org/pdf/1808.01244.pdf

代码地址:https://github.com/umich-vl/CornerNet

ECCV2018, ECCV的全称是European conference on computer vision(欧洲计算机视觉国际会议),两年一次,是计算机视觉三大会议(ICCV,CVPR)之一。每次会议在全球范围录用论文300篇左右,主要的录用论文都来自每过,欧洲等顶尖实验室及研究所,中国大陆的论文数量一般在10-20篇左右。ECCV2010的论文录取率为27%.

ECCV是一个欧洲会议,欧洲人一般比较看中理论,但是从最近一次会议来看,似乎大家也开始注重应用了,oral里面的demo非常之多,演示效果很好,让人赏心悦目,叹为观止。不过欧洲的会有一个不好,就是他们的人通常英语口音很重,有些人甚至不太会说英文,所以开会和交流的时候,稍微有些费劲。

摘要:

     论文提出了一种新的目标检测方法,使用单个卷积神经网络将目标边界框检测为一对关键点(即边界框的左上角和右下角),通过将目标检测为成对关键点,消除了现有的one stage检测器设计中对一组anchors的需要,除了上述新颖的构想,文章还引入了corner pooling,这是一种新型的池化层,可以帮助网络中更好地定位边界框的角点。CornerNet在MS COCO上实现了42.1%的AP,优于所有现有的one stage检测器。

介绍:

....

本文提出了cornerNet,这是一种新的one stage目标检测方法,可以消除anchor boxes. 将一个目标物体检测为一对关键点--边界框的左上角和右下角。我们使用单个卷积网络来预测同一物体类别的所有实例的左上角的热土,所有右下角的热土,以及每个检测到的角点的嵌入向量(embedding vector for each detected corner).嵌入用于对属于同一目标的一对角点进行分组---训练网络以预测他们的类似嵌入(The embeddings serve to group a  pair of corners that belong to the same object--the network is trained to predict similar embeddings for them.)论文的方法受到Newell等人在多人姿态估计上下文中关联嵌入的启发。图1说明了论文方法的整体流程。

图1、我们将一个目标检测为一对组合在一起的边界框角点。卷积网络输出一个左上角热图和一个右下角热图,并输出每个检测到的焦点的嵌入向量。训练网络以预测术语同一个目标的焦点的类似嵌入。

Cornernet的另一个新颖组件是corner pooling,这是一种新型的池化层,可帮助卷积网络更好地定位边界框的角点,边界框的一角通常在目标之外,参考下图。

在这种情况下,焦点不能根据当前的信息进行定位,相反,为了确定像素位置是否有左上角,我们需要水平地向右看目标的最上面边界,垂直的向底部看物体的最左边边界。这激发了我们的corner pooling layer: 它包含两个特征图,在每个像素位置,它最大池化从第一个特征映射到右侧的所有特征向量,最大池化从第二个特征映射下面的所有特征向量,然后将两个池化结果一起添加,如下图:

图3 corner pooling 对于每个通道,我们采用两个方向(红线)的最大值(红点),每个方向都来自一个单独的特征图,并将两个最大值加在一起(蓝点)

我们假设了两个原因,为什么检测角点corners会比检测边界框中心或proposals更好些。首先,box的中心可能更难以定位,因为它取决于目标的所有4个边,而定位corner只需要两个边,因此更容易,甚至更多的corner pooling,它编码一些明确的关于corner定义的先验信息。其次,corner提供了一种更有效的方式来密集地离散边界框的空间,我们只需要用O(wh) 个corners来表示O(w^2h^2)

  3、2检测角点

  我们预测两组热图,一组用于左上角,另一组用于右下角。每组热图具有C个通道,其中C是分类的数量,并且大小为H×W,没有背景通道。每个通道都是一个二进制掩码,用于表示该类的corner位置。

对于每个corner,有一个ground-truth正位置,其他所有的位置都是负值。在训练期间,我们没有同等地惩罚负位置,而是减少对正位置半径内的负位置给予的惩罚。这是因为如果一对假corner检测器靠近他们各自的ground-truth位置,它仍然可以产生一个与ground-truth充分重叠的边界框,我们通过确保半径内的一对点生成的边界框与ground-truth的iou>t(实验中t设置为0.7)来确定物体的大小,从而确定半径。给定半径,惩罚的减少量由非标准化的2D高斯

e^{-\frac{x^2+y^2}{2\sigma ^2}}

其中心位于正位置,\sigma是半径的1/3。

论文设计了一个局部损失(focal loss)的变体

未完待续

 


推荐阅读
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • 如何自行分析定位SAP BSP错误
    The“BSPtag”Imentionedintheblogtitlemeansforexamplethetagchtmlb:configCelleratorbelowwhichi ... [详细]
  • 电话号码的字母组合解题思路和代码示例
    本文介绍了力扣题目《电话号码的字母组合》的解题思路和代码示例。通过使用哈希表和递归求解的方法,可以将给定的电话号码转换为对应的字母组合。详细的解题思路和代码示例可以帮助读者更好地理解和实现该题目。 ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
  • 使用在线工具jsonschema2pojo根据json生成java对象
    本文介绍了使用在线工具jsonschema2pojo根据json生成java对象的方法。通过该工具,用户只需将json字符串复制到输入框中,即可自动将其转换成java对象。该工具还能解析列表式的json数据,并将嵌套在内层的对象也解析出来。本文以请求github的api为例,展示了使用该工具的步骤和效果。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • FeatureRequestIsyourfeaturerequestrelatedtoaproblem?Please ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • Spring常用注解(绝对经典),全靠这份Java知识点PDF大全
    本文介绍了Spring常用注解和注入bean的注解,包括@Bean、@Autowired、@Inject等,同时提供了一个Java知识点PDF大全的资源链接。其中详细介绍了ColorFactoryBean的使用,以及@Autowired和@Inject的区别和用法。此外,还提到了@Required属性的配置和使用。 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
author-avatar
小赖小燕_380
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有