热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

[PaperReading3d]AFDetV2:RealTimeAnchorFreeSingleStage3DDetectionwithIoUAwareness

Paper:https:arxiv.orgabs2107.14342TL;DR地平线在Waymo自动驾驶挑战赛2020中方法(AFDet)的升级版-AFDetv2。模型是one

Paper: https://arxiv.org/abs/2107.14342

TL;DR

地平线在Waymo自动驾驶挑战赛2020中方法(AFDet)的升级版-AFDetv2。模型是one-stage,anchor-free的,在保证速度的同时有一个较好的精度。本文方法集成了较多的东西,比较工程,在模型、训练、硬件方面都做了优化。

Dataset/Algorithm/Model/Experiment Detail

模型结构如下图:
在这里插入图片描述
首先点云voxelization,这一步文章利用了GPU进行优化,提高了速度。3D backbone部分仍旧使用的是3D稀疏卷积,但是本文减少了前端残差块的数量&&降低了Z方向上的采样卷积数量,在速度和精度上有一个取舍平衡。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3ic2Cfih-1635330200347)(upload://8b6cPgfSc6eIpbZ23jR2hrB7prh.png)]

RPN在这里插入图片描述

RPN部分采用了自校准卷积模块self-calibrated convolution (SC-Conv),具体结构如下图。该模块能扩大感受野,同时在空域和特征通道上引入自注意力机制。SC-Conv模块提高了模型精度,没有增加计算量。
在这里插入图片描述

Anchor-free Head

在这里插入图片描述

共有5+2个head,跟之前的AFDet相比增加了两个额外分支,IoU branch和辅助分支Keypoints预测。
IoU branch,2D检测已经很成熟了,3D 检测也有很多应用了,主要还是为了解决分类置信度和box定位精度不匹配的问题。辅助分支关键点预测,能预测物体框的角点,可以更好的帮助网络学习物体的边缘信息。雷达反射回来的点往往在物体表面,中心不在可见点云中,增加3D框角点,能引导贴合数据,增加定位精度。Heatmap分支,增大了高斯核的半径。loss设置:

  • focal loss: heatmap预测,关键点预测
  • L1 loss: local offset head, z-axis location head, 3D object size head, orientation regression
  • Smooth L1 loss: IoU

实验

数据增强: 随机选择标注样本,随机反转x,y坐标, 整体旋转缩放等;
SWA: Stochastic Weights Averaging 随机平均权重

Waymo结果:
在这里插入图片描述

Thoughts

本文综合使用了很多之前的工作(包括2D,3D),也提出了很多新的想法,体现了很强的工程性,所以能在速度和精度方面都有一个很好表现。


推荐阅读
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 使用在线工具jsonschema2pojo根据json生成java对象
    本文介绍了使用在线工具jsonschema2pojo根据json生成java对象的方法。通过该工具,用户只需将json字符串复制到输入框中,即可自动将其转换成java对象。该工具还能解析列表式的json数据,并将嵌套在内层的对象也解析出来。本文以请求github的api为例,展示了使用该工具的步骤和效果。 ... [详细]
  • ZSI.generate.Wsdl2PythonError: unsupported local simpleType restriction ... [详细]
  • 用c语言实现线画、填充图元生成算法多边形_【游戏场景剔除】剔除算法综述...
    之前在做场景优化的过程中,看了不少论文和博客阐述不同剔除算法的原理和过程,自己参照着算法去实现了Hiz和软件剔除。一直想写一篇关于剔除算法的综述 ... [详细]
  • 深度学习与神经网络——邱锡鹏
    深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶 ... [详细]
  • Git GitHub多人协作
    在学校做一个小项目需要多人协作,就用到了gitHub,百度了一下多数写得乱七八糟或者支离破碎,于是总结了一下自己的步骤如下,第一次使用GitHUb,哪里不对望大神指出一.前期准备: ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
  • 阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ... [详细]
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • OpenStackQ版本已经发布了一段时间了。今天,小编来总结一下OpenStackQ版本核心组件的各项主要新功能,再来汇总一下最近2年来OpenStackN、O、P、Q各版本核心 ... [详细]
  • 程度|也就是_论文精读:Neural Architecture Search without Training
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了论文精读:NeuralArchitectureSearchwithoutTraining相关的知识,希望对你有一定的参考价值。 ... [详细]
  • CodeBERT理解
    1.动机大型的预训练模型,比如ELMo、GPT、Bert等提高了NLP任务的最新技术。这些预训练模型在NLP的成功驱动了多模态预训练模型,比如ViBE ... [详细]
author-avatar
吴钧隆362
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有