热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PointNet++(Stanford,2017.6)

PointNet(Stanford,2017.6)DeepHierarchicalFeatureLearningonPointSetsinaMetricSpace总结ÿ

PointNet++(Stanford,2017.6)


Deep Hierarchical Feature Learning on PointSets in a Metric Space

总结:Pointnet++ 是pointnet的增强版本,可以看作增加了层次结构的pointNet。

把pointnet拿来做blocks级联,获得更大的感受野(类比CNN)。主要的contributes:


  1. 设计了set abstraction (包括Sampling layer、Grouping layer、以及PointNet layer)结构来提取点云特征
  2. 应对 raw 点云 的分布不均匀问题,论文提出了一种自适应的特征提取方式,根据点云密度调整 底层特征 和 高层特征 的在最终的融合特征中的权重。相比多尺度金字塔结构,计算量小,性能近似(略低)

总的来说就是改善了感受野,并能自适应的提取特征,最大化的发挥了point net的能力。


Pointnet 介绍

https://blog.csdn.net/weixin_39373480/article/details/88878629

https://www.cnblogs.com/wishchin/p/9199846.html

https://blog.csdn.net/sinat_37011812/article/details/81945050


1.为什么使用点云

点云是目前表示三维数据的最佳形式,其优点有:


  1. 点云更接近于设备的原始表征(即雷达扫描物体直接产生点云)
  2. 点云的表达方式更加简单,一个物体仅用一个N×D 的矩阵表示

2.PointNet

PointNet,其本质就是一种网络结构,按一定的规则输入点云数据,经过一层层地计算,得出分类结果或者分割结果。其中比较特殊的地方在于两个转换矩阵(input transform & feature transform)的存在,根据文中所说,这两个转换矩阵可以在深度学习过程中保持点云数据的空间不变性。

pointnet当时不论是分割还是分类的结果都超过了当时的体素系列网络,同时由于参数少等特点,训练快,属于轻量级网络。

不仅如此,论文对PointNet对点云的点的缺失鲁棒性做了实验,实验证明,当PointNet缺失了60%左右的点的时候,其网络的效果都不怎么减少:

C:\Users\Mr.Duke\AppData\Roaming\Typora\typora-user-images\1568795151489.png


PointNet++


1.PointNet的缺点

PointNet++的提出源于PointNet的缺点——缺失局部特征。PointNet对于场景的分割效果十分一般,由于其网络直接暴力地将所有的点最大池化为了一个全局特征,因此局部点与点之间的联系并没有被网络学习到。


2.PointNet++的思路

分层方式处理在度量空间中采样的一组点


  1. 通过基础空间的距离度量将这组点分割成重叠的局部区域

  2. 提取局部特征来捕获来自小邻域的精细几何结构; 这些局部特征被进一步分组为更大的单元并被处理以产生更高级的特征

  3. 重复这个过程直到我们获得整个点集的特征。

C:\Users\Mr.Duke\AppData\Roaming\Typora\typora-user-images\1568795376552.png


2.1 Set Abstraction 提取点云特征 blocks


  • Sampling layer:采样层在输入点云中选择一系列点,由此定义出局部区域的中心。采样算法使用迭代最远点采样方法 iterative farthest point sampling(FPS)。

    FPS: 先随机选择一个点,然后再选择离这个点最远的点作为起点,再继续迭代,直到选出需要的个数为止

    相比随机采样,能更完整得通过区域中心点采样到全局点云

  • Grouping layer:目的是要构建局部区域,进而提取特征。思想就是利用临近点,并且论文中使用的是neighborhood ball,而不是K近邻,是因为可以保证有一个固定的感受野,主要的指标还是距离distance

  • Pointnet layer:在如何对点云进行局部特征提取的问题上,利用原有的Pointnet就可以很好的提取点云的特征,由此在Pointnet++中,原先的Pointnet网络就成为了Pointnet++网络中的子网络,层级迭代提取特征。


2.2 点云密度不均匀时的鲁棒特征学习

1.Multi-scale Grouping

C:\Users\Mr.Duke\AppData\Roaming\Typora\typora-user-images\1568797298855.png

简单而有效的方式,直接对不同密度的点云特征(通过Pointnet提取后的)进行组合,不同密度的点云是通过对输入点云进行不同概率的dropout得到的,问题是计算量比较大,慢。

2.Multi-resolution Grouping

C:\Users\Mr.Duke\AppData\Roaming\Typora\typora-user-images\1568797347554.png
分两部分,一部分直接用Pointnet从raw points上提取的特征,另一部分是对subregion使用 set abstraction得到的特征的集合。第一部分相当于是一个比较底层的部分,第二部分相当于是一个比较高层的部分,这里用两部分可以很好的控制局部区域的密度。当局部区域的密度比较小的时候,说明局部特征没有全局特征可靠,因此可以增加全局特征的权重。反之也是如此。就相当于权重可以在密度的变化之中可以被学习到。


2.3 分割

分割是逐点的,所以需要对特征进行上采样。

使用插值的方法再和之前的set abstraction 中的feature 做一个 concatenate


2.4 实验结果

Pointnet++的结构在3D point clouds上取得了state of art的水平,解决了如何处理采样不均匀的问题,也考虑了空间中点与点之间的距离度量,通过层级结构利用局部区域信息学习特征,网络结构更有效更鲁棒


推荐阅读
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法,并给出了问题的解析和解决方法。详细介绍了问题的背景和规则,并给出了相应的算法解析和实现步骤。通过本文的解析,读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]
  • [大整数乘法] java代码实现
    本文介绍了使用java代码实现大整数乘法的过程,同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率,并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • 3.223.28周学习总结中的贪心作业收获及困惑
    本文是对3.223.28周学习总结中的贪心作业进行总结,作者在解题过程中参考了他人的代码,但前提是要先理解题目并有解题思路。作者分享了自己在贪心作业中的收获,同时提到了一道让他困惑的题目,即input details部分引发的疑惑。 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • 项目需要实现弹幕,网上参考了各种方法,最后觉得transform+transition实现的效果在移动设备上性能最好,在iphone6和红米4上测试,看不到 ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 本文介绍了九度OnlineJudge中的1002题目“Grading”的解决方法。该题目要求设计一个公平的评分过程,将每个考题分配给3个独立的专家,如果他们的评分不一致,则需要请一位裁判做出最终决定。文章详细描述了评分规则,并给出了解决该问题的程序。 ... [详细]
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • 本文介绍了腾讯最近开源的BERT推理模型TurboTransformers,该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想,通过简化问题和加速开发,实现了快速推理能力。同时,文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题,并提出了合并计算的解决方案。 ... [详细]
  • 读手语图像识别论文笔记2
    文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1(手语识别背景和方法)一、前言一句:“做完了&#x ... [详细]
  • 知识图谱表示概念:知识图谱是由一些相互连接的实体和他们的属性构成的。换句话说,知识图谱是由一条条知识组成,每条知识表示为一个SPO三元组(Subject-Predicate-Obj ... [详细]
author-avatar
as8244433
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有