热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

SLAM建图(1)SLAM建图概述;极线搜索与块匹配;

好久没有更新SLAM系列的内容了,现在开始继续记录一下关于SLAM建图部分学习中的重要知识。建图概述在经典的slam模型中,所谓的地图,

好久没有更新SLAM系列的内容了,现在开始继续记录一下关于SLAM建图部分学习中的重要知识。

建图概述

 在经典的slam模型中,所谓的地图,即所有路标点的集合。一旦确定了路标点的位置,那就可以说我们完成了建图。所以不管是视觉历程计也好,回环检测也好,事实上都建模啦路标点的位置,并对它们进行优化。从这个角度上说,为什么要单独的来详细的学习建图呢?

  这是因为人们对建图的需求不同。SLAM作为一种底层技术,往往是用来为上层应用提供信息的。如果上层是机器人,那么应用层的开发者可能希望使用SLAM来做全局的定位,并且让机器人在地图中导航---例如扫地机需要完成扫地工作,希望计算一条能够覆盖整张地图的路径。或者,如果上层是一个AR设备,那么开发者可能希望将虚拟物体叠加在现实物体上,特别地,还可能需要处理虚拟物体和真实物体的遮挡关系。

   应用层面对定位的需求是相似的,都是希望SLAM提供相机或搭载相机的主体空间位姿信息。但对于地图,则存在着许多不同的需求。地图的作用大致归纳如下:

1.定位:定位是地图的一项基本功能。

2.导航:导航是指机器人能够在地图中进行路径规划,在任意两个地图点间寻找路径,然后控制自己运动到目标点的过程。该过程中,我们至少需要知道 地图中哪些地方不可以通过,而哪些地方是可以通过的。这就超出了稀疏特征点地图的能力范围,我们必须有另外的地图形式。(这至少是一种稠密的地图)

3.避障:与导航类似,但更注重局部的、动态的障碍物的处理。同样,仅有特征点,我们无法判断某个特征点是否为障碍物,所以需要稠密地图。

4.重建:利用slam获得周围环境的重建效果,并把它展示给其他人看,这就对它的外观上有一些要求。

5.交互:主要指人与地图之间的交互。例子略,这就需要机器人对地图有更高层的认知----语义地图。

极限搜索与块匹配

左边的相机观测到了某个像素p1。由于是单目相机,所以我们不知道它的深度,所以假设深度可能在(d_{min},+\propto )。在另一个视角看来,这条线段的投影也形成图像平面上的一条线,我们知道这是极线。当知道两部相机间的运动时,这条极线也是能够确定的。那么问题就是:极线上的哪个点是我们刚才看到的p1点呢?(在特征点方法中,通过特征匹配找到了p2的位置。然而现在我们没有描述子)只能在极线上搜索和P1长得比较相似的点。具体的说,我们可能沿着第二幅图像中的极线的某一头走到另一头,逐个比较每个像素与p1的相似程度。从直接比较像素的角度来看,这种做法倒是和直接法是异曲同工的。

è¿éåå¾çæè¿°

    比较单个像素的亮度值并不一定稳定可靠,一件很明显的事就是:万一极线上有很多和p1相似的点,我们怎么确定哪个是真实的呢?这似乎和回环检测中如何确定两幅图像(点)的相似性一样。回环检测是通过词袋来解决的,但这里由于没有特征,所以只好寻求另外的途径。

     一种直观的想法是:在p1周围取一个大小为w*w的小块,然后在极线上也取很多同样大小的小块进行比较,就可以在一定程度上提高区分性。这就是所谓的块匹配。(只有假设在不同图像间整个小块的灰度值不变,这种比较才有意义)。所以算法的假设,从像素的灰度不变性,变成了图像块的灰度不变性-------在一定程度上变得更强了。

     好了,现在我们取了p1周围的小块,并且在极线上也取了很多个小块。不妨把p1周围的小块记成A\in \mathbb{R}^{\omega \times \omega },把极线上的n个小块记成Bi,i=1...n。如何计算小块与小块间的差异呢?有以下几种不同的方法:

1.SAD(Sum of Absolute Difference)顾名思义,即取两个小块的差的绝对值之和:

S(A,B)_{SAD}=\sum_{i,j}^{ }|A(i,j)-B(i,j)|

2.SSD(Sum of Squared Distance)

S(A,B)_{SSD}=\sum_{i,j}^{ }(A(i,j)-B(i,j))^{2}

3.NCC(Normalized Cross Correlation,归一化互相关) 这种方式比前两种要复杂一些,他计算的是两个小块的相关性:

S(A,B)_{NCC}=\frac{\sum_{i,j}^{ }A(i,j)B(i,j)}{\sqrt{\sum_{i,j}^{ }A(i,j)^{2}\sum_{i,j}^{ }B(i,j)^{2}}}    这里用的是相关性,所以接近0表示不相似。而前面两种则是接近0表示相似。

 这些计算方式往往存在一个精度-效率之间的矛盾。精度好的方法往往需要复杂的计算,而简单的快速算法又往往效果不佳,这需要在实际工程中进行取舍。除了这些简单的版本外,我们可以先把每个小块的均值去掉。去掉均值后,我们准许像“小块B比A整体上亮一些,但仍然很相似”这样的情况。因此比之前的更加可靠一些。

  现在,我们假设使用了NCC在极线上计算了A与每一个Bi的相似性度量。那么我们得到一个沿着极线的NCC分布(这个分布的形状严重取决于图像本身的样子)在搜索距离较长的情况下,通常会得到一个非凸函数:这个分布存在着很多峰值,然而真实的对应点只有一个。在这种情况下,我们会倾向于使用概率分布来描述深度值,而非用某个单一的数值来描述深度。于是问题就转到了在不断对不同图像进行极线搜索时,我们估计的深度分布将发生怎么的变化----这就是所谓的深度滤波器

下一篇将继续记录。。。。。。

 


推荐阅读
  • macOS Big Sur全新设计大版本更新,10+个值得关注的新功能
    本文介绍了Apple发布的新一代操作系统macOS Big Sur,该系统采用全新的界面设计,包括图标、应用界面、程序坞和菜单栏等方面的变化。新系统还增加了通知中心、桌面小组件、强化的Safari浏览器以及隐私保护等多项功能。文章指出,macOS Big Sur的设计与iPadOS越来越接近,结合了去年iPadOS对鼠标的完善等功能。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • 上图是InnoDB存储引擎的结构。1、缓冲池InnoDB存储引擎是基于磁盘存储的,并将其中的记录按照页的方式进行管理。因此可以看作是基于磁盘的数据库系统。在数据库系统中,由于CPU速度 ... [详细]
  • 本文介绍了H5游戏性能优化和调试技巧,包括从问题表象出发进行优化、排除外部问题导致的卡顿、帧率设定、减少drawcall的方法、UI优化和图集渲染等八个理念。对于游戏程序员来说,解决游戏性能问题是一个关键的任务,本文提供了一些有用的参考价值。摘要长度为183字。 ... [详细]
  • 深入解析Linux下的I/O多路转接epoll技术
    本文深入解析了Linux下的I/O多路转接epoll技术,介绍了select和poll函数的问题,以及epoll函数的设计和优点。同时讲解了epoll函数的使用方法,包括epoll_create和epoll_ctl两个系统调用。 ... [详细]
  • OpenMap教程4 – 图层概述
    本文介绍了OpenMap教程4中关于地图图层的内容,包括将ShapeLayer添加到MapBean中的方法,OpenMap支持的图层类型以及使用BufferedLayer创建图像的MapBean。此外,还介绍了Layer背景标志的作用和OMGraphicHandlerLayer的基础层类。 ... [详细]
  • 查找给定字符串的所有不同回文子字符串原文:https://www ... [详细]
  • Shodan简单用法Shodan简介Shodan是互联网上最可怕的搜索引擎,与谷歌不同的是,Shodan不是在网上搜索网址,而是直接进入互联网的背后通道。Shodan可以说是一款“ ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • 当写稿机器人真有了观点和感情,我们是该高兴还是恐惧?
    目前,写稿机器人多是撰写以数据为主的稿件,当它们能够为文章注入观点之时,这些观点真的是其所“想”吗?最近,《南 ... [详细]
  • 校园表白墙微信小程序,校园小情书、告白墙、论坛,大学表白墙搭建教程
    小程序的名字必须和你微信注册的名称一模一样在后台注册好小程序。mp.wx-union.cn后台域名https。mp.wx-union.cn ... [详细]
author-avatar
紫逸石
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有