热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

SLAM建图(1)SLAM建图概述;极线搜索与块匹配;

好久没有更新SLAM系列的内容了,现在开始继续记录一下关于SLAM建图部分学习中的重要知识。建图概述在经典的slam模型中,所谓的地图,

好久没有更新SLAM系列的内容了,现在开始继续记录一下关于SLAM建图部分学习中的重要知识。

建图概述

 在经典的slam模型中,所谓的地图,即所有路标点的集合。一旦确定了路标点的位置,那就可以说我们完成了建图。所以不管是视觉历程计也好,回环检测也好,事实上都建模啦路标点的位置,并对它们进行优化。从这个角度上说,为什么要单独的来详细的学习建图呢?

  这是因为人们对建图的需求不同。SLAM作为一种底层技术,往往是用来为上层应用提供信息的。如果上层是机器人,那么应用层的开发者可能希望使用SLAM来做全局的定位,并且让机器人在地图中导航---例如扫地机需要完成扫地工作,希望计算一条能够覆盖整张地图的路径。或者,如果上层是一个AR设备,那么开发者可能希望将虚拟物体叠加在现实物体上,特别地,还可能需要处理虚拟物体和真实物体的遮挡关系。

   应用层面对定位的需求是相似的,都是希望SLAM提供相机或搭载相机的主体空间位姿信息。但对于地图,则存在着许多不同的需求。地图的作用大致归纳如下:

1.定位:定位是地图的一项基本功能。

2.导航:导航是指机器人能够在地图中进行路径规划,在任意两个地图点间寻找路径,然后控制自己运动到目标点的过程。该过程中,我们至少需要知道 地图中哪些地方不可以通过,而哪些地方是可以通过的。这就超出了稀疏特征点地图的能力范围,我们必须有另外的地图形式。(这至少是一种稠密的地图)

3.避障:与导航类似,但更注重局部的、动态的障碍物的处理。同样,仅有特征点,我们无法判断某个特征点是否为障碍物,所以需要稠密地图。

4.重建:利用slam获得周围环境的重建效果,并把它展示给其他人看,这就对它的外观上有一些要求。

5.交互:主要指人与地图之间的交互。例子略,这就需要机器人对地图有更高层的认知----语义地图。

极限搜索与块匹配

左边的相机观测到了某个像素p1。由于是单目相机,所以我们不知道它的深度,所以假设深度可能在(d_{min},+\propto )。在另一个视角看来,这条线段的投影也形成图像平面上的一条线,我们知道这是极线。当知道两部相机间的运动时,这条极线也是能够确定的。那么问题就是:极线上的哪个点是我们刚才看到的p1点呢?(在特征点方法中,通过特征匹配找到了p2的位置。然而现在我们没有描述子)只能在极线上搜索和P1长得比较相似的点。具体的说,我们可能沿着第二幅图像中的极线的某一头走到另一头,逐个比较每个像素与p1的相似程度。从直接比较像素的角度来看,这种做法倒是和直接法是异曲同工的。

è¿éåå¾çæè¿°

    比较单个像素的亮度值并不一定稳定可靠,一件很明显的事就是:万一极线上有很多和p1相似的点,我们怎么确定哪个是真实的呢?这似乎和回环检测中如何确定两幅图像(点)的相似性一样。回环检测是通过词袋来解决的,但这里由于没有特征,所以只好寻求另外的途径。

     一种直观的想法是:在p1周围取一个大小为w*w的小块,然后在极线上也取很多同样大小的小块进行比较,就可以在一定程度上提高区分性。这就是所谓的块匹配。(只有假设在不同图像间整个小块的灰度值不变,这种比较才有意义)。所以算法的假设,从像素的灰度不变性,变成了图像块的灰度不变性-------在一定程度上变得更强了。

     好了,现在我们取了p1周围的小块,并且在极线上也取了很多个小块。不妨把p1周围的小块记成A\in \mathbb{R}^{\omega \times \omega },把极线上的n个小块记成Bi,i=1...n。如何计算小块与小块间的差异呢?有以下几种不同的方法:

1.SAD(Sum of Absolute Difference)顾名思义,即取两个小块的差的绝对值之和:

S(A,B)_{SAD}=\sum_{i,j}^{ }|A(i,j)-B(i,j)|

2.SSD(Sum of Squared Distance)

S(A,B)_{SSD}=\sum_{i,j}^{ }(A(i,j)-B(i,j))^{2}

3.NCC(Normalized Cross Correlation,归一化互相关) 这种方式比前两种要复杂一些,他计算的是两个小块的相关性:

S(A,B)_{NCC}=\frac{\sum_{i,j}^{ }A(i,j)B(i,j)}{\sqrt{\sum_{i,j}^{ }A(i,j)^{2}\sum_{i,j}^{ }B(i,j)^{2}}}    这里用的是相关性,所以接近0表示不相似。而前面两种则是接近0表示相似。

 这些计算方式往往存在一个精度-效率之间的矛盾。精度好的方法往往需要复杂的计算,而简单的快速算法又往往效果不佳,这需要在实际工程中进行取舍。除了这些简单的版本外,我们可以先把每个小块的均值去掉。去掉均值后,我们准许像“小块B比A整体上亮一些,但仍然很相似”这样的情况。因此比之前的更加可靠一些。

  现在,我们假设使用了NCC在极线上计算了A与每一个Bi的相似性度量。那么我们得到一个沿着极线的NCC分布(这个分布的形状严重取决于图像本身的样子)在搜索距离较长的情况下,通常会得到一个非凸函数:这个分布存在着很多峰值,然而真实的对应点只有一个。在这种情况下,我们会倾向于使用概率分布来描述深度值,而非用某个单一的数值来描述深度。于是问题就转到了在不断对不同图像进行极线搜索时,我们估计的深度分布将发生怎么的变化----这就是所谓的深度滤波器

下一篇将继续记录。。。。。。

 


推荐阅读
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • macOS Big Sur全新设计大版本更新,10+个值得关注的新功能
    本文介绍了Apple发布的新一代操作系统macOS Big Sur,该系统采用全新的界面设计,包括图标、应用界面、程序坞和菜单栏等方面的变化。新系统还增加了通知中心、桌面小组件、强化的Safari浏览器以及隐私保护等多项功能。文章指出,macOS Big Sur的设计与iPadOS越来越接近,结合了去年iPadOS对鼠标的完善等功能。 ... [详细]
  • 学习SLAM的女生,很酷
    本文介绍了学习SLAM的女生的故事,她们选择SLAM作为研究方向,面临各种学习挑战,但坚持不懈,最终获得成功。文章鼓励未来想走科研道路的女生勇敢追求自己的梦想,同时提到了一位正在英国攻读硕士学位的女生与SLAM结缘的经历。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • [大整数乘法] java代码实现
    本文介绍了使用java代码实现大整数乘法的过程,同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率,并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • 3.223.28周学习总结中的贪心作业收获及困惑
    本文是对3.223.28周学习总结中的贪心作业进行总结,作者在解题过程中参考了他人的代码,但前提是要先理解题目并有解题思路。作者分享了自己在贪心作业中的收获,同时提到了一道让他困惑的题目,即input details部分引发的疑惑。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • This article discusses the efficiency of using char str[] and char *str and whether there is any reason to prefer one over the other. It explains the difference between the two and provides an example to illustrate their usage. ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • 本文介绍了H5游戏性能优化和调试技巧,包括从问题表象出发进行优化、排除外部问题导致的卡顿、帧率设定、减少drawcall的方法、UI优化和图集渲染等八个理念。对于游戏程序员来说,解决游戏性能问题是一个关键的任务,本文提供了一些有用的参考价值。摘要长度为183字。 ... [详细]
  • 深入解析Linux下的I/O多路转接epoll技术
    本文深入解析了Linux下的I/O多路转接epoll技术,介绍了select和poll函数的问题,以及epoll函数的设计和优点。同时讲解了epoll函数的使用方法,包括epoll_create和epoll_ctl两个系统调用。 ... [详细]
  • Android源码中的Builder模式及其作用
    本文主要解释了什么是Builder模式以及其作用,并结合Android源码来分析Builder模式的实现。Builder模式是将产品的设计、表示和构建进行分离,通过引入建造者角色,简化了构建复杂产品的流程,并且使得产品的构建可以灵活适应变化。使用Builder模式可以解决开发者需要关注产品表示和构建步骤的问题,并且当构建流程发生变化时,无需修改代码即可适配新的构建流程。 ... [详细]
author-avatar
紫逸石
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有