热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

GeoDa:入门基础

前言GeoDa是一个免费的开源软件工具,用于空间数据分析。它旨在通过探索和建模空间模式来促进数据分析的新见解。GeoDa是由LucAnselin博士和他的团队开发的。

前言

    GeoDa是一个免费的开源软件工具,用于空间数据分析。它旨在通过探索和建模空间模式来促进数据分析的新见解。
    GeoDa是由Luc Anselin博士和他的团队开发的。该项目为探索性空间数据分析(ESDA)方法提供了用户友好的图形界面,例如用于聚合数据(数千条记录)的空间自相关统计,以及用于点和多边形数据(数万条记录)的基本空间回归分析。要在GeoDa中使用大数据,首先应该将其聚合到区域单元。


GeoDa 1.12.1

    GeoDa现在支持各种不同格式的矢量数据:可以使用shapefile、地理数据库、GeoJSON、MapInfo、GML、KML和GDAL库支持的其他矢量数据格式。

    以上来源于 GeoDa GitHub

    2020年9月更新:GeoDa终于迎来重大更新-1.16版 [链接]

    2020年10月更新:Geoda出Python包了 [链接]

 


功能

    GeoDa提供了丰富的用于探索性空间数据分析(ESDA)的方法,比如:


  • 空间自相关统计(spatial autocorrelation statistics)
  • 空间回归分析(spatial regression analysis)
  • 单变量和多变量的局部Geary聚类分析
  • (非空间)聚类分析方法(PCA)等

 

    GeoDa的设计包含一个由地图和统计图表相联合的相互作用的环境,使用强大的连接窗口技术(与ArcGIS的关联表单同效果

    1. 打开一个shp文件

    2. 菜单栏选择 Table - Merge,填写弹出的表单(通过 ID 关联,添加文本数据中的count字段 

    3. 成功将一个shp文件与文本数据(如:csv)关联,可以点击菜单栏 查看属性表

 


操作案例

    找到的一些案例都大同小异,了解即可

    https://zhuanlan.zhihu.com/p/100455481 (参数介绍较为详细

    https://www.sohu.com/a/293616901_698752

    https://www.cnblogs.com/wicked-fly/p/6225002.html

    ⭐ 空间分析原理推荐 虾神daxialu 的 新版白话空间统计

 


与ArcGIS的区别

    我的理解:GeoDa致力于空间自相关分析等,在这方面其研究方法比 ArcGIS 更丰富(比如:空间滞后模型、空间残差模型等),至于同一方法的准确性差异不好评判优劣(个人理解,若有错,请指出

    虾神大佬如是说:

    ArcGIS的算法会使得误差比geoda的更大,所以一般做空间自相关都是采用geoda的[来源](个人感觉不绝对)

    GeoDa完全就是一款为统计而设计的软件;而ArcGIS更加全面,有更多分析模块,包括统计,功能更加强大 [来源]

 


案例学习

    数据

   

    研究内容

       结合考虑该区域每个人口普查区的经济、人口等情况,利用OLS探讨案发率与相关的社会经济的影响关系,验证是否具备空间依赖性或异质性

    

    实验

        前提说明:在实验前,通过“空间连接”工具进行计算字段 Join_Count,即为每个人口普查区中汽车盗窃案发生次数,将在该实验中作为因变量。对因变量进行空间自相关检验,结果表明各人口普查区中的盗窃案数目整体呈现正空间自相关。经过模型检验,剔除了一些变量,只留下PCI、Population 和 Unemployed三个变量(这部分省略不写了)。

        1. 创建权重矩阵,点击Weight Manger,再点击Create(GeoDa可以自定义空间权重矩阵和空间关系

        2. 工具栏点击 Regression - Regression

        3. 运行结果

        4. 在ArcGIS中,Arctoolbox“空间统计工具”工具箱中选择“空间关系建模”中的“普通最小二乘法”工具进行计算

        5. 运行结果

 


结语

    从两个软件的 OLS 结果来看,校正R^{2}两者一样但GeoDa的AIC值更小一些,所以在该数据、该模型下,GeoDa的效果更好。实验是上学时课程的作业,很多知识点都忘得差不多了。如有错误,请指出,谢谢。

 


其他    

    根据 R^{2} 的取值,来判断模型的好坏,其取值范围为[0,1]:如果结果是 0,说明模型拟合效果很差;如果结果是 1,说明模型无错误。一般来说,R^{2} 越大,表示模型拟合效果越好。

    校正R^{2} 抵消样本数量对 R^{2} 的影响,做到了真正的 0~1,越大越好。

    AIC信息准则是衡量统计模型拟合优良性的一种标准,AIC鼓励数据拟合的优良性但是尽量避免出现过度拟合(对训练数据拟合的很好,而对测试数据拟合的很差)的情况。所以优先考虑的模型应是AIC值最小的那一个。赤池信息准则的方法是寻找可以最好地解释数据但包含最少自由参数的模型。


推荐阅读
  • 《数据结构》学习笔记3——串匹配算法性能评估
    本文主要讨论串匹配算法的性能评估,包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库,可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n),通过随机取出长度为m的子串作为模式P,在文本T中进行匹配,统计平均复杂度。对于成功和失败的匹配分别进行测试,分析其平均复杂度。详情请参考相关学习资源。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 安装mysqlclient失败解决办法
    本文介绍了在MAC系统中,使用django使用mysql数据库报错的解决办法。通过源码安装mysqlclient或将mysql_config添加到系统环境变量中,可以解决安装mysqlclient失败的问题。同时,还介绍了查看mysql安装路径和使配置文件生效的方法。 ... [详细]
  • 本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值,函数可以作为变量自由传递,也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性,为程序开发带来了便利。 ... [详细]
  • 学习SLAM的女生,很酷
    本文介绍了学习SLAM的女生的故事,她们选择SLAM作为研究方向,面临各种学习挑战,但坚持不懈,最终获得成功。文章鼓励未来想走科研道路的女生勇敢追求自己的梦想,同时提到了一位正在英国攻读硕士学位的女生与SLAM结缘的经历。 ... [详细]
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了在SpringBoot中集成thymeleaf前端模版的配置步骤,包括在application.properties配置文件中添加thymeleaf的配置信息,引入thymeleaf的jar包,以及创建PageController并添加index方法。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • 本文介绍了PhysioNet网站提供的生理信号处理工具箱WFDB Toolbox for Matlab的安装和使用方法。通过下载并添加到Matlab路径中或直接在Matlab中输入相关内容,即可完成安装。该工具箱提供了一系列函数,可以方便地处理生理信号数据。详细的安装和使用方法可以参考本文内容。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
author-avatar
斌哥第一次
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有