《2019年空间大数据可视化与分析最佳实践.pdf》由会员分享,可在线阅读,更多相关《2019年空间大数据可视化与分析最佳实践.pdf(50页珍藏版)》请在三个皮匠报告上搜索。
1、空间大数据可视化与分析最佳实践o前言o空间分析实践o可视化实践o总结目录前言o 熟悉软件/语言o 空间思维o 统计基础o 数据可视化基础知识/目的o 信息挖掘o 基于可视化的信息交流基础软件/语言空间分析/可视化维度二维空间分析/可视化维度二维+时间空间分析/可视化维度时空立方体图片来源:https:/ 位置位置+数据数据o NYC city taxi示例信息提取和展示的重要性o主要内容点数据直接展示时空立方体聚类结果展示时空趋势结果展示o实现ArcGIS ProGeoanalytics serverDemo 纽约出租车空间分析实践o可以实现但不局限于了解事件分布(xy)了解属性pattern
2、了解事情发展趋势空间分析了解你的武器 The science of whereo 空间分析包含并不局限于空间统计机器学习o作用实现目标提升项目产出减少开支避免开支提升效率和产出提升收益确保收益保护员工和市民提高客户服务满意度o确定待解决的问题o了解数据以及背景o选择方法o计算o解析空间分析结果测试统计上显著性质疑结果o展示结果结果可视化一般空间分析流程o数据矢量空间数据=几何+属性o背景事件发生范围问题分析的规模 e.g.,街区 vs 城市确认要素空间关系o为什么要了解是否能正确回答提出的问题分析结果的精度空间数据了解你的数据和背景分析工具和结果几何关系以及属性的简单统计,e.g.,求和,平均
3、值空间分析工具几何关系以及属性的复杂统计,e.g.,热点分析空间统计工具机器学习空间统计工具ArcGIS Pro 热点分析为例数据输入计算字段空间属性结果输出空间关系距离方法o Getis-Ord Gi*热点分析空间关系概念o 封装了科学算法Getis-Ord Gi*o 体现地理学第一定律科学背景o地理学第一定律o空间统计o空间关系空间统计/聚类算法 根据统计计算出判断指数算法oGetis-Ord Gi*热点分析判断高值或者低值聚类的地方影响算法正确性的因子计算范围/边缘要素/要素总数小于30个oLocal Morans I聚类分析判断是否聚类影响算法正确性的因子计算范围/边缘要素/要素总数小
4、于30个oAnselin Local Morans I 异常值分析判断聚类、异常值类型影响算法正确性的因子开箱即用的工具o热点分析工具o聚类工具o聚类和异常值分析工具计算数据类型计算数据类型 结果说明结果说明优势优势缺点缺点Moran I 连续型临近要素的相似性一个统计值总结空间模型无法展示高值或者低值聚类Moran I 判断聚类示例发现收入低的区域是否聚类,方便后续投放固定或者流动医疗资源Getis-Ord Gi*连续型高值或者低值的集中指出是否出现高值或者低值聚类最适合高值或者低值聚类的时候General G 热点分析示例商业上 发现销售额低的区域空间统计算法总结对比o反距离o反距离平房o
5、距离范围o无差别的区域o面邻接o自定义空间权重空间统计空间关系和权重o空间统计计算过程中on-fly创建权重表o空统接受自定义空间权重o空间关系决定影响权重o空间关系跟数据背景挂钩o空统计算要确定每个要素的“邻居”o空统计算要确定“邻居”的影响程度默认选项默认选项热点分析Getis-Ord Gi*计算式空间统计热点分析公式空间权重(由空间关系决定)来源o确定每个要素的邻居以及空间关系空间统计热点分析公式权重 e.g.,面临接36671782o 权重表格生成工具和顺序生成空间权重将空间权重转化成表格数据类型点类型数据面类型数据空间统计空间关系最佳实践建议 考虑空间关系方法o反距离影响随距离减小o
6、反距离平方影响随距离加速减少o距离范围o无差别的区域o面邻接两个面共享一个边界,则它们之间的空间交互将增加o 自定义权重示例流行疾病随范围递减选举城市vs农村空间统计空间关系最佳实践建议 自定义空间权重o 考虑真实交通距离零售紧急避难o 根据网络数据集生成空间权重o空假设即数据是空间随机分布的;根据计算出来的概率,来确定是否接受空假设;在假设的空间随机分布中,每一个观察值在任何地点发生的概率是相同的,并且现有的观察值的位置也不会影响数据集中的其他观察值。o基于统计结果可能发生的两种错误类型:type-拒绝了空假设但是其是正确的type-没有拒绝空假设但是