1、易智瑞地理信息系统全新数据科学平台Notebook Server易智瑞中国信息技术有限公司成都分公司行业技术部 数据科学 数据科学案例 Notebook Server简介 Notebook Server使用目录数据科学理论基础统计学机器学习数据可视化(某一)领域知识研究内容数据预处理数据计算数据管理数据科学行业知识金融、交通、环境、规划、犯罪统计学知识概率、偏差、分布、抽样编程能力Python、R、Matlab可视化能力概念、图表、地图数据科学家应当具备的能力数据科学家没错,鄙人就是这么全面业务分散,系统搁置数据累积,但没有发挥价值缺少拿得出手的酷炫应用无法满足领导的需求工欲善其事,必先利其器
2、。GIS部门需要数据科学家该我上场表演了数据科学案例城市热岛效应心脑血管疾病急性肠胃炎老慢支糖尿病情绪、行为异常高温诱发夏季老年病温度采样点城市热岛(老年病高发区)预测预测城市温度采样点数据城市不透水表面数据城市街区数据数据简介城市温度采样点数据采样时间:2016年8月8日晚上8:00包含字段:温度数据简介城市不透水表面数据包含字段:不透水率(0%100%)数据简介城市街区数据包含字段:各个街区65岁以上数量及密度数据简介引入需要的python包,读取数据探索温度采样点数据特性探索温度采样点数据特性探索温度采样点数据特性温度分布直方图莫兰指数验证温度承空间自相关探索温度采样点数据特性用经验贝叶
3、斯克里金对温度进行插值交叉验证:验证插值结果的准确性和可靠性预测值与实测值散点图测量值与误差散点图标准化误差的正态QQ图分析思路:验证温度空间相关性,用温度点插值,得到插值后的整个区域的温度分布。结果验证:虽无大问题,但不够完美。如何优化:可否把其他影响温度的因素作为影响因子综合考虑?思考EBK 回归预测是一种地统计插值法,用到了经验贝叶斯克里金法及解释变量栅格,其中的解释变量栅格会影响正在内插的数据的值。这种方法整合了克里金法和回归分析,使得预测的结果比单独使用任何一种方法都更准确。价格比较高的楼盘,周围楼盘的房价一般也比较高。配套学区商业公园交通EBK回归预测说人话验证不透水率与温度有关以
4、不透水表面作为解释变量对温度测量值进行EBK回归预测再次对插值结果进行交叉验证创建模型评价图街区人口密度分布按街区统计平均气温关联分析,得到温度与人口密度散点图Notebook Server简介数据科学平台产品Notebook Server基于易智瑞地理信息平台的数据分析、科学计算、机器学习的Notebooks,是新一代的数据分析、处理、共享与可视化的数据科学平台产品。产品定位影像大数据服务器矢量大数据服务器实时大数据服务器NotebookServerMonitorGIS服务器门户NEW10.7Notebook Server长什么样?方便、快捷的资源获取 在线的ArcPy调用 ArcGIS A
5、PI for Python调用 标准分析工具调用 矢量大数据分析工具调用 影像大数据工具调用产品特性 机器学习、深度学习集成 基于Docker 处理性能可自定义 镜像功能可拓展 动态可视化 方便的共享方便、快捷的资源获取方便、快捷的资源获取在线的ArcPy调用ArcGIS Pro工具和Notebook工具箱对比在线的ArcPy调用 执行 GIS 可视化和分析 空间数据管理 服务发布 GIS 系统管理ArcGIS API for Python调用分析工具调用标准分析工具调用矢量大数据分析工具调用影像大数据分析工具调用机器学习、深度学习集成ArcGIS EnterpriseWeb GIS与机器学习
6、,人工智能集成与机器学习,人工智能集成机器学习,统计,图形处理基于Docker联合ArcGIS Web Adaptor用户 2容器 2用户 3容器 3用户 1容器 1一个容器可包含多个NotebookArcGIS Notebook 1ArcGIS Notebook 2ArcGIS Notebook 3一个用户一个容器ArcGISEnterprise 高效的系统资源利用 快速的启动时间 轻松的迁移 适合多租户环境Docker优势VMDocker基于Docker联合ArcGIS