《复旦大学:2023交通运输公共数据开放利用报告(75页).pdf》由会员分享,可在线阅读,更多相关《复旦大学:2023交通运输公共数据开放利用报告(75页).pdf(75页珍藏版)》请在三个皮匠报告上搜索。
1、1公共数据开放利用报告交通运输001001引言 全国交运数林概貌 交运数林指标体系 交运数林指数 地方交运数林标杆 交运数据开放国外案例 交运数林建言 交运数林指数评估方法附录 001003008012016042061063070本报告为国家社科基金重大项目“面向数字化发展的公共数据开放利用体系与能力建设研究”(批准号:21&ZD337)的阶段性成果之一。本报告版权为复旦大学数字与移动治理实验室(复旦DMG)所有,如需引用本报告内容,请参照以下规范:复旦大学数字与移动治理实验室.2023交通运输公共数据开放利用报告R/OL.(2023-05-25)引用日期,格式为 YYYY-MM-DD.ht
2、tp:/ 图 1 各条线部门开放的有效数据集总数 图 2 各条线部门开放的数据容量(单位:万)23234642151876478011821241159917421785190020412080241924952844284429493337341436433667368138404555549658306403752494899872020004000600080001000012000民族宗教国有资产监督管理发展改革(含物价、粮食)金融监管新闻出版广播电影电视气象税务审计档案科学技术医疗保障经济和信息化/工业和信息化商务司法公安国土(规划和自然资源)水利生态环保城管住房和城乡建设体育卫生健
3、康应急管理(含安全生产监督管理)人力资源和社会保障财政统计局市场监管(含工商、质监、食药监)民政农业农村文化旅游交通运输(含轨道交通、公交公司)教育85991234825136291465268235143629395640004217429945174962505851655489578368251074312480129041348615458158581616032537108060129913147146020000400006000080000100000120000140000160000国有资产监督管理审计金融监管经济和信息化/工业和信息化民族宗教科学技术统计局发展改革(含物价、
4、粮食)档案卫生健康财政新闻出版广播电影电视体育税务应急管理(含安全生产监督管理)农业农村教育公安商务国土(规划和自然资源)人力资源和社会保障文化旅游水利民政司法气象医疗保障城管住房和城乡建设交通运输(含轨道交通、公交公司)生态环保市场监管(含工商、质监、食药监)图3和图4分别是各省域开放的交通运输领域有效数据集总数与数据容量的空间分布,颜色越深的省域所对应的数据数量也越多。从图中可见,开放交通运输领域数据数量较多的省域集中在东部地区(山东、浙江、广东)以及西部的部分地区(四川、贵州)。005 图 3 省域有效数据集总数空间分布 图 4 省域数据容量空间分布006在数据数量方面,2022年全国开
5、放的交通运输领域有效数据集总数比2021年增长约6%,无条件开放的总数据容量同比增长386%,呈现爆发式增长态势,单个数据集平均容量也有显著提升。而各地开放的交通运输领域数据集在总量与容量上仍然存在显著的地区间差距。这些交通运输领域的数据主要由各地政府部门提供,少部分地方能够开放来自国企、事业单位的交通数据。在数据质量方面,各地开放的交通数据仍以静态数据为主,只有个别地方在数据开放平台上提供了少数实时动态数据。数据持续性有待提高,相比2021年,2022年各地开放的交通数据容量增长比例的中位数为10%,存量数据更新比例的中位数仅为18%,各地持续开放与更新数据集的程度仍然不足,多数数据停止更新
6、或更新频率低,甚至存在碎片化与低容量等质量问题。各地开放的数据在标准规范上也不一致,缺少详细的数据字典描述说明,各地数据接口调用方式各不相同,复杂度较高,接口不能用、不易用的问题普遍存在。在数据利用方面,少数地方在交通运输领域已开展了诸如开放数据创新利用比赛、项目案例试点等利用促进活动,产出了部分有效成果。但各地的利用促进活动类型仍较为单一,且利用主体主要为企业,个人、社会组织、高校等其他社会主体参与利用的程度不足,交通运输领域的开放数据利用尚处于起步阶段。在法规政策方面,北京市、台州市等7个城市制定了专门针对交通运输领域数据开放的法规政策,对数据开放、全生命周期安全管理等方面作出了详细的规定
7、。其他地方在有关“公共数据资源管理”“公共数据”的法规政策中,虽然在涉及数据开放范围和利用促进的相关内容中提及了“交通运输”领域,但未具体展开。007中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要明确提出“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用。”目前,北京、上海、广东、浙江、重庆、海南、深圳、成都等省市已经以地方法规形式,初步构建起公共数据授权运营的基本原则与机制,正式迈入实践落地与规范发展阶段。表1是目前已经公开上线的地方政府公共数据授权运营平台链接,福建省与海南省两个省级地方,以及成都市、南京市、青岛市三个副省级城市都已上线了公共数据授权运
8、营平台,其中海南省、成都市与青岛市在平台上运营交通运输数据集并提供相应的交通运输领域的服务与产品。表 1 地方政府公共数据授权运营平台008数林指标开放数林指数邀请国内外政界、学术界、产业界七十余位专家共同参与,组成中国开放数林指数评估专家委员会,以体现跨界、多学科、第三方的专业视角。专家委员会基于数据开放的基本理念和原则,立足我国政府数据开放的政策要求与地方实践,借鉴国际数据开放评估指标体系的经验,构建起一个系统、科学、可操作的地方政府数据开放评估指标体系,并为每项指标分配了权重,如图5所示。二、交运数林指标体系 图 5 开放数林指数评估指标体系的构建方法009数林指标基于开放数林指标体系,
9、结合交通运输领域特点,报告重点从准备度、数据层和利用层三个维度及下属多级指标对交通运输领域开放的公共数据开展评估,如图6所示:准备度是数根,是数据开放的基础,包括开放要求和安全保护要求等两个一级指标。数据层是数叶,是数据开放的核心,包括数据数量、开放范围、关键数据集质量、关键数据集规范、关键数据集安全保护等五个一级指标。利用层是数果,是数据开放的成效,包括利用促进、利用多样性、成果数量、成果质量、成果价值等五个一级指标。010数林指标 图 6-1 交通运输领域开放数林指数评估指标体系011数林指标 图 6-2 交通运输领域开放数林指数评估指标体系012数林指数2023交通运输领域开放数林省域指
10、数如表2所示:浙江省与山东省的综合表现最优,进入A+等级;广东省与贵州省也表现优异,进入A等级,其次是四川省、福建省等省域;在单项维度上,浙江省在数据层上表现最优,山东省在利用层上表现最优,均进入A+等级。2023交通运输领域开放数林城市指数(前三十)如表3所示:德州市与杭州市的综合表现最优,进入A+等级;日照市、青岛市、上海市、金华市、烟台市与深圳市也表现优异,进入A等级,其次是贵阳市、台州市、威海市、济南市、丽水市等城市;在单项维度上,德州市在数据层上表现最优,青岛市与杭州市在利用层上表现最优,均进入A+等级。三、交运数林指数013数林指数 表 2 交通运输领域开放数林指数综合等级(省域)
11、014数林指数 表 3 交通运输领域开放数林指数综合等级(城市前三十)015数林指数省域交通运输领域开放数林指数空间分布如图7所示,颜色越深代表指数综合等级越高。数据开放水平较高的省域主要集中在东南部沿海地区的浙江、山东、广东等省域以及位于西部的贵州、四川等省域,成为全国交通运输领域的优质“数木”。图 7 交通运输领域开放数林指数空间分布(省域)016四、地方交运数林标杆数林标杆(一)准备度浙江、山东、江苏、杭州等多地将交通数据作为重点和优先开放的数据。比如在2022年发布的山东省公共数据开放办法中将交通数据作为重点和优先开放的数据类别之一,如表4所示。表 4 山东省公共数据开放办法对开放重点
12、的规定(二)数据层1.数据数量截至2022年10月,各地共开放了9489个交通运输领域的有效数据集,数据总容量达到13.5亿,相比2021年增长386%。图8是两个年度数据数量的比较,在数据集总数没有明显增加的情况下,数据容量快速增长,单个数据集平均容量显著增加。017数林标杆8985278219489135075有效数据集总数数据容量(单位:万)2021年2022年 图 8 2021 与 2022 年全国地方政府开放交通运输领域有效数据集与数据容量比较数据集总量统计的是平台上可通过下载或API接口获取的有效数据集总数。数据容量是指将一个地方平台中可下载的、结构化的、各个时间批次发布的数据集的
13、字段数(列数)乘以条数(行数)后得出的数量,体现的是平台上开放的可下载数据集的数据量和颗粒度。图9和图10分别列出省域与城市数据容量排在前十的地方,并反映了地方有效数据集总数、数据容量和单个数据集平均容量之间的关系。数据容量更能体现一个地方的数据开放总量,单个数据集平均容量则更能反映一个地方开放数据集的平均水平。例如,浙江全省有效数据集数量虽然相对较少,但数据总容量仅次于山东省,而单个数据集平均容量均远高于其他省域。德州市开放的有效数据集总数并非最多,但开放的数据容量和单个数据集平均容量都是最高,单个数据集平均容量达到55万。018数林标杆024681012141618020004000600
14、080001000012000山东浙江广东四川贵州宁夏江苏福建湖北安徽有效数据集总数数据容量(单位:万)单个数据集平均容量(单位:万)186129974940543522015878有效数据集总数数据容量(单位:万)单个数据集平均容量(单位:万)1861299749405435220158780102030405060020004000600080001000012000德州日照金华杭州丽水滨州嘉兴青岛贵阳中山有效数据集总数数据容量(单位:万)单个数据集平均容量(单位:万)图 9 省域有效数据集总数、数据容量与单个数据集平均容量比较 图 10 城市有效数据集总数、数据容量与单个数据集平均容量比
15、较019数林标杆2.优质数据集2.1 高容量数据集报告将各地开放的交通运输领域数据集中容量最高的前1%作为高容量数据集,并统计了其在各地区的分布。省域开放的交通运输领域数据中,高容量数据集最多的省域如图11所示,山东省开放的高容量数据集最多,达到43个,远超其它省域,其次是浙江省、广东省、贵州省和四川省。城市开放的交通运输领域数据集中高容量数据集数量最多的是金华市,其次是杭州市、滨州市、巴中市、淄博市等地,如图12所示。图 11 高容量交通运输领域数据集的省域分布4325731山东浙江广东贵州四川020数林标杆 图 12 高容量交通运输领域数据集的城市分布1287665444333金华杭州滨州
16、巴中淄博青岛德州日照威海东莞贵阳温州表5和表6是省本级与城市开放的数据容量最高的前10个交通运输领域数据集,省本级开放的高容量数据集主要集中于企业经营许可、运输证、车辆船舶道路桥梁基本信息等方面,城市开放的高容量数据集主要集中于公交出租车实时位置、公交线路站点、违章案件等数据。这些数据以静态为主,动态数据仍旧较少。表 5 省本级平台开放的前 10 位高容量数据集一览表021数林标杆德州市齐河县公交公司开放的“齐河县_公交实时信息表”数据集容量达到10亿,为城市在交通领域无条件开放的数据集的最高容量,包含32个字段,约3100万条数据,相应敏感信息做了脱敏处理,如图13、图14所示。表 6 城市
17、平台开放的前 10 位高容量数据集一览 图 13 德州市开放的“齐河县 _ 公交实时信息表”数据集022数林标杆 图 14 德州市开放的“齐河县 _ 公交实时信息表”数据集数据项杭州市公安局开放的“公交车辆GPS信息”数据集容量达到438万,包含13个字段,约34万条数据,如图15、图16所示。023数林标杆 图 15 杭州市开放的“公交车辆 GPS 信息”数据集 图 16 杭州市开放的“公交车辆 GPS 信息”数据集部分内容截图024数林标杆淮北市开放的“公交点位”数据集中,详细提供了公交车辆实时位置数据,包括车牌、经纬度、时间、站点、线路等重要字段,如图17、图18所示。图 17 淮北市开
18、放的“公交点位”数据集 图 18 淮北市开放的“公交点位”数据集部分内容截图025数林标杆山东省开放的“省内网约车车辆基本信息表”数据集中,详细提供了公司、车辆所在城市、车辆号码、颜色、型号、车辆运输证、定位装置等详细字段,如图19、图20所示。图 19 山东省开放的“省内网约车车辆基本信息表”数据集026数林标杆 图 20 山东省开放的“省内网约车车辆基本信息表”数据集数据项027数林标杆 图 21 浙江省开放的“企业或者车辆风险预警信息”数据集浙江省开放的“企业或者车辆风险预警信息”数据集详细提供了浙江省散装水泥专用车辆公司基本信息与发生违章、事故的数量等信息,包括车牌号、企业名称、企业社
19、会信用代码、城市、违章数量、超速数量、受伤、死亡、出险数量等详细字段,如图21、图22所示。028数林标杆2.2 优质APIAPI接口适用于提供实时动态的高容量数据,以促进高价值数据的开放与利用。优质API接口需要满足接口可调用、至少每日更新、数据集容量高等标准。目前,浙江省与杭州市平台提供了交通运输领域数据的优质API接口,如表7所示,图23和图24是通过接口获取的数据集的部分截图。表 7 交通运输领域数据优质 API 图 22 浙江省开放的“企业或者车辆风险预警信息”数据集部分内容截图029数林标杆 图 23 浙江省商务厅开放的“车辆出险数据信息”部分内容截图 图 24 杭州市余杭区开放的
20、“公交车辆 GPS 信息”部分内容截图030数林标杆 表 8 各地开放的交通运输领域 10 类常见数据集国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要第九章提到要“聚焦新一代信息技术、生物技术、新能源、新材料、高端装备、新能源汽车、绿色环保以及航空航天、海洋装备等战略性新兴产业,加快关键核心技术创新应用,增强要素保障能力,培育壮大产业发展新动能。”新能源汽车相关数据是保障新能源汽车产业发展的重要数据要素。因此,报告还重点分析了当前国内各地方开放的新能源汽车相关数据集,主要以新能源公交车的车辆与运营数据、充电桩数据、车辆保险出险三种类型为主(如表9、10、11所示)。除了有利于新
21、能源汽车产业的发展,这类数据也有利于保险行业针对新能源汽车发展开发适合的保险产品。然而,目前新能源汽车相关的开放数据集呈现为静态低频、数据容量整体较低的特征,还无法满足相关产业发展的需求。3.常见数据集报告将各地开放的交通运输数据集的名称进行文本分析,出现次数最高的关键词有运输、道路、车辆、证、船舶、从业人员、客运、站点等。结合各地实际开放情况,报告归纳出各地开放的交通运输领域10类常见数据集,如表8所示。031数林标杆 表 9 国内各地方开放的新能源车辆与运行情况数据一览表 表 10 国内各地方开放的新能源车充电桩数据集一览表032数林标杆 表 11 国内各地方开放的车辆保险与风险数据一览表
22、4.授权运营数据集青岛市公共数据服务平台以数据开放和授权运营的形式开放了136个交通出行领域数据集,并将数据分为三个等级,分别对应无条件开放、有条件开放与授权运营。截至2023年5月12日,平台用户发布了26条交通出行领域的需求,以征集产品与解决方案,同时提供了121条交通出行领域数据服务,包括数据模型、算法服务与解决方案三种形式,如图25-图27所示。033数林标杆 图 25 青岛市公共数据服务平台首页 图 26 青岛市公共数据服务平台数据资源栏目(交通出行)034数林标杆 图 27 青岛市公共数据服务平台数据服务栏目(交通出行)(三)利用层各地为了促进交通运输领域的开放数据利用,开展了一系
23、列利用促进活动,例如组织交通领域的行业小赛,在开放数据创新利用大赛中设置交通运输赛道赛题等,产出了一定数量的利用成果。这些利用成果主要覆盖了公交出行规划、停车场查询、交通政务服务、外卖配送、公路客运、公路货运、交通便利度评测、驾车路线规划、新能源充电桩查询、物流配送、航线查询等11个应用场景,其中,公交出行规划、停车场查询场景的成果数量最多,占全部利用成果的九成。利用成果的场景覆盖与典型示例如表12所示。035数林标杆报告对各地在交通运输领域的利用促进活动与利用成果进行了比较分析,在比赛举办、服务应用质量、创新方案质量、成果价值等方面筛选出部分标杆案例。表 12 交通运输领域利用成果覆盖的应用
【研报】农林牧渔行业巴西JBS专题报告:砥砺六十载打造全球肉食帝国-20200407[21页].pdf
【研报】有色金属行业锂想系列2:氢氧化锂的大时代-20200116[37页].pdf
领英:人才多元化洞察报告(29页).pdf
【研报】农林牧渔行业粮食安全专题报告:海外粮食出口限制短期无忧转基因商业化或加速-20200402[18页].pdf
【研报】有色金属行业深度:重视贵金属的配置价值-20200424[17页].pdf
互链脉搏:2019中国技术团队公链技术发展报告(21页).pdf
高德地图:2019年国庆节自驾游安全提示(29页).pdf
佩信集团:2020招聘与灵活用工研究趋势报告(28页).pdf
脉脉数据研究院:2019春招季人才市场趋势报告(34页).pdf
蜜雪冰城招股说明书-连锁茶饮第一股(724页).pdf
麦肯锡:2023中国消费者报告:韧性时代(33页).pdf
线上健身第一股-keep招股说明书(463页).pdf
罗振宇2023“时间的朋友”跨年演讲完整PDF.pdf
QuestMobile:2022新中产人群洞察报告(37页).pdf
小红书:2023年度生活趋势报告(34页).pdf
QuestMobile:2022年中国短视频直播电商发展洞察报告(30页).pdf
工业4.0俱乐部:ChatGPT认知白皮书(151页).pdf
町芒:2022现制茶饮行业研究报告(47页).pdf
哈尔滨工业大学:ChatGPT调研报告(94页).pdf