《InfoQ研究中心:中国开源生态图谱2022-数据库领域(24页).pdf》由会员分享,可在线阅读,更多相关《InfoQ研究中心:中国开源生态图谱2022-数据库领域(24页).pdf(24页珍藏版)》请在三个皮匠报告上搜索。
1、目目录录生态图谱解读01生态图谱企业洞察02生态图谱解读开源数据库4图数据库时序数据库空间数据库&向量数据库开源产业联盟代码托管平台开发者社区开源基金会键值数据库关系型数据库关系型数据库5定义&分类:中国数据库在2000年开始发展,虽然起步时间相较国外偏晚,但近几年增长态势旺盛,同时开源比例逐年上升。我国开源数据库产品主要集中在关系型阶段和后关系型阶段,并且以关系型数据库为主,占比约60%左右。数据统计结果显示,2021上半年中国关系型数据库软件市场规模为11.9亿美元,整体市场同比增长37.2%。发展特征:关系型开源数据库分为OLAP(分析型数据库)、OLTP(交易型数据库)和HTAP(混合
2、型关系数据库)三种。OLAP和OLTP数据库出现较早,HTAP数据库是混合OLTP和OLAP的应用体系结构,具有强一致性保证,并且融合了分布式能力,具备高扩展性。它在历史数据的集成和商业分析的实时性方面有很大的优势。HTAP也被认为是目前数据库发展的主流方向。在关系型开源数据库中,实现HTAP的开源数据库数量相对较少,大约占比20%。主要数据库产品包括PingCAP孵化的TiDB,百度孵化的BaikalDB、蚂蚁集团孵化的OceanBase、石原子孵化的StoneDB等。关系型数据库关系型数据库6应用场景:关系型开源数据库是占比最多的,并且应用场景非常广泛。价值追求:行业飞速发展下,企业在开源
3、数据库项目上,主要看中高扩展,高可用,强一致,高兼容,高性价比,容灾架构等技术特征。1电商新零售的HTAP解决方案2金融支付的索引方案3游戏行业的在线支持方案4线上教育的扩容方案5物联网提升运营效率和服务水平6软件服务的稳定性提升等领域关系型数据库非关系型数据库7图数据库时序数据库空间数据库&向量数据库键值数据库定义&分类:非关系型开源数据库主要分为图数据库、时序数据库、空间数据库、向量数据库、键值数据库。发展特征:如图数据库可以存储数据间的关系,形成由点到线的数据类型变化;空间数据库可以存储矢量数据,能够更好的支撑AI等研发场景的需求。01起步晚我国非关系数据库发展的历程更短但也更新颖,发展
4、的成熟度和应用范围远低于关系型数据库。02上云率非关系型数据库的上云率更高,甚至很多数据库是云原生数据库。03能力强更高的读写能力,更多样的格式,同时也更容易拓展,也就更适合处理一些非结构化数据、数据预测度较低的场景。非关系型数据库8应用场景:图数据库应用领域集中在平台、机器人等智能问答,知识领域的检索升级等情景。时序数据库经常应用于DevOps(包括服务和服务器)监控、物联网设备的监控与实时分析等场景。空间数据库为后起之秀,发展较晚应用前景较广,可以应用于元宇宙、自然资源、国土空间信息、智慧城市、生态气象等场景。键值数据库应用于电商的数据读取、视频直播类业务和游戏支持等数据量大、冷热分明的场
5、景。厂商分布:培育开源非关系型数据库的企业主要分为两类:自身业务有大规模非关系型数据存储和处理需求的头部互联网企业,如阿里、京东、腾讯、饿了么等。创新型软件服务创业型企业,如PingCAP、涛思数据等数据库厂商。图数据库时序数据库空间数据库&向量数据库键值数据库生态图谱企业洞察Gitee平台托管的开源项目10Gitee指数TOP 4Gitee指数68Gitee指数16Gitee指数9Gitee指数5说明1:本数据来自于Gitee官网(2022年10月);其他项目数据尚未更新。InfoQ开源项目指数数据说明11一级指标二级指标权重代码健康(40%)代码复制(Fork)10%已修复代码不足(Clo
6、sed Issue)10%项目更新申请(Pull Request)5%已完成项目更新申请(Closed Pull Request)15%社区活跃(60%)协作影响力10%项目荣誉星(Star)10%社区贡献量20%社区贡献者20%对于开源项目的评价,代码和社区是两项最直接评价指标。代码的健康度体现为社区成员不断地修复和更新代码,形成研发价值的指数级增长;代码健康指标中选取的数据维度来自开源项目在GitHub中的公开数据。社区活跃是保证开源价值最大化的根本,被开源世界公认的社区价值是评价开源项目最主要的要素,本次研究将其权重赋值超过代码健康;InfoQ研究中心认为,社区活跃价值整体评估高于代码健