《《2023 中国开源年度报告》解读与开发者生态指南.pdf》由会员分享,可在线阅读,更多相关《《2023 中国开源年度报告》解读与开发者生态指南.pdf(51页珍藏版)》请在三个皮匠报告上搜索。
1、2023 2023 中国开源年度报告中国开源年度报告解读与开发者生态指南解读与开发者生态指南王王 伟伟华东师范大学华东师范大学X-lab X-lab 开放实验室开放实验室2024 年 3 月中国开源年度报告发展历史中国开源年度报告发展历史2019202020212022201620232024目目 录录调查对象调查对象:覆盖开发者、社区成员、贡献者、学生、政府企业管理人员调查内容调查内容:主要涵盖个人信息、工作状况、开源社区以及开发者技术等调查方法调查方法:以在线问卷方式搜集样本和数据,交叉对比法分析数据分发渠道分发渠道:开源社、KubeCon+Open Source Summit China
2、、2023 第八届中国开源年会、2023 开放原子开发者大会、2023 开源产业生态大会问题类型问题类型:单选、多选、开放性问题数量问题数量:43样本量样本量:875问卷篇问卷篇问卷篇问卷篇 受访者特征受访者特征问卷篇问卷篇 开源参与情况开源参与情况问卷篇问卷篇 开源参与情况开源参与情况问卷篇问卷篇 开源贡献情况开源贡献情况问卷篇问卷篇 社区运营调查社区运营调查问卷篇问卷篇 开源发展调研开源发展调研数据篇数据篇 预备知识(预备知识(OpenDiggerOpenDigger)OpenDigger 是一个面向开源协作数字生态的一站式数据挖掘与信息服务项目,目标是构建开源领域的数据基础设施,促进开源
3、生态的持续发展(特别是特别是实现了开源治理系列标准中的关键指标实现了开源治理系列标准中的关键指标)。所支持的开源领域数据包括 GitHub 和 Gitee 行为日志数据、制品库数据、安全漏洞数据、社区问答数据等。包括 Hypercrx、OpenLeaderboard、OpenGalaxy 等均是其下游开源项目。GitHub 行为日志数行为日志数 58 亿条亿条 Gitee 行为日志数行为日志数 1600 万条(部分)万条(部分)NPM/PyPI等制品库数据等制品库数据620万条万条 CVE 安全漏洞数据安全漏洞数据 16 万条万条 StackOverflow 问答帖问答帖 2500 万条万条
4、标签类数据,其中标签类数据,其中 GitHub 组织数量组织数量 413 个,涉及仓库数个,涉及仓库数 89427 个个数据篇数据篇 预备知识(预备知识(OpenRankOpenRank)OpenRank 指标指标基于开源开发者-项目协作关系网络构建的协作网络指标,不仅能够很好的表征项目的整体发展状态、社区参与度,同时也引入了开源生态的要素,能够很好地将开源生态中位于关键协作位置的项目、人、组织等实体识别并展示出来。OpenRank 目前已经得到了工业界和学术界的广泛认同,被包括标准院标准院系列开源治理标准、信通院信通院开源治理白皮书、开放原子开放原子开源基金会全球开源大屏、企业开源办公室企业
5、开源办公室治理工具箱等所广泛采纳。Shengyu Zhao et al:OpenRank Leaderboard:Motivating Open Source Collaborations Through Social Network Evaluation.ICSE,2024数据篇数据篇 整体框架整体框架第一部分总体宏观洞篇第一部分总体宏观洞篇,通过对基础事件、活跃仓库、活跃用户、开源许可证和编程语言等方面,揭示中国在全球开源生态中的全貌。第二部分第二部分 OpenRank 排行榜篇排行榜篇,提供了全球和中国各领域开源项目、企业、基金会、开发者以及协作机器人的排名。第三和第四部分为企业洞察篇和
6、基金会洞察篇第三和第四部分为企业洞察篇和基金会洞察篇,通过演变图和趋势分析,呈现了全球和中国企业、基金会在开源领域中的演化。第五部分技术领域洞察篇第五部分技术领域洞察篇,深入研究了各领域 Top10 榜单和项目变化情况,展示了前沿技术的发展方向和趋势。第六部分开源项目洞察篇第六部分开源项目洞察篇,深入探讨了不同项目类型、领域和主题的多样性和创新方向。第七部分开发者洞察篇第七部分开发者洞察篇,则通过对开发者类型、工作时间分布、地区分布和机器人使用情况的分析,展现开发者群体的多样性和工作特征。第八部分案例分析篇第八部分案例分析篇,通过一系列有趣的案例分析,从一个侧面让读者一窥中国开源生态的蓬勃发展