1、构建成长式开源生态:挑战和未来周明辉北京大学计算机学院教授、副院长中国计算机学会开源发展委员会副主任zhmhoss-lab.北京大学0101开源挑战0 02 2研究路线0 03 3未来愿景开 源 挑 战开源生态驱动全球科技创新一种全球化软件创新与产业循环系统,汇聚了数千万开发者和数以亿计的开源代码仓库,是当前全球科技创新的重要引擎技术创新和产业发展持续深度融合 GitHub开发者100M+开源仓库284M+贡献者开源项目开源社区用户企业科研院所开源组织产业联盟集成商渠道商政府产业媒体学术媒体捐献者生态系统持续发展 Gitee开发者12M+开源仓库28M+开源生态成为国家战略资源开源生态系统深度
2、融入国家科技和产业发展,开源生态成为国家资产参与国际竞争和博弈美国修改法案限制AI开源开源在包括超级计算机、云计算和人工智能等基础和前沿技术领域都起着主导作用 突然限制访问,没有提前警告 根据用户国际限制限制访问GitHub Pages限制访问私有仓库限制创建新的私有仓库限制删除公有仓库1993年V1.0(10万行)发展为2019年V5.1(2500万行)超过500个不同版本的LinuxTop-500超算100%运行Linux79%以上的公司应用Docker容器Openstack使硬件维护成降低59%82%以上的手机市场占有率2030年深度学习带来15.7万亿的GDP增收;中国增幅预计为26.
3、1%主流深度学习框架全部开源计算机互联网人工智能开源生态成为国家重要战略国家“十四五”规划和2035年远景目标纲要、“七部门”实施意见将开源生态建设纳入战略任务支持数字技术开源社区创新联合体发展,完善开源知识产权和法律体系,鼓励企业开放软件源代码、硬件设计和应用服务做优信息服务产品。.推广开源技术,建设开源社区,构建开源生态体系。探索以区块链为核心技术、以数据为关键要素,构建下一代互联网创新应用和数字化生态我国开源亟需有效方法和基础设施支持生态培育和发展我国开源要素逐步成形,亟需行之有效的理论与关键技术,以及基础设施给予支撑,才能形成生态直至引领全球产业创新发展典型开源生态构建模式面临挑战开源
4、发展40年形成了经典生态构建方法,面临严峻挑战关键技术挑战经典方法主要挑战自由式开源生态构建个体参与者为主体以优秀项目为核心自组织协作垄断式开源生态构建大企业主导企业自身项目开源/主导已有开源强组织模式开源生态边界开放且内部协作快速演化社区参与与主体多样且行为高度不确定软件制品间依赖复杂且持续动态变化开源生态的持续治理开源社群的持续激发开源制品的可信保障挑战1挑战2挑战3研 究 路 线应对挑战的研究路线图国际开源生态系统1.生态建模2.技术突破3.设施构建4.公益示范我国开源生态系统生态要素量化成长演化模型开放式过程治理技术多元化社群激发技术高可信制品保障技术开源服务机构开源社区平台开源生态工
5、具开源治理标准开源许可证成长式融合型开源生态基础设成长式融合型开源生态基础设施施研究方法:数据驱动的开源生态的度量和智能化支持开源大数据海量案例和实践复杂系统原理和技术复杂系统/开源开发的机制机理、方法技术、和支撑工具开放式过程治理:多实体协作竞争问题 问题:商业实体与自由个体如何合作博弈塑造生态 研究:量化商业实体参与开源的一系列策略和行动,提炼商业参与模式,并揭示不同模式对志愿者留存影响,支持精准理解商业力量如何协作博弈并塑造开源生态开源生态成长式构建关键技术开放式过程治理成长式融合型开源生态基础设施多样化社群激发高可信制品保障挑战性问题参与实体多样竞争协作不可控影响不可控关键突破精准度量
6、商业参与模式及行为精准度量商业参与对社区贡献者流失的影响发现协作度对开发效率有11.8倍的影响技术突破关键突破理论和模型方法技术公司参与度量社交网络分析影响质量数据集研究成果引领开源商业参与研究方向公司参与模式TSE16&TSE19(CCF-A)公司协作模式ICSE20(CCF-A)公司主导模式FSE22(CCF-A)公司撤出模式TOSEM22(CCF-A)雇员与志愿者对比分析ICSE24(CCF-A)多元化社群激发:新手进阶式融入 问题:新手加入开源社区难度大 研究:研发开发者进阶式融入支撑技术:提炼出新手友好任务的多维度特征,并开发了GFI自动化推荐系统,引领了关于新手任务的一系列国际前沿