1、 1 3 版权声明版权声明 本指引版权属于开源法律治理课题组及成员单位所有,受法律保护。转载、摘编或利用其它方式使用本指引的,应注明来源。违反上述声明者,本课题组及成员单位将追究其相关法律责任。4 编写团队编写团队 开源法律治理课题组指导开源法律治理课题组指导单位单位:上海市人工智能社会治理协同创新中心上海市人工智能社会治理协同创新中心 同济大学法学院互联网与人工智能法律研究中心同济大学法学院互联网与人工智能法律研究中心 哔哩哔哩法务团队哔哩哔哩法务团队 2025 年版本起草人:(姓氏笔画为序)年版本起草人:(姓氏笔画为序)朱尧、刘烨、陈沪楠、张韬略、曹蕾、曾逸然、廖慧姣朱尧、刘烨、陈沪楠、张
2、韬略、曹蕾、曾逸然、廖慧姣 基金基金项目:项目:本本研究研究报告报告获得获得上海市科学技术委员会科技创新行动计划上海市科学技术委员会科技创新行动计划-软软科学项目“开源人工智能的法律风险及防控研究”(项目批科学项目“开源人工智能的法律风险及防控研究”(项目批准号:准号:25692106900)的)的资助资助 5 执行摘要执行摘要 1.研究背景与具体问题研究背景与具体问题 随着人工智能(AI)技术从传统的“开源软件”时代迈向“开源大模型”时代,开源已成为推动技术创新和打破科技垄断的重要力量。然而,开源大模型涉及代码、参数(权重)、数据等复杂组件,其法律属性、私法保护及合规义务远比传统软件复杂。本
3、报告由本报告由同济大学互联网与人工智能法律研究中心、上海市人工智能社会治理协同创新中心及哔哩同济大学互联网与人工智能法律研究中心、上海市人工智能社会治理协同创新中心及哔哩哔哩法务团队联合组建课题组编写,旨在识别开源大模型全生命周期(孵化期与市场化期)哔哩法务团队联合组建课题组编写,旨在识别开源大模型全生命周期(孵化期与市场化期)中的法律风险,并为企业提供系统的合规与防范建议。中的法律风险,并为企业提供系统的合规与防范建议。目前业界对“开源”定义未达成共识,存在从“完全封闭”到“完全开放”的多种形态。其中,“开放权重”(Open Weights)成为当前高性能模型发布的主流策略(如 Meta的
4、LLaMA 系列)。开源开源 AI 不再仅仅是代码的开放,还涉及人工智能模型本体,即包括实不再仅仅是代码的开放,还涉及人工智能模型本体,即包括实现与运行模型所需的各类技术组件,如模型权重、训练数据和算法,以及模型的衍生物,现与运行模型所需的各类技术组件,如模型权重、训练数据和算法,以及模型的衍生物,即基于模型生成的输出内容即基于模型生成的输出内容。通过分析,上述开放对象分别可享有一定的通过分析,上述开放对象分别可享有一定的民事权益民事权益。代码 数据 参数 输出 著作权 商业秘密 专利 数据权益 注:表示司法裁判有争议,个案可能出现支持或反对的结果。本报告本报告将开源大模型的生命周期划分为“孵
5、化阶段”与“市场化阶段”。将开源大模型的生命周期划分为“孵化阶段”与“市场化阶段”。孵化阶段指从人工智能项目立项、开源发布前的技术准备和开发阶段、开源项目发布阶段、发布后的社区运营和维护、最后到项目逐步成熟到足以转化为产品或服务的整个时期。市场化阶段指开源模型已经孵化成功后,由开源项目管理者或者第三方以模型供应商、服务提供者的身份向市场推广应用。尽管闭源模型(如最新的GPT 系列)在性能上仍占优势,但开源模型(如DeepSeek、Qwen、LLaMA 等)正在迅速追赶,促使更多企业采用“小模型开源、大模型闭源”或更多企业采用“小模型开源、大模型闭源”或“代差开源”的混合策略“代差开源”的混合策
6、略。传统的开源软件许可证(如传统的开源软件许可证(如 Apache 2.0)难以完全覆盖)难以完全覆盖 AI 的复的复杂性杂性。新型许可证如 RAIL(负责任 AI 许可证)和 LLaMA 系列许可证应运而生,它们引 6 入了“行为限制”(如禁止军事用途、限制大规模商用)等新型内容条款。2.孵化阶段的风险识别孵化阶段的风险识别(1)规划阶段:战略决策与权属厘清)规划阶段:战略决策与权属厘清 知识产权归属风险:企业需在开源前开展尽职调查,确保对拟开源的大模型及组件享有完整所有权,需排查职务作品、委托开发或合作开发合同中的权属约定,防止第三方干涉。资产流失风险:开源可能导致商业秘密(如核心算法、参