报告预览

360数字安全集团：2025大模型安全白皮书（30页）.pdf

编号：964359

PDF PPTX 30页 11.51MB 下载积分：VIP专享

下载报告请您先登录！

360数字安全集团：2025大模型安全白皮书（30页）.pdf

1、让AI世界更安全更美好安全向善可信可控据IDC预测，到2030年，人工智能将为全球带来22.3万亿美元经济收入，大模型正驱动百行千业智能化变革，而开源大模型在性能提升、部署成本降低的推动下，加速向政务、金融、能源等重点行业落地，安全风险也随之渗透到全生命周期：从模型层的提示注入、越狱攻击，到数据层的敏感信息泄露，再到应用层的智能体越权，任何一处漏洞都可能威胁个人、企业国家的财产安全，甚至是生命安全。清晰的网络安全边界正不断消融、趋于模糊，并延伸至大模型的全链路安全，传统基于规则和特征匹配的防御体系已然失效。我们正在从传统的“网络安全”时代，迈入以“大模型安全”为核心挑战的新阶段。当前威胁呈现指

2、数级演化态势：一方面，攻击面急剧扩大，针对算力基础设施的劫持、供应链中的恶意模型文件、以及利用LangChain等框架漏洞的新型攻击，表明风险已深度嵌入技术底座。另一方面，攻击主体高度“平民化”，自然语言取代专业代码成为攻击武器，提示注入、越狱攻击让“全民黑客”从概念走向现实，极大降低了网络犯罪门槛。与此同时，模型固有的“幻觉”问题、智能体在工具调用中的越权风险、以及数据泄露与知识污染，共同构成了一个多维、动态、交织的复杂威胁矩阵。在此背景下，360主张：必须采用以AI对抗AI、原生融合安全的新范式来应对大模型时代的安全挑战。我们提出“外筑以模治模动态屏障，内固平台原生安全底座的核心理念，将安

3、全能力内嵌于大模型的构建、训练、部署与运营的全过程。通过构建一个纵深防御、动态演化的全景框架，从基础设施安全、内容与价值对齐、幻觉缓解到智能体行为管控，实现从“网络安全”到“大模型安全”的范式升维，为人工智能时代提供一个“安全、向善、可信、可控”的底座。面对这一全球性挑战，中国开创了“发展与安全并重”的敏捷治理之路，以生成式人工智能服务管理暂行办法为代表的“包容审慎、分类分级”原则，为技术创新与风险防控提供了动态平衡的框架。0102本白皮书系统性地论证了大模型安全正经历从传统网络边界防御到原生、全栈、智能动态防御的范式转移，并提出“外筑以模治模动态屏障，内固平台原生安全底座”的核心理念，覆盖“

4、安全、向善、可信、可控”四大支柱的全景安全框架，构建智能时代的核心免疫系统。5.生存之道：开放共生，生态共治大模型安全的复杂性、全局性，决定了仅靠单一力量的技术或资源难以实现全链路、全场景的大模型安全治理。必须通过标准共建、产学研协同例如开源安全模型、共建联合平台，以及组建产业联盟等形式，汇聚各方力量，共同打造智能时代可信、向善的安全基底。这既是产业发展的必然要求，也是国家层面的战略需求。4.应对之道：以模治模+平台原生安全360提出的“以模治模+平台原生安全”是应对新范式的技术必然。它通过专用安全大模型，例如风险检测、幻觉纠正与红蓝对抗模型，对抗通用大模型风险，它既具备“外挂式”插件的灵活快

5、速，又兼具“原生式”的深度安全能力，实现了双向赋能的协同防御，构筑起从模型、数据、内容到行为的全链路深度防护体系。1.风险之变：从边界防御到全栈免疫大模型安全风险是系统性、全栈式的。它贯穿基础设施、模型层、数据层、智能体层及用户端五大层次，具体表现为算力劫持、供应链投毒、内容越狱、模型幻觉、知识污染、隐私泄露、行为失控以及工具滥用等诸多方面，共同构成了一个传统安全方案无法应对的复杂威胁立体空间。2.攻击之变：从专业黑客到全民黑客攻击技术持续向高端化演进，例如针对框架和基础设施的深度利用；与此同时，攻击主体则日趋平民化，“自然语言黑客”的出现极大降低了攻击门槛。这导致攻防不对称性加剧，必须发展出

6、同等智能、动态感知的防御体系。3.治理之智：中国特色的“发展与安全”平衡术中国的治理模式采用“发展与安全并重”的动态平衡策略。通过“包容审慎、分类分级”的监管框架，既划定安全底线，又为技术快速迭代预留了弹性空间，为产业创新提供了关键的政策窗口期。核心观点引言：外筑内固，构建大模型安全全链路防护体系大模型安全白皮书安全向善可信可控让AI世界更安全更美好三六零数字安全科技集团有限公司（或称“360”）提醒您在阅读或使用本文档之前，仔细阅读、充分理解本法律声明的全部内容。您对本文档的任何阅读或使用行为，即视为您已认可并同意接受本声明的全部约束。5.遵守法律您在使用本文档及其中所述技术时，应严格遵守

友情提示

1、下载报告失败解决办法
2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。
3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

本文（360数字安全集团：2025大模型安全白皮书（30页）.pdf）为本站（YY）主动上传，三个皮匠报告文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三个皮匠报告文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。