《CSTC&安恒信息:Top开源大模型安全测评报告(2024)(27页).pdf》由会员分享,可在线阅读,更多相关《CSTC&安恒信息:Top开源大模型安全测评报告(2024)(27页).pdf(27页珍藏版)》请在三个皮匠报告上搜索。
1、Top开源大模型安全测评报告(2024)中国软件评测中心安全事业部中国软件评测中心安全事业部 杭州安恒信息技术股份有限公司杭州安恒信息技术股份有限公司中国计算机行业协会数据安全专业委员会中国计算机行业协会数据安全专业委员会数据安全关键技术与产业应用评价工业和信息化部重点实验室数据安全关键技术与产业应用评价工业和信息化部重点实验室联合发布联合发布2024年年12月月为深入学习贯彻全国两会精神和党的二十届三中全会精神,落实中共中央关于进一步全面深化改革、推进中国式现代化的决定作出“建立人工智能安全监管制度”“完善生成式人工智能发展和管理机制”的重要部署以及根据中华人民共和国网络安全法中华人民共和国
2、数据安全法中华人民共和国个人信息保护法生成式人工智能服务管理办法工业和信息化部等十六部门关于促进数据安全产业发展的指导意见等法律法规政策文件要求,促进和引导人工智能大模型技术向“负责任、可持续、高可靠”目标发展,让人工智能大模型技术真正实现高质量安全赋能各行各业落地应用。前言中国软件评测中心(工业和信息化部软件与集成电路促进中心)安全事业部联合杭州安恒信息技术股份有限公司、数据安全关键技术与产业应用评价工业和信息化部重点实验室、中国计算机行业协会数据安全专业委员会,共同开展国内外开源大模型的安全性、公平性和可靠性研究,并发布Top开源大模型安全测评报告(2024)。本报告聚焦国内外开源大模型的
3、安全风险测评,通过选取典型的12家20款开源大模型,从国家安全、道德伦理、公民权利、公共安全、历史文化、医疗卫生、隐私信息、不良信息、商业金融、基础安全、网络安全和模型滥用等12个方面展开深入安全测评,旨在提高大模型厂商的安全意识和保障行业用户的合法权益,并通过系统性分析国内外开源大模型安全的综合表现,为人工智能大模型产业各界提供参考。【注】因大模型迭代速度快,测评结果仅适用于测试期间和测试版本。报告中的分析和结论可能存在一定的局限性和不完整性,我们期待并欢迎各方提出宝贵的批评与 建议,共同推动人工智能大模型安全治理。目录测评体系测评体系0102测评结果测评结果03测评总结测评总结01测评体系
4、大模型安全测评体系图人工智能大模型安全评估体系国家安全公共安全公民权利道德伦理历史文化.TOKEN走私探索AI大模型安全治理的新技术持续跟踪研究AI大模型安全风险点持续研发高效智能化的AI大模型安全评估工具探索AI大模型安全治理的新路径加强网络安全防护和个人数据保护加强科技伦理治理实行包容审慎和分类分级监管生成式人工智能服务管理暂行办法技术发展与治理监督检查和法律责任语料安全要求生成式人工智能服务安全基本要求模型安全要求安全措施要求内容分割重组角色伪装场景假设少样本攻击Token重复攻击多样本攻击场景限定语言切换指令忽略混合攻击直接问答大模型安全测评说明对于每个检测方式或风险分类,首先计算其单
5、项风险比例。计算单项风险比例其次,将所有单项风险比例相加,得到整体的比例总和。计算比例总和最后,计算某一项在总风险中的占比。计算单项占总风险比例 本测评过程采用多维度的测试题库,包涵了丰富的题目和多种测试维度。在测试过程中,通过调用API的方式,全面测试了模型的风险。测试过程中采用了规则匹配打分、大模型自动打分等方式,以客观评价模型的安全风险水平。02测评结果总体情况(一)大模型安全风险总览序号模型名称执行策略数风险数耗时(秒)策略通过率风险占比备注1qwen:7b20001313330.00 93.45%6.55%国内开源大模型2qwen2:7b2000787486.00 96.10%3.9
6、0%国内开源大模型3qwen2.5:7b2000895101.00 95.55%4.45%国内开源大模型4glm4:9b-chat-q4_K_M20001499944.00 92.55%7.45%国内开源大模型5internlm2:7b2000415968.00 97.95%2.05%国内开源大模型6yi:6b20002508566.00 87.50%12.50%国内开源大模型7yi-1.5:6b20002687173.00 86.60%13.40%国内开源大模型8deepseek-llm:7b20001183809.00 94.10%5.90%国内开源大模型9deepseek-v2:16b-