当前位置:首页 > 报告详情

初佳明-DeepSeek R1技术复现和大模型的治理与安全.pdf

上传人: 哆哆 编号:631170 2025-04-19 43页 19.72MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了DeepSeek系列模型的发展历程,包括通用模型和专用模型。通用模型包括DeepSeek LLM、DeepSeek-V2和DeepSeek-V3,它们在参数数量、训练数据和性能上都有显著的提升。专用模型包括DeepSeekMath、DeepSeek-Coder和DeepSeek-Coder-V2,它们在数学推理、编程和代码智能方面有较强的能力。此外,文章还介绍了DeepSeek-R1模型,它是基于DeepSeek-V3采用Reasoning方式基于强化学习训练的复杂推理模型,在很多任务场景效果超过O1。文章还讨论了针对大语言模型的红队攻击,以及AI的安全与治理,包括内生安全、衍生安全和社会伦理等方面。
如何确保大模型在遭遇攻击时仍保持可信度? 如何评估和消除AI系统扩展带来的社会不公平和歧视? 如何构建大模型安全高质量评估体系?
客服
商务合作
小程序
服务号
折叠