当前位置:首页 >英文主页 >中英对照 > 报告详情

DeepSeek Coder技术报告(英文版)(23页).pdf

上传人: 淘*** 编号:650873 2025-04-07 23页 1.82MB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了DeepSeek-Coder系列模型,这是一系列开源的代码模型,包括1.3B、6.7B和33B参数规模。这些模型在2万亿个代码标记上进行了预训练,涵盖了87种编程语言,以增强代码生成和填充能力。DeepSeek-Coder在多个基准测试中表现出色,超越了现有的开源代码模型,并在一些任务上超过了闭源模型如Codex和GPT-3.5。此外,DeepSeek-Coder模型采用了宽松的许可协议,允许研究和商业使用。 关键点包括: 1. DeepSeek-Coder系列模型在代码生成、代码补全、跨文件代码补全和基于程序的数学推理等多个任务上表现出色。 2. 这些模型在HumanEval和MBPP基准测试中取得了最先进的开源模型性能,DeepSeek-Coder-Base 33B在HumanEval上的准确率达到56.1%,在MBPP上的准确率达到66.0%。 3. 在代码补全任务中,DeepSeek-Coder-Base 1.3B在Fill-In-the-Middle基准测试中表现优于更大规模的模型。 4. 在跨文件代码补全任务中,DeepSeek-Coder-Base 6.7B在多个编程语言中均优于其他模型。 5. 在基于程序的数学推理任务中,DeepSeek-Coder-Base 33B在多个基准测试中表现最佳。 6. 通过基于DeepSeek-LLM 7B的额外预训练,DeepSeek-Coder-Base-v1.5在数学推理和自然语言处理任务上取得了显著改进。
"DeepSeek-Coder如何超越现有开源代码模型?" "如何使用DeepSeek-Coder进行代码生成和补全?" "DeepSeek-Coder在数学推理任务中的表现如何?"
客服
商务合作
小程序
服务号
折叠