
DeepSeek-R1 发布,模型性能对齐 OpenAI-o1 正式版。2025 年 1 月 20 日,北京深度求索科技有限公司正式发布了 DeepSeek-R1,并同步开源了模型权重。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 Opening o1 正式版。DeepSeek-R1 蒸馏了 6 个小模型,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1 mini 的效果。通过将 R1 模型知识蒸馏到轻量化模型中,不仅能够提升轻量化模型的性能,同时也会降低成本,有助于进一步加快端侧 AI 的发展。这一发布标志着人工智能领域的一个重要里程碑。