Deepseek模型迭代及发展历程 2025 年 1 月,DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI-o1正式版。同时DeepSeek开源R1推理模型,允许所有人在遵循MITLicense的情况下,蒸馏 R1训练其他模型。 产业概述 下载Excel 下载图片 原图定位