
DeepSeek 技术创新引领 AI 产业变革。随着 2024 年底以及 2025 年初深度求索发布DeepSeek-V3 和 DeepSeek-R1 模型,凭借一系列独创性和改进性技术以及精妙的策略,实现了与全球最强 AI模型的匹敌,标志着我国在 AI大模型领域实现技术突破。训练端,DeepSeek通过自研 DualPipe 训练框架、8位浮点量化技术、改进的 MoE和MTP 等创新技术,有效提升了计算效率,大幅降低训练成本。推理端,DeepSeek通过MLA 技术、改进的 RL和蒸馏技术,大幅提升了推理效率,其性能可与全球顶尖 AI模型匹敌。我们认为,凭借架构和算法的优化以及全面开源策略,DeepSeek 有望引领全球 AI大模型技术革新,加速 AI大模型在各个领域的应用落地。