
半导体 V3 的训练成本具有极大的经济性,根据 DeepSeek-R1 Technical Report 的数据,在预训练阶段,每处理 1 万亿 tokens,训练 DeepSeek-V3 仅需 18 万 H800 GPU 小时,即在 2048 块H800 GPU 的集群上需要 3.7 天;因此,DeepSeek-V3 的预训练阶段在不到两个月内完成,耗时 266.4 万(2664K)GPU 小时;加上上下文长度扩展所需的 11.9 万 GPU 小时和后训练所需的 5 千 GPU 小时,DeepSeek-V3 的完整训练仅需 278.8 万 GPU 小时;假设 H800 GPU的租赁价格为每小时 2 美元,DeepSeek-V3 的总训练成本仅为 557.6 万美元。2025 年 1 月20 日 DeepSeek-R1 正式发布,其 API 定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元;OpenAl o1 定价为每百万输入 tokens 55 元(缓存命中)/110 元(缓存未命中),每百万输出 tokens 438 元;DeepSeek-R1 API 调用成本不到 OpenAl o1 的 5%。DeepSeek-V3 性能对标 GPT-4o,DeepSeek-R1 性能对标 OpenAI