WPS：DeepSeek洞察及行业影响.pdf

上传人：淘***

编号：624663

2025-03-31

PDF 15页 3.60MB

《WPS：DeepSeek洞察及行业影响.pdf》由会员分享，可在线阅读，更多相关《WPS：DeepSeek洞察及行业影响.pdf（15页珍藏版）》请在三个皮匠报告上搜索。

1、DeepSeek洞察及行业影响单击此处添加副标题汇报人：WPSDeepSeek出了什么产品？为什么在国内外引起如此反响？对各行业AI的应用有什么影响？DeepSeek是在什么宏观背景产生的？缺乏根技术支撑科研和商业应用主要构建在国外生态上 A国AI产业在芯片、学习框架、核心算法等根技术层领先。中国AI产业偏重于应用，在互联网、安防、金融等领域取得了一定进展，但底座构建在国外生态上，缺乏根技术支撑。ViT、Switch-CAI应用大模型AI平台学习框架计算架构AI芯片芯片对华产品出口限制升级芯片模型开源数据SME单芯片全产业链单边管制多边管制NSCAI报告中，中国出现670次，俄罗斯(64)、

2、日本(61)、韩国(29)，英国(28)，印度(28)、法国(24)、德国(15)禁止出口高性能芯片到中国：22年10月，禁A100/H100，23年禁A800/H800、以及AMD和Intel高性能AI芯片等限制A国云服务厂家为中国提供智能训练算力服务A国加大对华人工智能管理NSCAI发布报告，将联合盟友对华AI全面限制A国禁令层层加码，步步紧逼，全面遏制中国人工智能产业国禁令层层加码，步步紧逼，全面遏制中国人工智能产业Start引领新模式2023年5月由对冲基金幻方量化实际控制人梁文峰成立2024年5月价格低于同行，在滑铁卢大学老虎实验室的LLM排名中位列第七。2023年11月2日发布首个

3、模型DeepSeek coder，免费供商业使用且完全开源2024年12月26日671B亿参数，仅55天训练，十分之一的成本，（558万美元），超越Llama 3.1和Qwen 2.5，与GPT-4 O相当。2023年11月29日推出DeepSeek LLM，参数规模达670亿，同时发布聊天版本DeepSeek Chat。2025年1月20日比肩OpenAI o1，支持模型蒸馏，国产AI迎来里程碑时刻2024年11月宣称在逻辑推理、数学推理和实时问题解决等任务上超越OpenAI O1，但华尔街日报测试发现OpenAI O1在部分问题上更快。2023年8月华为云开始与DeepSeek合作，并在1

4、2月业务上量华为云合作幻方量化第一私募DeepSeek成立DeepSeek coder发布LLM发布聊天版本DeepSeek V2发布DeepSeek R1-Lite-Preview发布DeepSeek-V3发布25年1月，165个国家deepseek APP下载榜单第一DeepSeek R1发布1月31日，微软、英伟达、亚马逊全部接入DeepSeek！1月底，deepseek遭受黑客攻击，美国科技股蒸发万亿DeepSeek：23年年5月成立持续走开源道路，月成立持续走开源道路，24年底发布年底发布AI核弹级核弹级产品震惊全球产品震惊全球数学+编程领域大幅领先，DeepSeek-V3训

5、练成本不足Meta/OpenAI的10%，DeepSeek-R1推理成本仅为OpenAI o1的3%，成为开源模型SOTA。低成本完美对标OpenAI O1，突破精确语义理解及复杂推理任务绕过CUDA挖掘FP8硬件潜力，MOE和MLA技术实现不到10%的成本方案性能优低成本技术创新150M$Llama3.1-405B训练成本 5.57M$DeepSeekV3训练成本 DeepSeek-R1推理成本仅为OpenAI o1的3%数学、科学和代码等领域领先业界，成为业界公认的LLM的领先模型来源：DeepSeek模型测试数据&互联网硬件级、算法级、架构级、工程级、开源生态5大技术创新，轰动全球硬件级

6、优化算法革命架构创新工程奇迹开源生态绕过CUDA进行PTX编程计算与通信优化，性能提升30%GRPO：群体进化的智慧筛选器自我验证机制：AI的错题本系统混合专家模型的智能路由器“多头潜在注意力MLA：空间压缩术训练框架加速：16到3的量化压缩，通信降低89%推理加速：预加载，动态批处理等模型、数据、工具链、部署全开源蒸馏技术使能第三方模型性能DeepSeek大模型解读：完全开源大模型解读：完全开源+免费商用，挑战免费商用，挑战A国国AI霸权霸权Deepseek V3训练（H800）成本（DeepSeek官方论文披露）技术报告披露共557.6万美元，合0.39亿元2788K GPU

WPS：DeepSeek洞察及行业影响.pdf

相关报告