《WPS:DeepSeek洞察及行业影响.pdf》由会员分享,可在线阅读,更多相关《WPS:DeepSeek洞察及行业影响.pdf(15页珍藏版)》请在三个皮匠报告上搜索。
1、DeepSeek洞察及行业影响单击此处添加副标题汇报人:WPSDeepSeek出了什么产品?为什么在国内外引起如此反响?对各行业AI的应用有什么影响?DeepSeek是在什么宏观背景产生的?缺乏根技术支撑科研和商业应用主要构建在国外生态上 A国AI产业在芯片、学习框架、核心算法等根技术层领先。中国AI产业偏重于应用,在互联网、安防、金融等领域取得了一定进展,但底座构建在国外生态上,缺乏根技术支撑。ViT、Switch-CAI应用大模型AI平台学习框架计算架构AI芯片芯片对华产品出口限制升级芯片模型开源数据SME单芯片 全产业链单边管制多边管制NSCAI报告中,中国出现670次,俄罗斯(64)、
2、日本(61)、韩国(29),英国(28),印度(28)、法国(24)、德国(15)禁止出口高性能芯片到中国:22年10月,禁A100/H100,23年禁A800/H800、以及AMD和Intel高性能AI芯片等限制A国云服务厂家为中国提供智能训练算力服务A国加大对华人工智能管理NSCAI发布报告,将联合盟友对华AI全面限制A国禁令层层加码,步步紧逼,全面遏制中国人工智能产业国禁令层层加码,步步紧逼,全面遏制中国人工智能产业Start引领新模式2023年5月由对冲基金幻方量化实际控制人梁文峰成立2024年5月价格低于同行,在滑铁卢大学老虎实验室的LLM排名中位列第七。2023年11月2日发布首个
3、模型DeepSeek coder,免费供商业使用且完全开源2024年12月26日671B亿参数,仅55天训练,十分之一的成本,(558万美元),超越Llama 3.1和Qwen 2.5,与GPT-4 O相当。2023年11月29日推出DeepSeek LLM,参数规模达670亿,同时发布聊天版本DeepSeek Chat。2025年1月20日比肩OpenAI o1,支持模型蒸馏,国产AI迎来里程碑时刻2024年11月宣称在逻辑推理、数学推理和实时问题解决等任务上超越OpenAI O1,但华尔街日报测试发现OpenAI O1在部分问题上更快。2023年8月华为云开始与DeepSeek合作,并在1
4、2月业务上量华 为 云 合 作幻方量化第一私募DeepSeek成立DeepSeek coder发布LLM发布聊天版本DeepSeek V2发布DeepSeek R1-Lite-Preview发布DeepSeek-V3发布25年1月,165个国家deepseek APP下载榜单第一DeepSeek R1发布1月31日,微软、英伟达、亚马逊全部接入DeepSeek!1月底,deepseek遭受黑客攻击,美国科技股蒸发万亿DeepSeek:23年年5月成立持续走开源道路,月成立持续走开源道路,24年底发布年底发布AI核弹级核弹级产品震惊全球产品震惊全球数学+编程领域大幅领先,DeepSeek-V3训
5、练成本不足Meta/OpenAI的10%,DeepSeek-R1推理成本仅为OpenAI o1的3%,成为开源模型SOTA。低成本完美对标OpenAI O1,突破精确语义理解及复杂推理任务绕过CUDA挖掘FP8硬件潜力,MOE和MLA技术实现不到10%的成本方案性能优低成本技术创新150M$Llama3.1-405B训练成本 5.57M$DeepSeekV3训练成本 DeepSeek-R1推理成本仅为OpenAI o1的3%数学、科学和代码等领域领先业界,成为业界公认的LLM的领先模型来源:DeepSeek模型测试数据&互联网硬件级、算法级、架构级、工程级、开源生态5大技术创新,轰动全球硬件级
6、优化算法革命架构创新工程奇迹开源生态 绕过CUDA进行PTX编程 计算与通信优化,性能提升30%GRPO:群体进化的智慧筛选器 自我验证机制:AI的错题本系统 混合专家模型的智能路由器“多头潜在注意力MLA:空间压缩术 训练框架加速:16到3的量化压缩,通信降低89%推理加速:预加载,动态批处理等 模型、数据、工具链、部署全开源 蒸馏技术使能第三方模型性能DeepSeek大模型解读:完全开源大模型解读:完全开源+免费商用,挑战免费商用,挑战A国国AI霸权霸权Deepseek V3训练(H800)成本(DeepSeek官方论文披露)技术报告披露共557.6万美元,合0.39亿元2788K GPU