《计算机设备行业:国产大模型进展快速Deepseek~V2和通义千问2.5均展现强大性能-240513(15页).pdf》由会员分享,可在线阅读,更多相关《计算机设备行业:国产大模型进展快速Deepseek~V2和通义千问2.5均展现强大性能-240513(15页).pdf(15页珍藏版)》请在三个皮匠报告上搜索。
1、 本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。证券研究报告证券研究报告行业动态行业动态 国产大模型进展快速,国产大模型进展快速,DeepseekDeepseek-V2V2 和通义千和通义千问问 2.52.5 均展现强大性能均展现强大性能 核心观点核心观点 1.幻方子公司 DeepSeek 发布了新的 MoE(混合专家网络)大模型 DeepSeek-V2,模型表现优秀,相比 V1 的稠密模型,Deepseek-V2 节约了
2、42.5%的训练成本,减少了推理时93.3%的 KV-cache 显存占用,将生成的吞吐量也提升到了原来的 5.76 倍。同时 API 调用定价低至每百万输入 Tokens 仅 1 元,具有极高的性价比。2.阿里云正式发布通义千问 2.5 大模型,模型在中文语境下的性能超越了 GPT-4 Turbo。相比上一代通义千问 2.1 版本,通义千问 2.5 在理解能力、逻辑推理、指令遵循、代码能力上全方位提升。同时阿里还开源了 Qwen1.5-110B 模型,该模型性能超越 Llama-3-70B,有超 1000 亿参数,可以处理 32K tokens 的上下文长度,并支持多种语言。产业要闻【阿里云
3、通义千问【阿里云通义千问 2.5 大模型发布】大模型发布】【谷歌【谷歌 AlphaFold 3 模型登模型登 Nature】【三星【三星 AI 推理芯片推理芯片 Mach-1 即将原型试产】即将原型试产】【三星停止自动驾驶研究】【三星停止自动驾驶研究】【英国无人驾驶汽车公司【英国无人驾驶汽车公司 Wayve 获得获得 10 亿美元融资】亿美元融资】【美科镜头新品官宣】【美科镜头新品官宣】持续关注:GPU:英伟达、超威半导体、海光信息等;FPGA:安路科技-U 等;SoC:高通、全志科技等;自然语言处理:科大讯飞等;计算机视觉:格灵深瞳-U 等;自动驾驶:德赛西威、中科创达、均胜电子、光庭信息;
4、智慧交通:千方科技、万集科技;AI+工业:中控技术、华大九天、广立微、概伦电子等。风险提示:北美经济衰退预期逐步增强,宏观环境存在较大的不确定性,国际环境变化影响供应链及海外拓展;芯片紧缺可能影响相关公司的正常生产和交付,公司出货不及预期。首次评级首次评级 强于大市强于大市 于芳博于芳博 010-86451607 SAC 编号:S1440522030001 发布日期:2024 年 05 月 13 日 市场表现市场表现 相关研究报告相关研究报告 2024-05-06【中信建投计算机】:周报 24 年第18 期:看多 5 月行情,关注 AI 与低位基本面改善标的 2024-05-05【中信建投人工
5、智能】:北美四大云厂商资本开支大幅增长,牵引算力产业高速发展 2024-04-28【中信建投计算机】:行业持仓有所回落,建议关注 AI 与低空经济板块 2024-04-26【中信建投计算机】:北京算力基础设施政策出台,国产算力有望显著受益 2024-04-21【中信建投计算机】:持续关注低空经济及 AI 板块 -40%-20%0%20%2023/5/152023/6/152023/7/152023/8/152023/9/152023/10/152023/11/152023/12/152024/1/152024/2/152024/3/152024/4/15计算机上证指数计算机设备计算机设备 计算
6、机设备计算机设备 行业动态报告 请务必阅读正文之后的免责条款和声明。目录目录 一、行业变化.1 1.1 幻方子公司 DeepSeek 发布新 MoE 大模型 DeepSeek-V2.1 1.2 通义千问开源 Qwen1.5-110B 模型性能超越 Llama-3-70B.3 1.3 阿里云发布通义千问 2.5,模型中文语境下性能超越 GPT-4Turbo.4 二、持续关注标的.5 三、行情回顾.5 四、产业要闻.8 五、重要公告.9 风险分析.11 图目录 图 1:大模型中文能力与官方 API 定价对比.1 图 2:Deepseek-V2 和其他模型的评价基准指标数值对比.2 图 3:Deep