《中国移动:我国人工智能大模型发展动态(2023)(12页).pdf》由会员分享,可在线阅读,更多相关《中国移动:我国人工智能大模型发展动态(2023)(12页).pdf(12页珍藏版)》请在三个皮匠报告上搜索。
1、我国人工智能大模型发展动态我国人工智能大模型发展动态中国移动研究院2023 年 4 月2/12摘要摘要国内大模型研发应用领域热潮持续高涨。据不完全统计,目前国内至少有 19 家企业及科研院所涉足人工智能大模型训练,主要分为大型科技公司、科研院校和初创科技团队三类。从大模从大模型的布局体系来看型的布局体系来看,百度、阿里、华为等大型科技公司从算力层、平台层、模型层、应用层进行了四位一体的全面布局,科研院校及初创科技公司主要以研发大模型算法及细分领域应用为主;从从大模型参数量看大模型参数量看,大型科技公司的参数量远大于科研院所,但基本都处于千亿及以上规模;从大模型应用方向看从大模型应用方向看,大部
2、分企业前期以内部应用为主,后续主要向 B 端企业拓展服务,预计少数企业将在 C 端市场形成规模。总体来说总体来说,业界普遍认为国内大模型与 GPT-3 的水平相当,与 GPT-4 仍有较大差距。3/12一、一、我国人工智能大模型总体情况我国人工智能大模型总体情况据不完全统计,截止到 2023 年 4 月 18 日,国内至少有 19家企业及科研院所涉足人工智能大模型训练,主要分为大型科技公司、科研院校和初创科技团队三类。具体来看:百度、阿里等12 家大型科技公司和中国科学院、清华大学等 3 家科研院校已经提供开放测试,或有明确的推出时间计划;字节跳动、搜狗创始人王小川、美团创始人王慧文、创新工场
3、创始人李开复等则是最近对外宣布组建团队,进军大模型研发领域。其中,字节跳动旗下火山引擎于 4 月 18 日发布自研 DPU(数据处理器)等系列云产品,推出新版机器学习平台,可以支持万卡级大模型训练、微秒级延迟网络,为预训练模型提供强大的算力支持。从大模型的布局体系来看从大模型的布局体系来看,科技大厂在算力层科技大厂在算力层、平台层平台层、模模型层型层、应用层进行了四位一体的全面布局应用层进行了四位一体的全面布局。百度、阿里、华为三家均从芯片到应用进行自主研发的全面布局,如百度的“昆仑芯+飞桨平台+文心大模型+行业应用”、阿里的“含光 800 芯片+M6-OFA 底座+通义大模型+行业应用”、华
4、为的“昇腾芯片+MindSpore 框架+盘古大模型+行业应用”。垂直行业科技企业和科研院校,主要以研发大模型算法及细分领域应用为主,自有算力相对薄弱,很少涉及芯片领域自主研发。从大模型参数量看从大模型参数量看,科技大厂的参数量远大于科研院所科技大厂的参数量远大于科研院所。科技大厂的大模型参数量较大:阿里通义千问大模型参数在 10 万亿级以上、腾讯混元大模型和华为盘古大模型参数量均在万亿级4/12以上、百度文心一言大模型参数量在 2 千亿级以上、京东言犀大模型的参数量为千亿级;垂直行业科技企业已经上线的参数量普遍在千亿级以上;而科研院校大模型的参数量在千亿级及以下。从大模型应用方向看从大模型应
5、用方向看,大部分企业前期以内部应用为主大部分企业前期以内部应用为主,后后续主要向续主要向 B B 端企业拓展服务端企业拓展服务,预计少数企业将在预计少数企业将在 C C 端市场形成规端市场形成规模模。目前,百度文心大模型、华为盘古大模型、中国科学院紫东太初大模型均在 B 端垂类市场积累了标杆应用案例,腾讯混元大模型、阿里通义大模型则更多聚焦公司自身业务。而在 C 端市场应用方面,百度文心一言、阿里通义千问、腾讯混元助手三类大模型最有可能向此方向拓展,但目前只有百度文心一言大模型正在进行友好客户测试,阿里通义千问大模型则计划在今年 9 月份进行公测,腾讯混元助手大模型则处于计划开发状态。从大模型
6、业界评估看从大模型业界评估看,国内大模型与国内大模型与 GPT-4GPT-4 有较大差距,但有较大差距,但科技大厂具备追赶实力。科技大厂具备追赶实力。目前国内大模型处于百花齐放的状态,但业界普遍认为,第一梯队当属百度第一梯队当属百度、阿里巴巴阿里巴巴、腾讯腾讯、华为四华为四家家。综合实力方面,四家企业在大模型研发投入、技术能力和人才团队实力较强;商用推进方面,四家企业均依托现有业务领域更容易形成大模型应用规模效应。5/126/12二、二、典型企业的大模型发展情况典型企业的大模型发展情况针对第一梯队整体布局的百度、阿里、华为、腾讯四家公司,以及垂直领域入局的商汤公司的进一步分析,发现各家企业在大