1、AI浪潮下的硬件创新长江证券研究所电子研究小组2023-05-06%1分析师及联系人证券研究报告 评级看好维持分析师杨洋SAC执业证书编号:S0490517070012电邮:%201大模型参数量快速提升,算力需求大幅增加02AI+Chiplet:信息革命的基石03服务器:算力的载体目 录0504边缘AI:内容与交互再升级%301大模型参数量快速提升,算力需求大幅增加%4 过去传统的人工智能偏向于分析能力,即通过分析一组数据,发现其中的规律和模式并用于其他多种用途,比如应用最为广泛的个性化推荐算法。而现在人工智能正在生成新的东西,而不是仅仅局限于分析已经存在的东西,实现了人工智能从感知理解世界到
2、生成创造世界的跃迁。因此,从这个意义上来看,广义的 AIGC 可以看作是像人类一样具备生成创造能力的 Al 技术,即生成式AI它可以基于训练数据和生成算法模型,自主生成创造新的文本、图像、音乐、视频、3D 交互内容(如虚拟化身、虚拟物品、虚拟环境)等各种形式的内容和数据,以及包括开启科学新发现创造新的价值和意义等。因此,AIGC 已经加速成为了AI 领域的新疆域,推动人工智能迎来下一个时代。ChatGPT:生成式AI引爆技术奇点01资料来源:AIGC发展趋势报告2023腾讯研究院,长江证券研究所内容创作模式的四个发展阶段文本领域代码领域图像领域视频/3D/游戏领域诈骗垃圾信息识别翻译基础问答回
3、应单行代码补足基础文案撰写初稿多行代码生成更长的文本二稿更长的代码更精确的表达艺术图标摄影3D/视频模型的初步尝试模仿(产品设计、建筑等)视频和3D文件的基础版/初稿二稿垂直领域的文案撰写实现可精调(论文等)支持更多语种领域更垂直终稿,水平高于人类平均值根据文本生成初版应用程序终稿(产品设计、建筑等)终稿,水平高于专业写手根据文本生成终版应用程序,比全职开发者水平更高终稿,水平高于专职艺术家、设计师等AI版Roblox可依个人梦想定制的游戏与电影2020年之前202020222023?2025?2030?大模型可用情况初步尝试基本实现未来潜力生成式AI技术的成熟应用进程时间表%5 大模型主要由
4、各大龙头企业推动,在国内科技公司中,阿里巴巴达摩院在2020年推出了M6大模型,百度在2021年推出了文心大模型,腾讯在2022年推出了混元AI大模型。大模型最核心的除了算法外主要是参数的设置,其中参数量(Params)形容模型的大小程度,类似于算法中的空间复杂度,往往参数量越大(复杂程度越高)的神经网络模型对算力的需求程度更高,复杂的神经网络模型的算法参数量约千亿级别甚至万亿级别,与已知应用级别的呈现指数级别的差异。这些模型不仅在参数量上达到了千亿级别,而且数据集规模也高达TB级别,想要完成这些大模型的训练,就至少需要投入超过1000PetaFlop/s-day的计算资源。大模型参数量快速提
5、升,算力需求大幅增加01资料来源:甲子光年,英伟达,长江证券研究所大模型的基础是庞大的算力基建2018年后大模型训练算力需求显著提升%6 大模型主要由各大龙头企业推动,在国内科技公司中,阿里巴巴达摩院在2020年推出了M6大模型,百度在2021年推出了文心大模型,腾讯在2022年推出了混元AI大模型。大模型最核心的除了算法外主要是参数的设置,其中参数量(Params)形容模型的大小程度,类似于算法中的空间复杂度,往往参数量越大(复杂程度越高)的神经网络模型对算力的需求程度更高,复杂的神经网络模型的算法参数量约千亿级别甚至万亿级别,与已知应用级别的呈现指数级别的差异。这些模型不仅在参数量上达到了
6、千亿级别,而且数据集规模也高达TB级别,想要完成这些大模型的训练,就至少需要投入超过1000PetaFlop/s-day的计算资源。大模型参数量快速提升,算力需求大幅增加01资料来源:StarLab,AIGC发展趋势报告2023腾讯研究院,长江证券研究所主要大模型建设情况厂商预训练模型应用参数量(亿)谷歌BERT语言理解与生成4810LaMDA对话系统-PaLM语言理解与生成、推理、代码生成5400Imagen语言理解与图像生成110Parti语言理解与图像生产200微软Florence视觉识别6.4Turing-NLG语言理解、生成170FacebookOPT-1758语言模型1750M2M