1、大模型落地与前沿趋势研究报告2024.12 量位智库 QbitAI Insights 分析师 Xuanhao 模型市场落地概况01目 录02模型落地与前沿发展趋势03模型玩家格局及竞争趋势模型市场落地概况:4信息来源:量位智库模型业务模式概览模型市场宏观和落地分布模型业务模式概览:主要包括应用开发部署平台、模型API服务及模型服务三部分,目前模型服务和模型API是核业务5信息来源:量位智库应用层模型层Infra+云 基于模型构建的AI产品 案写作、代码成、信息检索、海报制作、视频制作,智能客服、智能营销应用场景AI产品应用搭建模型服务模型APIGPU及配套基础设施 为用户提供API调用,主要包
2、括托管模型丰富度(自研及第三模型)、模型能、价格、API性能、安全合规等等因素 数据准备:训练数据的采集、选择、标注、清洗等 模型训练:包括预训练(pre-train)和微调(fine-tune)模型推理部署:帮结合业务场景需求帮助客户在云端和本地进模型推理部署 模型社区:搭建开源模型服务平台,提供多样化模型库、模型API服务、训练数据集等 算服务 GPU集群搭建 互联设施 数据中建设 包括AI应用的开发、部署、管理,帮助用户构建AI应用,核组件包括提示词程、RAG、插件态、应用编排等 最终产价值的落地场景描述示例互联/云厂商模型厂商推理平台重点展开模型服务:数据准备和模型训练是模型服务的关键
3、内容,对交付服务的深度和细致程度有较要求,是国内市场目前最重要的商业模式描述6信息来源:量位智库数据准备模型训练 环节:包括数据采集,数据评估、数据选择、数据标注、数据清洗、数据回流等 类型:业数据,即整个的垂直业的相关数据,例如医疗、融、制造、政务等业;场景数据,即垂直业内某场景的数据,例如客服、培训、产品开发、疾病问诊;企业数据,即和企业业务和自身属性相关的数据,例如产品信息、运营信息等应用现状 微调(Fine-tuning):在已经预训练好的模型基础上基于特定数据集进步调优,对算(百卡级)和数据(数百GB)的需求小,例如LORA,Adapter layer、Prefix Tuning等技
4、术 预训练(Pre-training):从头开始进预训练,要求有量的垂直相关数据资源和算,包括字、图像、视频、交互记录及其他特殊格式数据模型推理部署 云端部署:模型在云厂部署,使用模型时调用模型API,由云厂商负责所有运维 本地部署:自主可控,响应快、服务稳定保响应时长和调用频率、隐私、安全性强 混合部署:兼顾两种部署模式,具体依照业务场景的需求决定 数据准备是目前模型服务最核的问题,需要客户厘清数据的种类需求、格式需求等,在此过程中模型服务商需要和客户紧密合作,帮助客户梳理、准备数据 模型微调的数据需求在数百GB级别,以及少上万条的对话数据、交互数据,数据的质量直接决定模型的表现 需求画像:
5、以G端客户、中型B端客户为主,国央企、融等业是主要客户 模型服务是国内模型市场的核部分,贡献了目前业的部分营收 商业模式较重,需要模型厂商进交付服务,全流程服务客户,本质上是个*天投业务模式,但相较于软件、云业务的定制化交付服务要更加轻量化(不同客户的服务内容基本相同)分析 微调是目前最主流的服务式,效果好成本低,相应技术较成熟 预训练模型较少见,成本挑战,主要用来解决特殊问题,例如进蛋白质结构预测的AlphaFold 根据客户偏好和需求决定模型部署式,云端部署是主流式模型社区 汇聚各类模型信息、数据集、模型竞赛、技术内容分享的社区平台 主要目的是构建围绕模型的开发者态,促进态繁荣,例如阿里的
6、魔塔社区ModelScope重要性构成模型库模型API:国内各厂商模型能没有明显差异化,API市场的低价竞争阶段将长期持续,整体用量正在快速增加但难以贡献营收描述7信息来源:量位智库,1)Model as a Service 包括模型厂商的自研模型和第三开源模型(主要适用于云厂商,会提供MaaS1服务)模型能API性能 推理能:衡量模型智能的核指标,也包括指令遵从、内容合规、用户意图理解等 上下长度(Context window):模型支持的上下窗小,决定模型可以处理的任务复杂度上限 多模态能:包括字、图像、视频、音频等模态的理解、成、交互表现 API价格总体上呈快速下降趋势,和具体和调用量、