1、证券研究报告报告评级:强于大市AI应用专题:应用专题:百花齐放,静待杀手级别应用百花齐放,静待杀手级别应用国联证券传媒互联网研究团队国联证券传媒互联网研究团队2024年年2月月27日日目录录第一部分第一部分第二部分第二部分第三部分第三部分第四部分第四部分AI产业研究框架&海内外生态概览B端应用:从通用场景到垂直赛道C端应用:头部格局稳定,静待杀手级应用2024年,还有哪些值得期待?OX3U2UCWOZBVPZ6MdN7NmOqQoMrNkPnNtReRoMyQ8OmNnMwMrQvMvPtOtO1 1、AIAI产业产业研究框架研究框架&海内外海内外生态概览生态概览1.1 AI产业产业研究框架研
2、究框架&海外海外生态概览生态概览4基建层基建层模型层模型层中间件中间件应用层应用层数据准备数据准备-数据标注数据标注-模型训练模型训练-实验管理实验管理-模型部署模型部署-产品整合产品整合 硬件硬件C端应用端应用基建层:基建层:AI硬件及云服务硬件及云服务。以 NVIDIA 为首的AI硬件硬件算力算力进步使大模型的单次训练成本降至可以接受的1000万美元以下;同时以Azure为首的云服务厂商云服务厂商集成了算力资源和AI 建模的能力,也将成为基础设施的重要部分。模型层:模型层:AI模型及算法模型及算法。以OpenAI为首的研究机构连续发布了文本、图片等多模态生成的高质量模型,其中对话和图片产出
3、内容质量之高使其短期内成为提高内容生产效率的工具,长期将引领下一代交互方式长期将引领下一代交互方式、成为新的流量入口成为新的流量入口。中间件:中间件:MLOps等等AI infra。底层模型和上层应用之间的中间件,包括模型训练、模型推理两大板块中的各个细分环节,代表公司包括scale AI、pinecone等。中期,随着上游大模型厂商“军备竞赛”,中间件作为“卖武器”的公司有望持续受益。应用层:应用层:B端及端及C端端AI应用应用。得益于上游分摊了大量研发成本,下游应用针对垂直应用场景定制小模型,满足特定的用户需求,实现商业化变现。目前从落地节落地节奏奏来看,2B快于2C,工具类快于社交/内容
4、类。B端应用端应用云服务云服务由于基建层由于基建层、模型层竞争格局已较为稳定模型层竞争格局已较为稳定,硅硅谷投资人主要关注中间件谷投资人主要关注中间件、应用层的初创企业应用层的初创企业。资料来源:海外独角兽,国联证券研究所整理1.2 中间中间件:从大模型训练工作流程件:从大模型训练工作流程看看AI infra机会机会51.数据数据准备准备2.模型模型训练训练Model Hub深度学习框架深度学习框架分布式框架分布式框架3.模型模型上线上线实验管理实验管理模型部署模型部署模型监控模型监控4.产品产品整合整合向量数据库向量数据库数据标注数据标注标注机器学习输入(X,y)中的 y 部分,在一部分目标
5、变量 y 缺失的业务场景为 AI 模型提供人类先验知识的输入Scale(人工数据标注商):$6亿Snorkel(模型数据合成/标注):$1.35亿机器学习领域的类Github开源社区Hugging face(模型开源社区):$3.95亿AI 模型训练与推理的核心框架,使模型能够高效的实现计算Tensorflow(Google旗下)PyTorch(Meta旗下)将一个庞大的 AI 模型分配给多个硬件进行处理,最后再综合起来得到结果Anyscale(分布式计算平台):$2.59亿非结构化数据库,储存的数据形式为向量,向量数据的高速搜索对于未来高性能的 AI 软件很重要Pinecone(向量数据库)
6、:$1.38亿追踪模型版本,验证模型性能,选择最优版本的模型进行上线Weights&Biases(AI开发平台):$2.5亿把训练好的模型在特定环境中运行,需要最大化利用资源的同时保证模型性能BentoML(模型部署框架):$900万实时保持对模型输出结果的监控,将用于模型安全Fiddler(模型性能管理工具):$4520万流程流程细分环节细分环节主要作用代表公司代表公司&融资总额融资总额流程流程细分环节细分环节主要作用代表公司代表公司&融资总额融资总额资料来源:Crunchbase,阿尔法公社,海外独角兽,国联证券研究所整理1.3 海外主要海外主要AI初创公司融资情况:初创公司融资情况:Op