《沙利文:2023年AI大模型市场研究报告-迈向通用人工智能大模型拉开新时代序幕(43页).pdf》由会员分享,可在线阅读,更多相关《沙利文:2023年AI大模型市场研究报告-迈向通用人工智能大模型拉开新时代序幕(43页).pdf(43页珍藏版)》请在三个皮匠报告上搜索。
1、AI AI 大模型市场研究报告(大模型市场研究报告(20232023)迈向通用人工智能,大模型拉开新时代序幕迈向通用人工智能,大模型拉开新时代序幕简介经过大规模预训练的大模型,能够在各种任务中达到更高的准确性、降低应用的开发门槛、增强模型泛化能力等,是AI 领域的一项重大进步。大模型最早的关注度源于 NLP 领域,随着多模态能力的演进,CV 领域及多模态通用大模型也逐渐成为市场发展主流。政企的极大关注带动了行业领域大模型的高速发展,逐渐形成了多模态基模型为底座的领域大模型和行业大模型共同发展的局面。伴随基于大模型发展的各类应用的爆发,尤其是生成式 AI,为用户提供突破性的创新机会,打破了创造和
2、艺术是人类专属领域的局面。AI 不再仅仅是“分类”,而且开始进行“生成”,促使大模型带来的价值进一步升级到人类生产力工具的颠覆式革新。同时,数据规模和参数规模的有机提升,让大模型拥有了不断学习和成长的基因,开始具备涌现能力(Emergent Ability),逐渐拉开了通用人工智能(AGI)的发展序幕。过去几年,国内外的 AI 厂商均在大模型领域有所布局。OpenAI 在 2019 年发布了GPT-2 大模型,国内互联网科技厂商也集中在 2020-2022 三年期间相继发布了自己的大模型。ChatGPT 的发布,掀起了一波发展热潮,原有厂商基于自身大模型开始推出一系列生成式 AI 应用,并对外
3、提供 API 接口。更多的创业公司、科研机构和新的科技厂商涌入该市场,发布相关的产品服务。大模型人气高涨,吸引了用户的关注,不仅是 CIO、CTO 等技术决策人员,CEO、CFO 等业务决策人员也同样希望发挥此类模型在业务用例中的潜力。用户关注度的跃升成为对厂商自身能力的考验,前期已具备全栈大模型构建能力的厂商开始显现积累优势。为帮助用户了解国内大模型市场的发展情况、厂商格局和竞争地位,沙利文研究团队通过详实的访谈调研,对中国市场提供大模型产品服务的厂商进行了深入的分析和评估。1执行摘要执行摘要来源:CNCF,沙利文整理全球知名大模型发布时间节点全球知名大模型发布时间节点Hugging Fac
4、e:BLOOMGoogle:Minerva(540B)清华:清华:GLM-130BAI21 Labs:Jurassic-1-JumboStability AI:Stable DiffusionGoogle:ImagenMeta AI:OPT-175BOpenAI:DALL-E2DeepMind:ChinchillaDeepMind:AlphaCodeGoogle:Palm(540B)Eleuther AI:GPT-NeoX-20BOpenAI:InstructGPTDeepMind:GopherMicrosoft&NVIDIA:Megatron-Turing NLG 530BOpenAI:Co
5、dex百度百度:ERNIE-GEN(large)智源研究院智源研究院:Wu Dao 2.0NAVER:HyperClova清华清华&达摩院达摩院:CogViewAI21 Labs:Jurassic-XEleuther AI:GPT-J-6B华为华为:PanGu-alpha智源研究院智源研究院:Wu Dao-Wen YuanEleuther AI:GPT-NeoOpenAI:DALL-EOpenAI:GPT-3 175B(davinci)Google:MeenaMicrosoft:Turning NLGGoogle:T5-3BGoogle:T5-11BGrover:Grover-MegaNVID
6、IA:Megatron-LM(Original,8.3B)OpenAI:GPT-2百度百度:ERNIE 3.02019-Jan2019-Apr2019-Jul2019-Oct2020-Jan2020-Apr2020-Jul2020-Oct2021-Jan2021-Apr2021-Jul2021-Oct2022-Jan2022-Apr2022-Jul2022-Oct2023-JanUnited StatesUnited KingdomChinaIndiaKoreaCanadaIsraelGermanyIndeterminate商汤商汤:书生:书生1.02023-Apr百度百度:文心一言大模型:文
7、心一言大模型阿里阿里:通义千问大模型:通义千问大模型商汤商汤:书生:书生2.5商汤商汤:日日新大模型:日日新大模型阿里阿里:通义大模型:通义大模型关键发现点AI 大模型的高速发展离不开底层技术支持和应用场景迭代。大模型作为 AGI 时代的曙光,相关厂商也将迎来广阔的发展空间。本报告将呈现从发展现状、驱动因素洞察 AI 大模型厂商竞争与发展关键点,并推演竞争格局的逻辑分析过程:前瞻洞察:前瞻洞察:通向 AGI 的技术路径具有多元性,目前大模型是最佳实现方目前大模型是最佳实现方式式。大模型具有强大的泛化性、通用性和实用性,能够降低 AI 开发门槛、提高模型精度和泛化能力、提高内容生成质量和效率等多
8、种价值,实现了对传统 AI 技术的突破,并成为 AGI的重要起点。进而将 AI 发展由数据飞轮升级到智慧飞轮,最终迈向人机共智。大模型和大模型和 人类反馈的强化学习人类反馈的强化学习(RLHFRLHF)的结合的结合,进一步重构了进一步重构了AIAI 开发范式开发范式,进入大模型主导的软件 2.0 时代。另一方面,AIAI 开发则形开发则形成新的成新的“二八定律二八定律”,开发者的生产力将得到极大释放。驱动因素:驱动因素:大模型“基础设施-底层技术-基础通用-垂直应用”发展路线逐渐清晰,国内各厂商加速战略布局,加大资金和技术投入,迎头赶上全球大模型产业化浪潮,本土化大模型迎来发展新机遇。整体上,
9、行业驱动因素主要包含三个层面:(1 1)政策端:政策端:政策环境持续优化,赋能AI 大模型市场高速发展。(2 2)供给端:供给端:下一代 AI 基础设施等快速发展,助力大模型应用落地。(3 3)需求端:需求端:AI 市场高景气,大模型下游行业需求旺盛。行业观点:行业观点:大模型未来发展将趋于通通用化与专用化并行用化与专用化并行、平台化与简易化平台化与简易化并进并进。同时,MaaSMaaS 模式将成为模式将成为 AIAI 应应用的全新形式且快速发展用的全新形式且快速发展,重构重构 AIAI 产产业的商业化结构生态业的商业化结构生态,激发新的产业激发新的产业链分工和商业模式链分工和商业模式。未来,
10、大模型将深入应用于用户生活和企业生产模式,释放创造力和生产力释放创造力和生产力,活跃创造思维、重塑工作模式,助力企业的组织变革和经营效率,赋能产业变革。关键成功因素:关键成功因素:大模型面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个可对外商业化输出的大模型的成功,要求其厂商拥有全栈全栈大模型训练与研发能力大模型训练与研发能力、业务场景落业务场景落地经验地经验、AIAI 安全治理举措安全治理举措、以及生态以及生态开放性开放性 4 大核心优势,才能保证其在竞争中突出重围。其中,全栈大模型全栈大模型训练与研发能力还包括数据管理经验训练与研发能力还包括数据管理经验,AIAI 基础设施建设与
11、运营基础设施建设与运营,以及大模型以及大模型系统和算法设计系统和算法设计 3 个关键要素。竞争格局:竞争格局:在竞争格局渐趋明晰的过程中,相关厂商需跨越技术、人才、资金等壁垒,在产品技术能力、战略愿景能力、生态开放能力三大维度上展开角逐。通过遴选,报告选择了 5家大模型厂商,分别为商汤商汤、百度百度、阿里巴巴阿里巴巴、华为华为、腾讯腾讯,评价模型包含 1515 个一级指标个一级指标、5656 个二级指标个二级指标,对厂商大模型的各个能力进行评估。用户建议:用户建议:通过此报告能够了解大模型厂商的竞争态势,关注领先厂商关注领先厂商,内部创建大模型战略文件内部创建大模型战略文件,明确其优势、带来的
12、风险和机遇,以及部署路线图,针对具体的用例,权衡模型的优势和风险,并选择合适场景试点选择合适场景试点、评估大模型的应用价值评估大模型的应用价值。2目录目录3关键发现章节一章节一AIAI大模型掀起时代浪潮,加速通用人工智能(大模型掀起时代浪潮,加速通用人工智能(AGIAGI)时代的来临)时代的来临AIAI 大模型是人工智能预训练大模型的简大模型是人工智能预训练大模型的简称称,包含了包含了“预训练预训练”和和“大模型大模型”两两层含义层含义,二者结合产生了新的人工智能模式,即模型在大规模数据集上完成预训练后,仅需少量数据的微调甚至无需微调,就能直接支撑各类应用。这些模型通常具有多层神经网络结构,并
13、使用高级的优化算法和计算资源进行训练,具有强大的泛化性、通用性和实用性,可以在自然语言处理、计算机视觉、智能语音等多个领域实现突破性性能提升。AIAI 大模型是人工智能迈向通用人工智能大模型是人工智能迈向通用人工智能的里程碑技术的里程碑技术。以目前热门的 ChatGPT为例,ChatGPT 的最大贡献在于基本实现了理想 LLM 的接口层,能够使 LLM自主适配人的习惯命令表达方式,由此增加了 LLM 的易用性,提升了用户体验。InstructGPT/ChatGPT 首先意识到这个问题,并给出了相应解决方案,较之前 fewshot prompting 方案更符合人类表达习惯。AI AI 大模型的
14、内涵与特征大模型的内涵与特征来源:张俊林由 ChatGPT 反思大语言模型(LLM)的技术精要,沙利文整理对新数据的适应能力对新数据的适应能力泛化性泛化性解决多个任务的能力解决多个任务的能力模型能应用于不同的数据集或任务通用性通用性应用时的可用性和效率应用时的可用性和效率模型能以合理的时间和资源,快速处理数据并做出决策实用性实用性Transformer、GAN、CNN、RNN等架构通过海量数据进行预训练微调以应用于不同的场景解决各种复杂任务(以(以 ChatGPT ChatGPT 为例:为例:ChatGPT 是 LLM 与RLHF 技术融合革新的生成式 AI 代表性产品,推动语言模型与人类意图
15、的一致性,是从弱人工智能向强人工智能迈出的坚实一步)以 ChatGPT 的发布为里程碑事件,AI 的发展进入到了继突破工业红线之后的,以 AGI 为发展目标的全新通用智能时代。大模型是通向 AGI 时代的最佳技术路径,并开始在以自动驾驶为代表的场景下所体现。同时,大模型也带来了全新的 AI 开发范式,基模型+人工反馈闭环的模式给开发者带来了新的“二八定律”。生成式 AI 成为大模型能力应用的爆发点,以文生文、文生图等内容生成为代表的大模型应用快速增长,并逐渐成为日益完善的生产力工具。关键发现模型在从未见过的数据上能表现出良好的性能能力生成式生成式 AI:基于现有数据生成全新原创内容的模型大模型
16、:大模型:基于大规模参数的人工智能预训练模型LLM:基于深度学习的自然语言处理技术ChatGPT:2022 年 11 月 OpenAI 公司发布的基于 LLM 研发的人工智能聊天机器人4人工智能近年来高速发展人工智能近年来高速发展,现已经进入现已经进入了以了以 AGIAGI 为代表的新里程碑阶段为代表的新里程碑阶段。随着AI 基础设施逐步完善,深度学习技术不断进步,人工智能应用场景逐渐增多,过去模型参数规模和数据量也实现了大幅度增长,为 NLP、CV 等领域带来更强大的表达能力和性能。人工智能发展历程中主要有两大里程碑:里程碑一:里程碑一:20122012 年年 CNNCNN 获得获得 Ima
17、geNetImageNet第一第一,标志着机器视觉识别能力开始逐标志着机器视觉识别能力开始逐渐超越人眼识别准确率渐超越人眼识别准确率,开启了人工智开启了人工智能革命能革命。随着深度学习技术不断突破,诞生了一批“AI场景应用”的专属模型,但是整体研发成本比较高、研发时间比较长。里程碑二:里程碑二:20222022 年年 ChatGPTChatGPT 的出现的出现,掀起了又一波人工智能发展热潮掀起了又一波人工智能发展热潮,以大以大模型模型+RLHFRLHF 为核心的技术落地意味着为核心的技术落地意味着人工智能开启人工智能开启 AIAI 新范式新范式。人工智能相关产业开始基于强大的基模型进行发展,通
18、过人类反馈和强化学习不断解锁基模型的能力,以解决海量开放式任务,带来了新的研究范式。人工智能的发展历程人工智能的发展历程GPTGPT-4 4提供完全不同可能性的多模态模型,例如视频2012012 21980sProlog&LispProlog&Lisp专家系统专家系统解答特定解答特定领域问题领域问题1990s机器学习算法机器学习算法互联网互联网娱乐娱乐自动驾驶自动驾驶DALLDALL-E 2E 2由文字生成高清原创图像20202222Stable DiffusionStable Diffusion使用消费级显卡获取文本驱动的图像PaLMPaLM-E E具象化多模态语言大模型CNNCNN夺得夺得
19、 ImageNeImageNet t 第一第一正确率超越第二名近正确率超越第二名近10%10%ChatGPT ChatGPT 发布发布可以理解人类语言并生成可以理解人类语言并生成类似人类的书面文本内容类似人类的书面文本内容智慧城市智慧城市AI AI 新范式新范式AIAI场景应用场景应用AIAI突 破工业红线突 破工业红线高 效的通用智能高 效的通用智能随着 AI 基础设施逐步完善,深度学习技术不断进步,人工人工智能应用场景智能应用场景逐渐增多,大模型参数量大模型参数量以指数级速率逐步提升,数据量数据量随着多模态的引入也实现了大规模增长来源:沙利文整理人工智能发展进入以 AGI 为代表的新里程碑
20、阶段智能手机智能手机智慧医疗智慧医疗超大模型,有人类反馈的强化学习5AGIAGI 技术技术能够精准识别人类情绪能够精准识别人类情绪意图意图、理解人类语言理解人类语言、学习人类知识学习人类知识并并进行类进行类脑推理与创造脑推理与创造。OpenAI 的 CEO 山姆(Sam Altman)对 AGI 的定义相当明确:如果 AI 模型具有一个“普通人”学习解决问题的综合技能,能够在任何领域变得优秀,那就拥有了 AGI。大模型是目前通往大模型是目前通往 AGIAGI 的最佳实现方式的最佳实现方式。以 ChatGPT 为代表的人工智能技术已经具备 AGI 的核心技术和特征,能够自动化地学习任何可以符号化
21、的知识及信息,不断自我优化,充分理解和流畅表达人类语言,同时逻辑推理能力强,实现了具备一般人类智慧的机器智能。相较于过去相较于过去 AIAI 应用与部署应用与部署难以难以全面覆盖全面覆盖产业产业的短板的短板,大模型能大模型能覆盖覆盖全产业流程全产业流程的每个环节的每个环节。以自动驾驶场景为例,在输入层,大模型能全链条覆盖感知环境,并生成大量实景图片。在输出层,解码器负责重构 3D 环境、预测路径规划、解释自动驾驶的动机等。大模型能实现自动驾驶感知决策一体化集成,更接近人的驾驶行为预判断,助于提升自动驾驶的安全性、可靠性和可解释性。通往 AGI 的技术路径多元,目前大模型是最佳实现方式(1/2)
22、Q:我需要停车。A:左前方两个空车位,右前方三个空车位Q:前方能否靠右行驶?A:不能,右侧为公交专用道Q:此刻可以直行吗?A:需等待38秒才能直行通过例如:例如:自动驾驶场景中常见的场景感知需求场景:场景:驶离停车场后,通过红绿灯驶入大路,回避公交车专用道,到达目的地停车场找空车位停车。Q:如何驶离停车场?A:前方左转停车场标志信息停车场标志信息空车位信息空车位信息交通信号灯状态交通信号灯状态路面标识信息路面标识信息来源:AGICall,沙利文整理因果逻辑类人脑推理因果逻辑类人脑推理人类情绪意图精准识别人类情绪意图精准识别通用认知模型预训练通用认知模型预训练通过人类情绪意图的精准识别与反馈,可
23、以规避常规机器学习过程中靠人工进行反馈的主动性、片面性、低效性基于情绪意图、因果推理的海量学习,形成灵活敏锐的通用认知结构,具备通用场景可用性模仿人脑因果推理过程,大幅提升机器计算效率,从底层机制解决人工智能对环境的适应性AGIAGI优势优势AGI AGI 的优势与特点的优势与特点6AGIAGI 将实现从将实现从“数据飞轮数据飞轮”到到“智慧飞智慧飞轮轮”的演进的演进,最终迈向人机共智最终迈向人机共智。现有AI 体系主要基于数据飞轮,AGI 催生了新的研究范式智慧飞轮,通过强化学习和人类反馈不断解锁基模型新的能力,以更高效地解决海量的开放式任务。数据飞轮:数据飞轮:现有 AI 体系主要从前端获
24、取大量数据并进行人工标注,通过更新后的模型反馈到前端,以获取高质量数据,但是研发时间长和成本高。智慧飞轮:智慧飞轮:AGI 体系则将实现人与模型的互动,基模型将不断理解人的意图以解锁更多技能,并能实现自动化标注,成本约 AI 体系的 1%,有助于推动数据进行快速迭代与优化,以输出更高质量的智慧内容。通往 AGI 的技术路径多元,目前大模型是最佳实现方式(2/2)来源:Beyond the imitation game:Quantifying and extrapolating the capabilities of language models,商汤,沙利文整理数据数据飞轮飞轮算法模型算法模
25、型数据数据循环循环互动互动级级升升基模型基模型1.解锁更多技能2.Align with Human智慧内容的生成智慧内容:生成式 AI,AI Generated Content智慧飞轮智慧飞轮大模型将由数据飞轮向智慧飞轮升级演进大模型将由数据飞轮向智慧飞轮升级演进大模型的大模型的缩放法则(缩放法则(Scaling LawScaling Law)和涌现性()和涌现性(Emergent AbilityEmergent Ability)大模型的缩放法则和涌现性与大模型的缩放法则和涌现性与AGIAGI 的发展息息相关的发展息息相关。缩放法则是指随着模型规模逐步放大,任务的表现越来越好(如图 a 所示)
26、;涌现性是指随着模型的规模增长,当规模跨过一定阈值,对某类任务的效果会出现突然的性能增长,涌现出新的能力(如图 b 所示)。当全部人类的知识被存储在大模型中,这些知识被动态连接起来时,其所具有的智能远超人们预期。7来源:商汤,沙利文整理“Software 1.0”Distributed AI“Software 2.0”Centralized AI手工标注手工标注AI模型模型AI模型模型AI模型模型AI模型模型AI模型模型AI模型模型AI模型模型AI模型模型云基础设施云基础设施业务业务逻辑逻辑业务业务逻辑逻辑AI超算超算基础基础设施设施模型迭代模型迭代提示工程提示工程提示工程提示工程领域模型领域
27、模型领域模型领域模型基 模 型基 模 型+人 工 反 馈人 工 反 馈闭 环闭 环AI原生基础设施原生基础设施(AI高性能计算高性能计算+大数据)大数据)模型微调模型微调AI AI 软件开发进入全新范式软件开发进入全新范式大模型的出现大模型的出现,将重构人工智能生产范式将重构人工智能生产范式。传统的软件开发模式是通过任务/业务数据集形成专属模型,小模型不断迭代,开发人员用明确的代码去表达程序执行的逻辑,而随着业务场景从通用场景发展到长尾、碎片场景,该模式则逐渐显现出开发成本高,精确度不佳等一系列挑战。在大模型的加持下在大模型的加持下,逐渐形成围绕大模型逐渐形成围绕大模型结合人工反馈强化学习为核
28、心的软件开发结合人工反馈强化学习为核心的软件开发新范式新范式,通过模型微调的手段,可以基于超大规模基模型,打造出领域大模型或者行业大模型,进而覆盖更多行业自场景。与此同时,通过提示工程,只需用示例向计算机表达预期目标,计算机将通过神经网络自行找出达到目标的方法。传统软件开发时期,解决单一问题的深度学习方法与工业化小模型生产工具逐步成熟,现阶段在一些垂直领域仍会应用,如医疗影像、工业检测等。未来软件开发新未来软件开发新范式将是范式将是 AIAI 大模型驱动的商业模式与产大模型驱动的商业模式与产品设计的基础品设计的基础。人工智能的小模型时代下,解决单一问题的深度学习方法与工业化小模型生产工具逐步成
29、熟。在大模型时代在大模型时代,在在 AIAI 原生基原生基础设施上础设施上,大模型即服务大模型即服务(ModelModel as as a aService)Service)结合数据反馈闭环是未来人工智结合数据反馈闭环是未来人工智能大模型驱动的商业模式与产品设计的基能大模型驱动的商业模式与产品设计的基础础,在此前景下,新范式将会更加注重基础设施成本、算力与数据规模、以及实时用户大数据的反馈和迭代。人工智能生产范式发生转变,新的“二八定律”形成(1/2)8人工智能生产范式发生转变,新的“二八定律”形成(2/2)来源:DeepMind,沙利文整理基于大模型的代码生成(以基于大模型的代码生成(以 D
30、eepMind DeepMind AlphaCodeAlphaCode 为例)为例)新的新的“二八定律二八定律”形成形成,AIAI 大模型将释大模型将释放开发者的生产力放开发者的生产力。在传统软件时代,100%的计算机代码由程序员编写程序逻辑,计算机中约 20%的指令承担了 80%的工作。到小模型时代,AI 模型可以替换 20%的人工代码逻辑,但手工开发的业务逻辑仍占到 80%。进入大模型时代进入大模型时代,未来软件未来软件 8080%的价值将由的价值将由 AIAI 大模型提大模型提供供,剩余剩余 2020%会由提示工程和传统业务会由提示工程和传统业务开发组成开发组成,新的新的“二八定律二八定
31、律”由此形成由此形成。大模型通过机器学习训练代码大模型通过机器学习训练代码,直接生直接生成满足需求的程序代码成满足需求的程序代码。原特斯拉 AI 总监 Andrej Karpathy 曾表示自己现在 80%的代码由 AI 完成,而商汤内部实测日日新大模型提升代码编写效率约 62%。大大模型不仅能生成代码模型不仅能生成代码,补全必要的代码补全必要的代码块块,还 能 够 保 证 一 定 的 准 确 率还 能 够 保 证 一 定 的 准 确 率。DeepMind 的 AlphaCode 在 Codeforces 上托管的 10 个竞赛中总体排名前 54%,清华大学开发的多编程语言代码生成预训练模型在
32、 HumanEval-X 代码生成任务上取得 47%60%求解率。基于大模型的基于大模型的高精度代码生成高精度代码生成,能够提高软件开发的能够提高软件开发的效率效率,标志着人工智能向标志着人工智能向 AGIAGI 更进一步更进一步。62%62%代码编写效率提升(内部实测)商汤 日日新大模型54%54%编程竞赛平台 Codeforces 上10 个编程竞赛中排名DeepMind AlphaCode47%60%47%60%HumanEval-X 代码生成任务求解率清华大学 CodeGeeX数据数据学习学习抽样及评估抽样及评估预训练预训练FineFine-tuningtuning大规模抽样大规模抽样
33、GitHubGitHubCodeContestsCodeContestsAI for AI AI for AI 释放软件开发生产力释放软件开发生产力 80%80%AI 编写代码占比以及准确率OpenAI&GitHub&微软 CopilotProblemsProblemsSolutionsSolutionsCodeForcesCodeForcesProblemsProblems大量潜在的大量潜在的解决方案解决方案选定的小部分选定的小部分候选方案候选方案筛选筛选&聚类聚类执行执行&评估评估9伴随伴随 AIAI 技术升级和大模型成熟技术升级和大模型成熟,AIAI 绘画绘画与与 ChatGPTChat
34、GPT 的成功破圈的成功破圈,生成式生成式 AIAI 技技术迎来发展拐点术迎来发展拐点,行业关注度大幅提升行业关注度大幅提升。生成式 AI 是指基于大模型、生成对抗网络 GAN 等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术,可生成如图像、文本、音频、视频等原创内容变体。例如,以ChatGPT、Midjourney、文心一格、商汤商量、Codex 为代表的生成式 AI 应用拥有文本语言理解能力、涌现能力以及思维链推理能力,能够完成文学创作、新闻写作、数理逻辑推算、代码生成、图片生成等多项任务。目前,国内电商、游戏、文娱、设计等行业正在积极使用相关的生成式 AI 应
35、用来提高自身工作效率,尤其以文生图应用为主。生成式生成式 AI AI 不仅能够增强并加速下游多领不仅能够增强并加速下游多领域的设计,而且有潜力“发明”人类可域的设计,而且有潜力“发明”人类可能错过的新设计、新对象。能错过的新设计、新对象。生成式 AI 有生成大规模、高质量、低成本内容优势,在算力和算法支持下生成大量内容,生成的内容质量将持续超越 UGC 与 PGC。未来有望为各行业提供内容支持并促进其内容繁荣,最大化释放内容生产力。文字生成属于发展成熟文字生成属于发展成熟、易于跨界转化易于跨界转化的赛道的赛道,而跨模态生成赛道的发展潜力而跨模态生成赛道的发展潜力最高最高。生成式 AI 应用根据
36、模态划分为文字生成、音频生成、图像生成、视频生成、跨模态生成。语音合成、文本生成、图像属性编辑等技术应用目前较为成熟,跨模态生成、策略生成是高增长潜力的应用场景,在自动驾驶、机器人控制等领域有极高应用价值,随着未来技术不断发展成熟,预计 3-5 年可实现稳定落地。AI 大模型技术创新,助推生成式 AI 应用场景加速落地来源:红杉资本,沙利文整理大模型发展及相关应用实现落地时间表大模型发展及相关应用实现落地时间表2020 2020 年前年前202020202022202220252025?20302030?20502050?文字文字代码代码生成生成图像图像视频视频/3D/3D/游戏游戏垃圾邮件识
37、别翻译基础问答基础文案写作起草初稿更长的文字完成第二稿艺术作品Logo 设计摄影多行代码生成单行代码自动完成更长的代码更高的准确率多程序语言更多垂直领域垂直微调科学论文产品设计模型建筑概念模型基础/初稿视频及 3D 文件高于人类平均水平的终稿写作文本到产品(草稿)产品设计模型建筑模型第二稿产出比全职开发人员做得更好的文本到产品(终稿)AI Roblox产出基于个性化梦想的电子游戏和电影产出比专业艺术家、设计师、摄影师做得更好的终稿产出比职业作家写得更好的终稿可用的大模型:可用的大模型:初步探索初步探索基本形成基本形成准备阶段准备阶段10关键发现在在“基础设施支撑基础设施支撑+顶层设计优化顶层设
38、计优化+下下游需求旺盛游需求旺盛”三轮驱动下三轮驱动下,AIAI 大模型迎大模型迎来了良好的发展契机来了良好的发展契机。通过数据交互和任务反馈,优秀的大模型能够赋能各行各业开放任务,满足对未来AI 应用的期待。展望未来展望未来,大模型大模型“训训练基础设施练基础设施 底层技术底层技术 基础应用基础应用 垂直应用垂直应用”发展路线逐渐清晰发展路线逐渐清晰,随着随着底层底层技术逐步革新技术逐步革新,基模型和领域大模型持续基模型和领域大模型持续完善完善,大模型应用边界不断拓宽大模型应用边界不断拓宽,将加速赋能交通、医疗、金融等各个行业和领域,引发一场以强人工智能和通用人工智能为代表的新一轮智能革命浪
39、潮,大幅提高生产和生活效率,带来深刻的经济带来深刻的经济、社会和社会和产业变革产业变革。优秀的大模型能够赋能各行各业开放任务优秀的大模型能够赋能各行各业开放任务来源:沙利文整理基模型基模型智慧交通智慧零售智慧文旅娱乐互联网智慧医疗AI 教育智能手机智慧楼宇智能汽车智慧金融任任务务反反馈馈数数据据交交互互吃顶层设计优化顶层设计优化基础设施支撑基础设施支撑下游需求旺盛下游需求旺盛关键发现章节章节二二大模型迎来发展新机遇,未来前景可期大模型迎来发展新机遇,未来前景可期人工智能的政策引导逐渐覆盖到大模型生态,并开始出台相应的生成式 AI 监管建议,进一步支撑大模型生态的有序发展;大模型的神经网络架构和
40、训练大模型的 AI 基础设施,均逐渐发展成熟,推动大模型的生产更加系统化和工程化;下游企业用户的 AI 部署需求进一步规模化发展,急需在上游大模型支撑下,获得 AI 应用开发门槛降低,部署精度提高等基础价值,进而降低 AI 规模化部署的成本;大模型的发展趋于通用化与专用化并进,平台化与简易化并进;依托 Model as a Service,大模型建立起面向政企、消费者群体等差异化的商业模式,并逐渐形成基模型、领域、行业大模型一体的商业化架构。1120212021-20252025“十四五”规划“十四五”规划强调国家战略科技发展的重要性,支持人工智能在多行业、多领域的融合发展,并出台规范类政策,
41、促进人工智能产业健康发展“十二五十二五”至至“十四五十四五”期间部分人工智能相关政策期间部分人工智能相关政策依托互联网平台提供人工智能公共创新服务,加快人工智能核心技术突破,促进人工智能在智能家居、智能终端、智能汽车、机器人等领域的推广应用从“十二五”到“十四五”规划,国家从宏观层面上对人工智能新技术、新产业给予巨大支持,顶层设计从方向性引导到强调落地应用与场景创新,进一步细化、深化。地方政府积极响应国家战略,加快规划人工智能产业建设,如北京市经济和信息化局发布2022 年北京人工智能产业发展白皮书,支持头部企业打造对标 ChatGPT 的大模型,着力构建开源框架和通用大模型的应用生态。国家重
42、视人工智能产业的安全可信和伦理秩序,两会期间科技部部长十天两提ChatGPT,强调规范科技伦理,趋利避害。国家近日出台人工智能相关管理条例,如生成式人工智能服务管理办法(征求意见稿),进一步促进 AI 技术的规范应用和产业整体的高质量发展。政策环境持续优化,助力 AI 大模型市场高速发展来源:各政府部门官网,沙利文整理提出基于信息物理系统的智能装备、智能工厂等智能制造技术引领制造方式变革,加快推动新一代信息技术与制造技术融合发展,着力发展智能装备和智能产品,推进生产过程智能化2015.52015.5国务院国务院中国制造中国制造 202520252015.7 2015.7 国务院国务院国务院关于
43、积极推动“互联国务院关于积极推动“互联网网+”行动的指导”行动的指导20112011 20152015“十二五”规划“十二五”规划重点提出产业结构调整以求得核心竞争力提升,推动基于互联网的人工智能相关应用20162016 20202020“十三五”规划“十三五”规划强调人工智能为战略前沿领域,由顶层制定了分步走战略,并发布了人工智能相关的标准体系建设指南建立重大项目动态调整机制,综合把握国际科技前沿趋势,在人工智能等方面遴选重大任务,适时充实完善重大项目布局到 2025 年人工智能基础理论实现重大突破,到 2030 年人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心2
44、017.72017.7国务院国务院新一代人工智能发展规划新一代人工智能发展规划到 2021 年,明确人工智能标准化顶层设计,研究标准体系建设和标准研制的总体规则等,完成重点标准的预研工作,到 2023 年,初步建立人工智能标准体系2020.7 2020.7 中央网信办等五部门中央网信办等五部门国家新一代人工智能标准体系国家新一代人工智能标准体系建设指南建设指南2016.72016.7国务院国务院“十三五十三五”国家国家科技创新规划科技创新规划瞄准人工智能等前沿领域,实施一批具有前瞻性、战略性的国家重大科技项目2021.32021.3全国人大全国人大中华人民共和国国民经济和社会发展第中华人民共和
45、国国民经济和社会发展第十四个五年规划和十四个五年规划和 2035 2035 年远景目标纲要年远景目标纲要推动人工智能场景创新对于促进人工智能更高水平应用2022.72022.7科技部科技部关于加快场景创新以人工智能高水平关于加快场景创新以人工智能高水平应用促进经济高质量发展指导意见应用促进经济高质量发展指导意见围绕构建人工智能行业应用生态,支持一批基础较好的人工智能应用场景2022.8 2022.8 科技部科技部关于支持建设新一代人工智能示范应关于支持建设新一代人工智能示范应用场景的通知用场景的通知对生成式人工智能产业给出包括定义、准入资格、责任义务和处罚措施等规定,支持算法、框架等基础技术的
46、自主创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源2023.4 2023.4 国家网信办国家网信办生成式人工智能服务管理办法(征求生成式人工智能服务管理办法(征求意见稿)意见稿)122018 年从基础架构来看从基础架构来看,TransformerTransformer 是是 AIAI 大大模型演进的基础模型演进的基础。Transformer由论文Attention is All You Need提出,是一个新的简单网络架构,遵循 Encoder Decoder 架构流程来实现结果,完全基于注意力机制,摒弃了循环和卷积。Transformer 模型结构与基于 RNN
47、模型结构相比,不仅提升了自然语言处理任务的精度和质量,而且可并行化程度更高,所需的训练时间明显减少,能够提升 计 算 效 率 和 资 源 利 用 率。目 前Transformer 已逐步取代 LSTM 等 RNN模型,成为 NLP 问题的首选模型,并有逐步统一图像处理等领域的趋势。可以说,Transformer 促成了 GPT 和 BERT两大 LLM 模型主流技术的出现。BERT 使用掩码语言模型,可以双向处理输入序列,适用于理解类或某个场景的具体任务。GPT 使用自回归模型进行语言建模,适合生成类以及多任务场景。LLM 应该具备自主学习能力,理解人类的命令,执行并完成尽可能多类型的任务,而
48、 生 成 模 型 更 容 易 做 好zeroshot/few shot prompting 方式的任务,因此当前几乎所有参数规模超过千亿的LLM 模型都采用了 GPT 路线。AI 基础架构及基础设施快速发展,助推大模型应用落地高效率、低成本、规模化的高效率、低成本、规模化的 AI AI 基础设施基础设施成长迅速,帮助夯实大模型基础。成长迅速,帮助夯实大模型基础。底层服务支撑层包含 AI 计算、存储、加速、容器核心套件,能够提供高性价比的算力,承载海量数据的处理、超大模型的训练和推理。AI 开发平台层集成数据处理、模型开发、部署运行、资产管控等功能工具,能够围绕 AI 模型/算法的生命周期提供工
49、具,连接不同层次开发者对 AI 模型设计、训练、部署等活动。大模型及服务层能够提供基础大模型,应用于下游多个场景中,且能够通过数据反馈实现模型的持续优化迭代。如商汤 AI 大装置、百度 AI 大底座、腾讯云新一代 HCC 高性能计算集群、字节-火山引擎发布的高速训练引擎等,能够提供大算力和大数据,实现高性能的模型开发应用。LLMLLM 研究的发展路径研究的发展路径AIAI 基础设施架构图基础设施架构图底层服务支撑层底层服务支撑层AI AI 开发平台层开发平台层大模型及服务层大模型及服务层AI 计算AI 存储AI 加速AI 容器数据处理算法开发模型训练应用部署ELMoBERTGPT 1.0GPT
50、 2.0GPT 3.0RoBERTaALBERTT5国内 LLMGPT 3.5LaMDAPaLMGopherOPTChinchilla2019 年2018 年2018 年2019 年2019 年2019 年2020 年2022 年来源:CNCF,Attention Is All You Need,张俊林,沙利文整理13AIAI 大模型的技术架构通常涉及多个层次大模型的技术架构通常涉及多个层次,可以分为基础层可以分为基础层、技术层技术层、能力层能力层、应应用层用层、终端层五大板块终端层五大板块,其中核心技术其中核心技术层涵盖层涵盖 AIAI 技术群和大模型的融合创新技术群和大模型的融合创新,为各
51、行业深度赋能为各行业深度赋能。基础层:基础层:AIAI 大模型的基础层涉及硬件基大模型的基础层涉及硬件基础设施和数据础设施和数据、算力算力、算法模型三大核算法模型三大核心要素心要素。随着 AI 大模型规模的不断扩大,对计算资源的需求也在增加。因此,高性能的硬件设备、海量场景数据、强大的算力基础和升级迭代的算法模型成为了支持 AI 大模型发展的关键。深度学习模型的不断升级和迭代,增强了 AI 算法的学习能力;同时,开源模式将使 AI 大模型成为海量应用、网络和服务的基础。技术层:技术层:AIAI 大模型的技术层主要涉及模大模型的技术层主要涉及模型构建型构建。目前,Transformer 架构在
52、AI大模型领域占据主导地位,如 BERT、GPT 系列等。AI 大模型 包括 NLP 大模型、CV 大模型、多模态大模型等。这些模型采用预训练和微调的策略,先在大量无标注数据上学习语言或图像的基本表示,然后针对特定任务进行微调。能力层能力层、应用层及用户层:应用层及用户层:在基础层和技术层的支持下,AI 大模型拥有了文字、音频、图像、视频、代码、策略、多模态生成能力等,具体应用于金融、电商、传媒、教育、游戏、医疗、工业、政务等多个领域,为企业级用户、政府机构用户、大众消费者用户提供产品和服务。核心技术层协同发展,共同赋能 AI 大模型生态AI AI 大模型的技术架构大模型的技术架构来源:CNK
53、I,沙利文整理AIAI算力基础算力基础数据资源数据资源硬件设施硬件设施外部合规数据数据标注结构化网络资源安全资源第三方合规数据数据整合AI芯片基础层基础层能力层能力层文字生成虚拟人/场景生成应用层应用层用户层用户层企业级用户政府机构用户大众消费者用户音频生成图像生成视频生成代码生成策略生成多模态生成.企业服务零售电商传媒/影视教育/科研工业游戏医疗政务金融服务技术层技术层人工智能人工智能智能语音机器学习计算机视觉知识图谱自然语言理解智能文档理解视觉-语言语音-语言多模态检测与分割CVCV大模型大模型图像生成图像表征视频表征视频生成图像分类图像与物体检测语义分割因果推断NLPNLP大模型大模型语
54、音语义理解多语言模型语言理解与生成多模态对话文本语义与图结构开放域对话信息抽取与检索代码生成和理解算力资源储存资源云计算与云服务深度学习框架/开源模型模型训练/AI开发平台预训练大模型智能计算平台智能服务器多模态大模型多模态大模型AIAI模型生产工具模型生产工具14人工智能能够赋能经济社会发展各领域人工智能能够赋能经济社会发展各领域,下游各个领域的产业升级对大模型的需下游各个领域的产业升级对大模型的需求持续走高求持续走高。例如,在泛交通领域,人工智能能够在自动驾驶、智能座舱、运行管理优化等多个方面为汽车行业创造价值;在医疗方面,人工智能可以提高疾病检测的效率以及医学影像领域的智能化分析。据测算
55、,2022 年中国人工智能行业市场规模为 3,716 亿人民币,预计2027 年将达到 15,372 亿人民币,有望在下游制造、交通、金融、医疗等多领域不断渗透,实现大规模落地应用。下游行业对人工智能需求呈现出碎片化、多样化的特点,从开发、精调、优化、迭代到应用都需要投入巨大的人力和财力,成本极高。而大模型能够向外赋能大模型能够向外赋能,包括通过开放包括通过开放 APIAPI 的形式的形式,降低降低 AIAI 应用应用开发门槛开发门槛,提高落地部署效率和精度等提高落地部署效率和精度等,进而降低进而降低 AIAI 规模化部署的成本规模化部署的成本,满足各满足各行业场景的应用需求行业场景的应用需求
56、,进一步推动人工智进一步推动人工智能进入工业化发展阶段能进入工业化发展阶段。中国人工智能行业市场规模,中国人工智能行业市场规模,20212021-2027E2027EAI 市场高景气,大模型下游行业需求旺盛2,607 3,716 5,323 7,516 10,539 14,729 15,732 05,00010,00015,00020,000202120222023E2024E2025E2026E2027E+34%+34%单位:单位:人民币亿元人民币亿元 AI AI 大模型应用场景丰富大模型应用场景丰富AI AI 大模型大模型典型应用场景典型应用场景来源:头豹研究院,沙利文整理15AIAI 大
57、模型具有降低开发门槛大模型具有降低开发门槛、提高模型提高模型精度和泛化能力精度和泛化能力、提高内容生成质量和提高内容生成质量和效率等多种价值效率等多种价值,实现了对传统实现了对传统 AIAI 技术技术的突破的突破。一方面,大模型可以帮助降低机器学习和自然语言处理应用的开发门槛,能够对复杂的模式和规律进行更准确的建模,通过不断地学习和更新自己的参数来提高其性能和准确度,提高模型的精度,更好地泛化到新的数据集和任务中。另一方面,大模型通常能够更好地泛化到新的数据集和任务中,可以提高内容生成质量和效率,例如生成对话、摘要、翻译等。除此之外,大模型的开源性和可复制性可以促进学术研究的发展和技术的普及,
58、增强生态繁荣度,从而加速人工智能技术的进步和应用。来源:沙利文整理大模型的多种价值,将加速人工智能的技术进步和规模化应用大模型的五大基本价值大模型的五大基本价值提高模型精度提高模型精度大模型通过学习大量数据和任务获得广泛知识,捕捉更多细节,更好地泛化到新的数据集和任务中。增强模型泛化能力增强模型泛化能力大模型拥有更多的参数和更深的层次结构,能对复杂的模式和规律进行准确建模,并通过不断学习和更新自己的参数提高性能和准确度大模型的开源性和可复制性能够聚合开发者、高校、实验室等多方资源,在促进学术研究的发展和技术普及的同时,加速人工智能技术的进步和应用。增强生态繁荣度增强生态繁荣度大模型通过自动学习
59、更多的特征和规律,减少手动特征工程的需求,使开发者能更轻松地构建高质量的模型。降低开发门槛降低开发门槛大模型可以更好地捕捉和分析信息,用于生成高质量的内容,提升生成效率,例如生成对话、摘要、翻译等。提高内容生成质量和效率提高内容生成质量和效率大模型的大模型的基本价值基本价值16AIAI 大模型未来发展将趋于通用化与专用大模型未来发展将趋于通用化与专用化并行化并行。通用化是指模型能够适用于多个领域和任务,而专用化则是指模型被设计用于特定领域或任务。AIAI 大模型将逐渐实现在多个领域和任务大模型将逐渐实现在多个领域和任务中的通用性和灵活性中的通用性和灵活性,未来会有更多模未来会有更多模型被设计和
60、优化型被设计和优化用于用于特定的任务和领域特定的任务和领域。受制于数据规模和模型表达能力的约束,传统模型往往只能有针对性地支持一个或者一类模态,而无法支持其他任务。相比之下,AI 大模型得益于其“大规模预训练微调”的范式,可以很好地适应不同下游任务,展现出强大的通用性。通用大模型即为多模态基模型通用大模型即为多模态基模型,偏重统偏重统一架构一架构、统一知识表达统一知识表达、统一任务统一任务。通用大模型能够使用统一的模型框架,并采用相同的学习模式,构建可适用于多种模态的通用词表,将所有任务统一成序列到序列任务。例如,GPT 系列模型在自然语言处理领域的多个任务中都取得了非常好的表现,包括文本生成
61、、问答、摘要、翻译等任务。同样,BERT模型也被证明可应用于多种自然语言处理任务中,包括文本分类、命名实体识别、问答等。专用大模型则通过通用预训练和专用预专用大模型则通过通用预训练和专用预训练实现业务场景应用训练实现业务场景应用。专用大模型包括领域大模型(如 NLP、CV 等)和行业大模型(如金融、能源等)。例如,近期彭博社发布了专门为金融领域打造的 大 型 语 言 模 型(LLM)BloombergGPT。BloombergGPT 是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务。大模型将趋于“通用化”与“专用化”并行来源:华东政法大学,CNCF,沙利文整理专用大模型专
62、用大模型领域大模型领域大模型应用应用需求需求基础基础框架框架反哺技术反哺技术技术落地技术落地表征学习表征学习迁移学习迁移学习多模态多模态单模态单模态从算法只能基于一种模态学习并只能应用于该模态到可以学习并应用于多种模态从算法只能处理一种模态到可处理多种模态单模态向多模态转变单模态向多模态转变专用领域预训练专用领域预训练多模态基模型多模态基模型通用化与专用化并行通用化与专用化并行17基于模型开发基于模型开发、场景适配和推理部署场景适配和推理部署,AIAI 大模型未来将趋于平台化与简易化并大模型未来将趋于平台化与简易化并进进,将形成全能简易开发服务平台将形成全能简易开发服务平台。大模型发展趋于平台
63、化大模型发展趋于平台化,主要是指提供主要是指提供AIAI 模型开发和应用的完整解决方案模型开发和应用的完整解决方案。例如 OpenAI 的 GPT-3 Playground,为开发者和研究者提供了在线使用 GPT-3 模型的平台。在 AI 加持下,GPT 内部插件带来的用户体验优于直接使用外部的原生应用,用户的使用场景得以迁移到GPT 模型内部。目前插件商店内部的应用主要由 OpenAI 邀请的第三方开发,包括办公协作、电商、旅游等。随着外部成熟应用的交互圈层扩大,GPT 与用户日常生活将结合得更加紧密,参考移动互联网时代的端转手趋势,主流应用即将展开向 AI 平台的迁移,即迅速适应并布局 G
64、PT 内的 AI 插件,探索 AI 加持下自身应用的新场景。这些应用可以依赖 GPT 的 AI 技术提高用户体验,而GPT 则借助这些应用吸引更多用户,网络效应进一步加强了这种相互促进的趋势,从而提升 GPT 平台的生态价值。大模型的简易化则指使模型的使用更加大模型的简易化则指使模型的使用更加简单易懂简单易懂。AI 大模型突破传统 AI 适用性弱的局限,传统的 AI 模型通常只针对性的针对一个或者一类任务,而 AI 大模型中大规模的参数量可以提升模型的表达能力,更好的建模海量训练数据中包含的通用知识,通过“预训练+微调”,AI 大模型已经具有强大的通用性,例如,ChatGPT3.0 通过 pr
65、ompt-tuning 免去微调步骤,为开发者和用户提供了更加便捷的 AI 技术应用方式。大模型将趋于“平台化”与“简易化”并进来源:OpenAI,沙利文整理大模型平台化与简易化并进大模型平台化与简易化并进全能、简易开发服务平台全能、简易开发服务平台微微调调工工具具部部署署工工具具场景适配场景适配便捷微调能力便捷微调能力低参数调优能力低参数调优能力开开发发工工具具模型开发模型开发数据增强和清洗能力数据增强和清洗能力并行计算能力并行计算能力存储优化能力存储优化能力自适应分布式训练能力自适应分布式训练能力弹性容错训练能力弹性容错训练能力推理部署推理部署大模型和小模型无缝联动能力大模型和小模型无缝联
66、动能力自适应分布式推理能力自适应分布式推理能力自动化压缩能力自动化压缩能力加密部署能力加密部署能力18大模型发展应用路线逐渐清晰大模型发展应用路线逐渐清晰大模型大模型“训练基础设施训练基础设施底层技术底层技术基基础应用础应用垂直应用垂直应用”发展路线逐渐清晰发展路线逐渐清晰。大模型以训练基础设施及底层技术构成的技术底座为基点,在海量通用数据上进行预训练,集成多样化的 AI 核心技术,构建具有泛化能力的多模态基大模型以及领域大模型,如 CV 大模型、NLP 大模型、多模态大模型等。随着多模态能力的演进,CV 领域及多模态通用大模型将逐渐成为市场发展主流。领域大模型能够结合垂直场景及应用行业需求进
67、行模型微调和应用适配,结合ToC 端用户交互数据或 ToB/ToG 端行业专业知识,为下游 C 端业务场景和B/G 端商业生态进行技术赋能,助力大模型不断向上生长。国内大模型商业应用大幕徐徐拉开,厂商加速战略布局,加大资金和技术投入,持续打磨大模型,迎头赶上全球大模型产业化浪潮。大模型发展路线逐渐清晰,MaaS 将重构商业化生态(1/3)来源:沙利文整理训练基础设施训练基础设施及底层技术及底层技术基础应用基础应用B/G B/G 端垂直应用端垂直应用大模型厂商向 B 端和 G 端客户提供大模型的各项AI 技术能力的调用,实现行业大模型及细分场景大模型的应用,如智慧城市、智慧生活、智能制造、智能汽
68、车等多模态基模型基于 Transformer 架构,而 RLHF 能够帮助基础大模型不断发展,解锁新的能力领域大模型包括 CV 大模型、NLP 大模型、多模态大模型等,未来 CV 大模型以及多模态大模型将迅速发展,成为主流大模型训练基础设施,如计算网络存储、GPU 卡等,能够有效支撑大模型的开发训练;底层技术,如深度学习框架、自动化数据标注等底层技术能够助力夯实大模型底座C C 端垂直应用端垂直应用打造泛化通用能力打造泛化通用能力以页面程序方式和用户互动,迭代问答式数据反馈,落地形式有软件程序如插件及 App、智能硬件等,具体场景有商业办公、商业文档、搜索引擎、语音助手等推进商业化落地推进商业
69、化落地19MaaSMaaS,即即 ModelModel as as a a ServiceService,能够降低能够降低 AIAI应用开发门槛应用开发门槛,重构重构 AIAI 产业的商业化结产业的商业化结构生态构生态,激发新的产业链分工和商业模式激发新的产业链分工和商业模式不断涌现不断涌现。MaaSMaaS 将可能成为未来大模型将可能成为未来大模型的主流商业模式的主流商业模式。MaaSMaaS 模式将由基础层模式将由基础层、中间层以及应用中间层以及应用层三部分组成:层三部分组成:基础层将提供多模态基模型以及 CV、NLP、多模态等领域大模型,输出泛化能力,对外开放大模型的调用接口;中间层将付
70、费使用接口,直接调用基础模型,基于行业特色数据与知识进行精调开发行业大模型,精准适配 AI具体应用需求,如汽车领域的自动驾驶、医疗领域的蛋白质解析等,以及企业私有模型;应用层上将进行多样化的 SaaS 应用以及新一代智能硬件的开发,杀手级应用、现象级产品未来将有望出现。基础层需要具备大算力基础层需要具备大算力、大数据大数据、强算法强算法等核心技术能力等核心技术能力,是科技巨头以及部分科是科技巨头以及部分科研机构高校的竞赛研机构高校的竞赛。基础层以上,包括中间层和应用层,将存在巨大的商业机遇,不仅限于科技巨头,各类公司都将有机会拿到入场券。创业公司更多的机会也在基创业公司更多的机会也在基础层以上
71、础层以上,在大模型精调、应用开发、边缘模型部署等领域参与到 MaaS 商业化生态,例如基于 Stable Diffusion 设计的Riffusion 音乐创作工具等 AI-enabled 的各类软件。能够实现最后一公里商业化落地的公司更有望脱颖而出。大模型发展路线逐渐清晰,MaaS 将重构商业化生态(2/3)MaaSMaaS 产业一体化架构产业一体化架构来源:阿里云栖大会,昆仑芯,沙利文整理吃吃吃计算计算/存储存储/网络网络/数据库数据库云云/GPU/XPU/GPU/XPU中间层:行业大模型中间层:行业大模型基础层:多模态基模型基础层:多模态基模型NLP NLP 大模型大模型CV CV 大模
72、型大模型多模态大模型多模态大模型AI4S AI4S 大模型等大模型等SaaS SaaS 应用应用智能硬件智能硬件基于基于 API API 接口接口优化微调优化微调提供提供 SDK SDK 产品产品/一体化解决方案变现一体化解决方案变现应用层应用层吃基础层:领域大模型基础层:领域大模型多模态多模态RLHFRLHF20MaaSMaaS 模式在模式在 B/GB/G 端和端和 C C 端的商业化落地端的商业化落地有所区别有所区别。C C 端用户量巨大端用户量巨大,工具使用门槛较低工具使用门槛较低,落地以及未来成长速度更快落地以及未来成长速度更快,“应用应用商店商店”等创新商业模式不断涌现等创新商业模式
73、不断涌现。通过“对话+插件”形式将大模型单点工具接入厂商自有或第三方应用,将打造新的用户交互界面和入口。目前Chat-4 已应用于微软必应搜索引擎,ChatGPT 接入第三方网上购物及机票预订等平台、阿里巴巴“通义千问”大模型将连接旗下所有产品。插件形式将覆盖用户生活的方方面面,打造完整的生态系统。而随着 Adept 等无需 App 交互,自动执行操作响应用户需求的产品出现,未来 MaaS 模式下 C端商业化落地形式将不断创新,颠覆传统,具有广阔的想象空间。B/GB/G 端需要针对行业领域和业务场景端需要针对行业领域和业务场景进行大量工程工作进行大量工程工作,尤其是传统行业尤其是传统行业的知识
74、获取和积累需要较长时间的知识获取和积累需要较长时间,即使是同一个行业下,细分场景的痛点不同,AI 大模型渗透率也有明显差异。应用场景碎片化的特点导致低成本、易用、泛化能力较强的能力平台构建需较长周期,但但 B/GB/G 端客户付费能力端客户付费能力更强更强,未来盈利空间及成长空间广阔未来盈利空间及成长空间广阔。据分析,从美国市场看,目前 ToB 应用的数量大于 ToC 应用,通用工具数量大于具体场景应用数量主要集中于市场销售、客服/CRM/CEM、企业内部生产力工具等。未来未来 B/GB/G 端市场端市场,MaaSMaaS 落地的主流商业落地的主流商业模式将按照数据请求量和实际计算量计算模式将
75、按照数据请求量和实际计算量计算。通过对外开放大模型的 API 调用接口,让开发者灵活地使用基模型服务,典型案例是 GPT 基于对外 API 的收费模型。基于此,垂直行业厂商可以提供 SDK 产品或一体化落地解决方案变现。大模型厂商也大模型厂商也可以通过推出可以通过推出 ToBToB/ToGToG 的单点工具的单点工具,按按文本文本、图像或语音等不同形式的内容量收图像或语音等不同形式的内容量收费费,如 DALLE 可以根据每张图片的分辨率和请求计算量计费。未来未来 C C 端市场端市场,MaaSMaaS 落地的主流商业模落地的主流商业模式为软件订阅费用式为软件订阅费用,以及第三方以及第三方 Ap
76、pApp 的的推广和订阅分成费用推广和订阅分成费用。基础层大模型厂商可以基于大模型推出类似 ChatGPT 的单点工具,以月度或年度订阅费提供产品功能使用,为用户提供灵活和便捷的购买方式。未来盈利模式也将可能向 App Store式靠拢,通过排行榜、广告位等收取费用。大模型发展路线逐渐清晰,MaaS 将重构商业化生态(3/3)来源:拾象科技,沙利文整理ToC ToC 方向大模型将成为“操作系统方向大模型将成为“操作系统+应用超市”应用超市”ChatGPTChatGPT通义千问通义千问21关键发现章节章节三三AI 大模型挑战犹在,企业发展仍需迎难而上大模型挑战犹在,企业发展仍需迎难而上技术和安全
77、伦理等层面的多重挑战技术和安全伦理等层面的多重挑战,成成为大模型发展和应用道路上的阻碍为大模型发展和应用道路上的阻碍,考考验大模型厂商的技术和验大模型厂商的技术和 AIAI 治理能力治理能力。大模型厂商在数据管理数据管理、AIAI 基础设施建基础设施建设与运营设与运营、模型系统和算法设计等全栈模型系统和算法设计等全栈大模型训练与研发能力的积累大模型训练与研发能力的积累对于大模型的开发落地不可或缺。基于繁荣的开繁荣的开源生态源生态,厂商近年来业务场景落地经验业务场景落地经验的沉淀的沉淀,能够孵化迭代更优秀的技术产品。在先进且持续的 AIAI 安全治理举措安全治理举措的加持下,AI 大模型厂商能够
2020年全球黄麻、红麻、剑麻、蕉麻、椰棕及相关纤维数据统计报告(英文版)(43页).pdf
IMT-2020(5G)推进组:5G零信任安全技术研究报告(22页).pdf
帕克街(Parklu):旅游网红营销分析报告(英文版)(22页).pdf
PRI&UNEP FI&世代基金会:中国的ESG数据披露—关键ESG指标建议(31页).pdf
普华永道(PwC):第25期全球CEO调研中国报告(英文版)(43页).pdf
阿拉丁:2017年小程序生态白皮书(98页).pdf
半导体硅片行业深度报告:市场下游需求旺盛,国产替代进程加速-220525(40页).pdf
第三代半导体产业技术创新战略联盟:GaN微波射频技术路线图(2020版)(87页).pdf
传媒行业Web3.0系列之一:Web3.0框架下的游戏发展新方向-220527(22页).pdf
蜜雪冰城招股说明书-连锁茶饮第一股(724页).pdf
麦肯锡:2023中国消费者报告:韧性时代(33页).pdf
线上健身第一股-keep招股说明书(463页).pdf
罗振宇2023“时间的朋友”跨年演讲完整PDF.pdf
QuestMobile:2022新中产人群洞察报告(37页).pdf
小红书:2023年度生活趋势报告(34页).pdf
QuestMobile:2022年中国短视频直播电商发展洞察报告(30页).pdf
工业4.0俱乐部:ChatGPT认知白皮书(151页).pdf
町芒:2022现制茶饮行业研究报告(47页).pdf
哈尔滨工业大学:ChatGPT调研报告(94页).pdf