《2024全球各类大模型研发现状、商业应用前景及主流营收模式分析报告(38页).pdf》由会员分享,可在线阅读,更多相关《2024全球各类大模型研发现状、商业应用前景及主流营收模式分析报告(38页).pdf(38页珍藏版)》请在三个皮匠报告上搜索。
1、2 0 2 3 年深度行业分析研究报告CONTENTS目录大模型未来:应用多点开花,产业智能跃迁1大模型演进:工业革命级的生产力工具324大模型现状:GPT引领,百模征战投资建议:关注数据端&模型端&应用端资料来源:中国信通院、吉林大学学报、Cornrell University、Attention Is All You Need,中航证券研究所整理算法的迭代推动人工智能的发展:几十年来,AI领域持续探索,1940-1980s符号AI占主导,1980年后,统计AI与神经AI齐头并进,二者竞争发展至今,GPT系列属于神经AI。符号(Symbolic)AI:二十世纪80年代以前属于符号AI时代,开
2、启了以知识建模算法、专家系统算法为代表AI早期发展阶段;统计(Statistical)AI:1985年的贝叶斯网络和1995年的SVM是20世纪机器学习发展的两大标志,但近年来,逐渐成为非主流的研究方向;神经(Neural)AI:经历了1980s-2012年神经网络、2012年后的深度学习两大阶段,深度神经网络和模型大小呈正相关,伴随着模型参数量的增加,相对应深度神经网络的能力将大幅提升,Google Brain的Transformer和OpenAI的GPT系列都属于深度学习领域的代表作。将人类专家的知识和经验转化为计算机可以理解的形式,并利用AI技术来实现手写规则,简单粗暴只能处理非常少量数
3、据知识建模、专家系统找到一些函数或参数分类固定量数据应用于数据分析、预测和分类等任务机器学习1970-1980s 1985至今1980s-2012 2017 2018像人脑一样学习开始尝试大量数据提前标注数据应用于计算机视觉、自然语言处理、语音识别等领域神经网络基于Transformer架构投喂海量学习数据无监督训练方法通用文本预训练GPT系列全注意力机制关注文本序列数据整体注意力Transformer深度学习Neural AIStatistical AISymbolic AI神经人工智能图表1:人工智能的发展历史1.1 大模型推动人工智能发展:ANI-AGI-ASI资料来源:灼识咨询,中航证
4、券研究所图表2:人工智能的三种类型比较1.1 大模型推动人工智能发展:ANI-AGI-ASI目前,ANI已经广泛应用,AGI处于研发阶段,大模型是实现AGI的重要路径。ANI(专用人工智能,Artificial Narrow Intelligence)又称为弱人工智能,是专注于执行某一领域任务的经过训练的人工智能,是目前大多数的AI形式;AGI(通用人工智能,Artificial General Intelligence)是指一种具有与人类相当的认知能力的智能系统,能够理解、学习、计划和解决问题,目前尚未真正实现;ASI(超级人工智能,Artificial Super Intelligence
5、)指在几乎所有领域都超过最优秀的人类所具备的智能、知识、创造力、智慧和社交能力的智能系统。擅长领域具备能力发展成熟度专用人工智能(ANI)某一特定领域具备执行能力已应用广泛通用人工智能(AGI)大部分领域拥有能够与人类相媲美的智慧处于研发阶段超级人工智能(ASI)所有领域全知全能尚处早期资料来源:灼识咨询、阿里云,中航证券研究所 1.2 大模型的技术原理:以“大规模预训练+微调”范式满足多元化需求 人工智能大模型:人工智能大模型是在参数和架构的基础上构建起来的一种结构,是人工智能迈向通用智能的里程碑技术,通过预先在海量数据上进行大规模训练,而后能通过微调以适应一系列下游任务的通用人工智能模型。
6、在“大数据+大算力+强算法”的加持下,进一步通过“提示+指令微调+人类反馈”方式,可以实现一个模型应用在很多不同领域。大模型VS小模型:人工智能的发展已经从“大炼模型”逐步迈向了“炼大模型”的阶段。“小模型”,针对特定应用场景需求进行训练,能完成特定任务,但是换到另外一个应用场景中可能并不适用,需要重新训练,如果某些应用场景的数据量少,训练出的模型精度就会不理想;“大模型”,在大规模无标注数据上进行训练,学习出一种特征和规则,基于大模型进行应用开发时,将大模型进行微调(在下游小规模有标注数据进行二次训练)或者不进行微调,就可以完成多个应用场景的任务,实现通用的智能能力。图表4:大模型技术原理涌
7、 现 性高 投 入大模型具有重投入、长周期的特点,如每次测试需要海量的算力资源,训练一次成本高达千万美元。工 程 化大模型对数据、算法、算力要求极高,需要工程化的经营思路,需要严格把控数据清洗,把控用于关键性训练的数据,和构建大规模高质量训练的算力。通 用 性大模型可以快速并大规模地与云计算、互联网等其他技术结合,广泛地应用在经济的各个领域。大模型参数超过百亿级时,模型性能会呈现出指数级增长,同时能够对未经专门训练的问题举一反三。图表3:大模型的特性资料来源:头豹研究院、沙利文,中航证券研究所图表5:AI大模型基本分类1.3 大模型类型:NLP为目前主流应用,文本/图像模态应用较成熟 按照功能
8、可分为NLP大模型、CV大模型、科学计算大模型和多模态大模型。NLP(Natural Language Processing,自然语言处理)大模型:LLM为NLP大模型的一种,主要用于处理自然语言文本数据,具备强大的语言理解和生成能力,帮助人奏完成问答、创作、文本等工作,例如Opcn Al的GPT系列模型;CV(Computer Vision,计算机视觉)大模型:主要用于处理图像和视频数据,具备强大的围像识别和视频分析能力,如人脸识别、物体检测等,具体可以在智能驾驶、安防等领圾进行利用,例如腾讯的PCAM大模型;科学计算大模型:主要用于解决科学领圾的计算问题,如生物信息学、材科科学、气侯模拟等
9、,需要处理大规模教值数据,例和华为的盘古气象模型;多模态大模型:可以同时处理多种类型的模态数据,如文本、围像、语音等,实现跨模态搜索、跨模态生成等任务,已有的渗透应用具休包括搜索引学、办公工具、全融电商等,例如谷歌的Vision Transformer模型。大模型类别基本功能下游应用应用占比应用表现分析NLP自然与处理大模型文本分类情感分析问答系统金融、泛消费、办公等交互类场景在交互类场景中发挥重要作用,商业化应用程度高所处阶段:快速发展期CV计算机视觉大模型物体检测人脸识别图像分类安防、工业、交通、物流、医疗等领域已助力安防、物流等领域提升视觉泛化,国内众多企业正深耕于研发和内部测试所处阶段
10、:发展初期科学计算大模型气候模拟生物信息学数值模拟生物制药、气象预报、材料研发等领域用于解决复杂科学问题,但需要专门高性能计算机的支持所处阶段:雏形阶段多模态大模型跨模态检索多模态生成多媒体理解泛娱乐、传媒、电商等领域应用潜力较大,但当前仍有关键性问题尚待解决所处阶段:雏形阶段资料来源:灼识咨询,中航证券研究所图表6:AI大模型的应用场景(按模态区分)1.3 大模型类型:NLP为目前主流应用,文本/图像模态应用较成熟 AI大模型掀起多模态和多场景革命,重塑AI技术范式,提升模型能力天花板,应用价值显著提升。多模态融合模型通过充分利用大模型的泛化能力、构建多模态数据集、解决融合和对齐问题,以及提
11、供强大的计算资源支持,可以将不同类型的数据(如图像、视频、声音等)通过预处理转化为统一的表示形式,结合多个模态的信息进行联合建模和分析,从而提升其在多个感知任务上的性能和表现。CONTENTS目录大模型未来:应用多点开花,产业智能跃迁1大模型演进:工业革命级的生产力工具324大模型现状:GPT引领,百模征战投资建议:关注数据端&模型端&应用端资料来源:机器之心pro、灼识咨询,中航证券研究所整理图表7:GPT产品迭代图2.1 ChatGPT:功能加速迭代升级,引领多模态能力跃迁 从GPT-1至GPT3.5跨越4年多时间,ChatGPT发布仅一年,GPT迭代开启“加速度”,现已具备多模态能力,并
12、搭建GPTs生态,将定制化模型从ToB推广到ToC。2017.6,谷歌发布Transformer,成为后来所有LLM的基础架构,也是GPT的基础架构GPT-1 2018.6,OpenAl发布基于Transformer Decoder架构的GPT-1,模型拥有1.2亿参数GPT-22019.2,OpenAI发布GPT-2,模型拥有15亿参数,具有零样本(zero-shot)的多任务能力GPT-32020.5,OpenAI发布GPT-3,模型拥有1750亿参数,具有小样本(few-shot)学习的能力GPT-3.52022.11,OpenAl发布InstructGPT的兄弟模型ChatGPT基于G
13、PT-3.5架构使用了对话式的数据组织方式GPT-42023.3,OpenAl发布推出了大型多模态模型GPT-4,不仅能够阅读文字,还能识别图像,并生成文本结果GPT-4V2023.9,OpenAl发布推出了具有视觉功能的GPT-4V,专门针对图像输入做评估和判断工作GPTs+GPT-4 Turbo+Assistant API2023.11,在首届OpenAI开发者大会上,OpenAI正式推出GPTs,向世界展示了GPT-4 Turbo2017-2022年模型内部迭代期:Transformer GPT-1/2/3 InstructGPT(对话式ChatGPT +图像识别 +语音识别、视觉理解)
14、GPTs生态2021.7,OpenAl发布CodeX,加入代码训练,让模型获得理解和生成代码的决定2022.3,OpenAl发布InstructGPT具有Prompt Tuning和RLHF技术,能输出符合人类偏好的内容优化与现实语料库数据集的连接支持多轮对话和结果修正,并能够更快速、更有效地进行人机交互解决更复杂的任务并增强安全性多模态能力叠加图像识别GPTs:用户针对特定目的定制化ChatGPT,构建自己的AI Agent GPT Store上线,OpenAI与开发者收益共享GPT-4 Turbo亮点:更长上下文+更丰富世界知识+更多的控制+多模态能力跨越+定制化+更高的频率上限+大幅降低
15、开发者成本发布GPT assistant API,减轻开发者调用函数工作,拓展OpenAI收入来源支持图像输入并分析为GPT-4V的主要革新其在视觉理解、描述、推理等诸多方面表现出了类似人类水平的能力userid:93117,docid:152806,date:2024-01-31,资料来源:ChatGPT、澎湃新闻,中航证券研究所整理2.1 ChatGPT:低门槛的“APP Store时刻”来临,定制化GPTs催生产业应用革新图表8:ChatGPT更低门槛的“APP Store时刻”来临GPTs任何人无需编码知识,只需要通过对话提供指令设置功能制作GPT Store集合用户可以创建并公开分享
16、GPTs,可搜索/可为创作者付费开发者:定义一个或多个API来连接GPTs到真实世界,如数据库、电子邮件或作为购物助手企业客户:部署仅限内部使用的GPTs,以满足其特定用例、部门或专有数据集的需求普通用户:有机会尝试更多优秀的GPTs来满足需求赋能/利好图表9:OpenAI发布的官方GPTs GPTs:“针对特定目的定制的ChatGPT”。OpenAI正式推出GPTs功能,即每个Plus用户都可以通过自然语言构建定制化GPT,定制版的ChatGPT具备带有任何功能的可能性(在保证隐私和安全的情况下),并将其上传到应用商店GPTStore获得分成收入,OpenAI迎来iPhone时刻。不论是开发
17、者还是不会写代码的普通人,都可以拥有自定义版本的GPT;GPTstore 有望为AI应用开发者提供新的触达用户渠道和商业化路径。低门槛、低成本、定制化的特点,使得GPTs具备普及性和颠覆性。GPTs的开发几乎是零成本,零基础的开发者也能完成定制化GPTs的创作,有望颠覆诸多实用型工具(如录音转文字、视频/文字总结、作文批改、商品比价等),更易为公司和个人实现降本增效,助力生产力提升。资料来源:新智元、IT之家、量子位、每日经济新闻、第一财经、各企业官网,中航证券研究所整理2.2 他山之石:海外巨头强强联合,通用大模型加速迭代OpenAI微软Meta谷歌DeepMindAnthropic2022
18、年11月,OpenAI推出GPT-3.5,参数规模为1750亿2023年3月,OpenAI发布GPT-4,参数规模为1.8万亿,接受图像和文本输入2023年9月,OpenAI推出语音和图像输出的GPT-4V,联网功能回归2023年9月,微软深化与 OpenAI 的合作,在 Bing Chat 中引入对 DALL-E 3 的支持,并向所有用户免费开放。2023年10月,微软和OpenAI合力开发自研AI芯片,以更高效、更低成本地适配大模型,满足未来算力需求。2023年2月,微软推出New Bing,正式发布搭载GPT-4的Bing Chat2023年9月,微软将GPT-4搭载的Copilot应用
19、于Windows软件产品2023年10月,Copilot 出现亏损,平均每用户每月亏损超过 20 美元2023年10月,Microsoft 考虑为其 Bing 搜索引擎使用性能较低、成本更低的 AI 工具,基于 Meta 的开源 AI 软件进行开发2021年6月,微软推出AI代码补全工具GitHub Copilot2023年9月,DeepMind创始人表示,GPT-5在秘密训练,比GPT-4大100倍2023 年 2 月,Meta AI 在其官网公开发布了开源大模型LLaMA,包括 70 亿、130 亿、330 亿、650 亿 4 种参数规模2023年7月,Meta推出新一代开源大模型Llam
20、a 2,较于上一代训练数据提升了40%,接近GPT-3.5水准2023年9月,Meta发布LLaMA 2 Long 模型,上下文达 3.2 万 token,并在多个任务上打败 ChatGPT 和 Claude22022 年 4 月,谷歌发布PaLM自然语言预训练大模型,拥有 5400 亿参数2018年10月,谷歌发布Bert,参数规模为1.1亿,实现上下文双向预测2023年3月,谷歌推出PaLM-E多模态视觉语言模型,拥有 5620 亿参数2023年5月,谷歌发布PaLM2,拥有 3400 亿参数,提供了Gecko、Otter、Bison 和 Unicorn四种规模版本2021年12月,Dee
21、pMind发布了Gopher语言大模型,参数规模为2800亿2022年5月,DeepMind推出Chinchilla,具有700亿个参数和1.3万亿个token数据量,在微调和推理方面使用的计算资源明显较少2022年9月,DeepMind提出以Chinchilla为基础的Sparrow可能会在2023年晚些时候进入测试阶段2023年2月,为应对ChatGPT,谷歌旗下专注语言大模型领域的“蓝移团队”宣布,正式加入DeepMind,旨在共同提升LLM能力。2023年3月,Anthropic发布Claude自然语言处理驱动的基于AI的对话助手,通过使用“宪法式AI”(Constitutional
22、AI)的技术进行训练,对其进行限制和奖励,成为有益、无害和诚实的助手2023年7月,Anthropic在官网正式发布Claude 2,支持多达200K个token的上下文,成为AI大模型领域内容输入限制之最,使用的训练文本内容截止时间为2023年初2023年9月,亚马逊宣布将向Anthropic投资高达40亿美元,以加强与竞争对手在云计算领域的竞争。亚马逊的员工和云客户将尽早获得 Anthropic 的技术,并将其整合到自己业务中。图表10:国外大模型及其合作伙伴大模型,63%应用,21%基础设施,8%商业模型,8%2.2 他山之石:大模型加速渗透垂直场景,硅谷融资最关注对话机器人、多模态及行
23、业模型资料来源:AICoin、光维智能、非凡产业、钛媒体,中航证券研究所整理图表11:关键领域细分市场的资金占比及各类应用程序的投资金额(百万美元)图表12:23H1硅谷AI垂类场景应用的初创公司融资情况领域被投公司融资轮次融资金额(百万美元)领域Inflection Al风险投资1300AI助理对话机器人AnthropicC轮450AI对话机器人Character AlA轮150AI对话机器人Alltius种子轮2.4AI助手研发FigureA轮70AI人形机器人XIA2轮23.5人形机器人RunwayC轮141文生视频Synthesia AlC轮90文生视频CaptionsB轮25文生视频
24、ElevenLabsA轮19文生语音Vectara种子轮28.5生成式AI搜索平台Perplexity AlA轮25.6生成式AI搜索平台Rewind Al风险投资12搜索引擎开发商Rewind Al风险投资12搜索引擎开发商8Flow.ai种子轮6.6工作流自动化引擎服务商DeepLB轮100翻译Even UpB轮50.5法律行业Tome.appB轮43办公HarveyA轮21法律行业Luma AlA轮203D模型研发商Zenarate股权投资15人工智能教练平台Narrato种子轮1AI内容创作平台对话机器人人形机器人多模态搜索行业及其他 应用方面的投资金额仅次于大模型,垂类场景应用的融资
25、中对话机器人占据绝对优势。据Dealroom数据显示,模型制造商筹集到的资金占AIGC资金的60%以上,其次是应用程序和基础设施。其中应用程序投资占总资金的21%,文本生成和数据合成的市场关注度最高。据业界不完全统计,23H1硅谷在人工智能领域共完成了42起融资,总金额约140亿美元(占世界总融资金额的55%),资料来源:量子位,中航证券研究所整理2.3 国内市场:国内大模型紧随其后,竞相发布抢占应用端 国内大模型玩家:科技型企业包括人工智能企业、垂直大模型企业和数据智能服务商相继进场,如商汤科技、度小满和滴普科技等企业。除科技型企业入局外,以百度、腾讯和阿里为代表的互联网云厂商占据中国通用大
26、模型行业多数市场份额,他们在布局时间、基础设施建设、应用场景等方面具备明显优势。垂直赛道综合赛道生态链场景公司研究机构AI公司互联网等大厂文字图像视频虚拟人游戏音频合成数据撰写代码在B端创作工具上有独特优势关注成果转换NLP和TTS公司本身有长期的发展优势,且AI公司可与自己的AI后台进行联动,提供具有延展功能的AIGC服务有明确的使用场景和流量入口,后发优势强,对初创公司易形成后期发展威胁图表13:国内大模型玩家资料来源:澎湃新闻、央广网、人民网、券商中国、各企业官网,中航证券研究所整理2.3 国内市场:国内大模型紧随其后,竞相发布抢占应用端百度2021年11月,百度发布ERNIE 3.0
27、Titan,参数规模为2600亿2023年3月,百度发布生成式AI文心一言,基于文心大模型 3.0打造,拥有超过1000亿个参数2023年5月,文心一言升级到 2.0,6月上线的文心一言 V2.1.0搭载文心大模型3.52023年9月,科大讯飞携手华为数据中心网络宣布启动AI运力底座联合创新项目,华为星河AI网络加速讯飞星火大模型训练,科大讯飞与华为数据中心网络联合创新,利用星河AI网络解决方案构筑一个大规模、高吞吐、高可靠的AI高性能数据中心网络2023年10月,据科创板日报报道,百度正加紧训练文心大模型4.0华为2023年4月,华为云发布盘古系列大模型,包括中文语言(NLP)、大模型视觉(
28、CV)、多模态、科学计算、图网络(Graph)这五个基础大模型(L0)2023年7 月,华为云发布盘古大模型 3.0,包括5+N+X三层架构,三层分别指 L0 层的 5 个基础大模型、L1 层的 N 个行业通用大模型、以及 L2 层可以让用户自主训练的更多细化场景模型阿里2023年4月,阿里发布了超大规模的语言模型通义千问并开启邀测2023年8月,阿里云宣布QWen-7B和QWen-7b-Chat开源,两个模型的参数规模都是70亿,Qwen-7B在超过2.2万亿个标记上进行了预训练,上下文长度为20482023年9月,阿里云宣布通义千问正式向公众开放,企业用户可以通过阿里云调用通义千问API2
29、023年9月,阿里云开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,整体训练数据超过3万亿Token智谱AI2022年8月,清华智谱AI开源放出GLM-130B高精度千亿中英双语稠密模型,拥有 1300 亿参数2023年3月,ChatGLM千亿模型开启申请内测,基于GLM-130B,引入面向对话的用户反馈2023年3月,在进行ChatGLM千亿模型内测的同时,清华团队也开放出了同样技术小参数量的版本ChatGLM-6B,基于GLM)架构,具有 62 亿参数,降低推理成本,提升效率2023年3月,文心一言发布,已有650家合作伙伴接入,其中包括多家金融机构。百
30、信银行、新网银行、邮储银行、众邦银行、兴业银行、中信银行、苏州银行、江苏银行等官宣成为”文心一言”首批生态合作伙伴。超过8家券商宣布成为百度“文心一言”首批生态合作伙伴2023年4月,阿里云宣布启动“通义千问伙伴计划”,昆仑数智、朗新科技、千方科技、中金财富、石基集团、用友网络、亚信科技七家顶尖的行业数字化服务商成为首批伙伴,覆盖油气、电力、交通、金融、酒旅、企服、通信行业2023年5月,360集团和智谱AI宣布达成战略合作,双方共同研发的千亿级大模型“360GLM”已具备新一代认知智能通用模型水准,360拥有国内先进的多模态研发团队,在AI技术上有长期积累,将成为智谱AI强有力的研发合作伙伴
31、图表14:国内头部大模型玩家及其合作伙伴 海外APP发展迅猛,ChatGPT后军突起抢占市场 随着ChatGPT的发布,AI聊天机器人赛道迅速升温。根据SensorTower数据,截至23H1,市场相关应用数量达200余款,下载量突破1.7亿次,竞争十分激烈。Codeway旗下基于ChatGPT API的应用“Chat with Ask AI”一经推出便迅速获得用户青睐,4月下载量超过1000万次。凭借强大的问答功能和流畅的问答体验,23H1该应用下载量突破2500万次,收入超过1600万美元,成为AI+Chatbot赛道下载量和收入最高的应用。资料来源:SensorTower,中航证券研究所
32、整理图表16:海外AI+对话APP产品时间线图表15:海外头部AI+Chatbot应用下载量趋势Replika:MyAI Friend2017.92020.32021.32021.52022.122023.32023.52022.122023.12023.32023.52023.52023.72023.92023.11AI FriendGeneratorChai-Chatwith AI botsOpen Chat AIGenie-AIChatbotAI Chat-Chatbot AI AssistantChat On-AI Chat Bot AssistantChat&AskAl by Cod
33、ewayChatAI-AIChat Bot AssistantChatGPTMicrosoft:Bing ChatGoogle:BardABB and Microsoft:Genix CopilotAdobe:FireflyxAI:Grok2.4 爆款应用对比(AI+对话):ChatGPT引领下,百花齐放,多款APP开始收费资料来源:阿里云、六合咨询、GetGenie等,中航证券研究所整理类型功能模型更新定价ChatGPT任务达成类自动生成文本:根据输入的文本自动生成剧本、企划等自动问答:自动生成答案自动摘要:总结输入的文本编写和调试计算机程序语音和图像功能:提供新的交互方式。GPT-3.5G
34、PT-42023.3.12 OpenAI发布多模态模型GPT-4,免费用户可通过申请API或升级为plus用户使用GPT-4服务2023.7 OpenAI 使其专有的 Advanced Data Analysis 功能对 ChatGPTPlus 的所有订阅者都可用。提供包括数据分析和解释、即时数据格式化、个人数据科学家服务2023.9 新增对话、图像识别功能2023.10 新增了DALLE-3图像生成功能免费版Plus版$20/月Genie-AI Chatbot任务达成类拥有ChatGPT基础功能SEO分析与优化根据命令或查询与人工智能聊天提供30+写作模板Text-davinci-003GP
35、T-4GPT-32023.3 推出精灵模式,使用OpenAI的text-davinci-003语言模型。允许用户在提示下给出指令,并得到更详细的回应2023.8 推出新的AI虚拟助手,配备22款聊天个性,配备了持续的NLP技术,可以理解各种音调,并根据请求创建相关和有用的响应,更像人的人工智能免费版Writer版$19/月Pro版$49/月机构版$99/月Replika:My AI Friend情感陪伴类像人一样聊天支持视频通话和语音通话编写日记、歌曲和故事等生成对话模型强大的记忆力拥有数百亿参数的大模型2023.2 推出高级AI模式,提供高质量的响应和更好的记忆能力2023.6 推出询问Re
36、plika功能,提创建更有趣,信息丰富和鼓舞人心的互动免费版高级版$19.99/月$299.99/终身Character AI情感陪伴类用户可以创建并与各种AI角色互动,每个角色都具有独特的属性和对话能力。LLM模型2023.5 移动端正式登陆全球 iOS和Android系统2023.10 推出了一项新的群聊功能(Group Chat)免费版Plus版:9.99美元/月或120美元/年图表17:海外头部AI+对话产品对比2.4 爆款应用对比(AI+对话):ChatGPT引领下,百花齐放,多款APP开始收费 从访客预期上来看,可分为任务达成类(咨询型和任务型)和情感陪伴类。AI任务达成领域,基于
37、GPT的ChatGPT和Genie均已变现。相比于其他AI对话模型,ChatGPT在用户规模和变现能力大幅领先,年收入已达10亿美元。AI虚拟陪伴领域,Character AI的下载量、访问量明显领先同类产品。Character AI创始人为前谷歌员工,产品更注重情感陪伴、角色扮演、游戏娱乐、荷尔蒙等既有普世性,容忍度又高的需求。Techcrunch2023年10月数据显示,Character.AI拥有3,000万月活用户,美国地区月活700万。据Character AI披露的数据,用户每次访问平均使用时长29分钟,而ChatGPT每次用户使用时长仅8分钟;截至2023年8月,Characte
38、r.AI平台用户日均使用时长2小时,用户粘性更高。资料来源:钛媒体、观察者网、界面新闻、华夏时报等,中航证券研究所整理图表18:国产头部对话式AI产品对比20233.3.16 推出网页端产品2023.6.21 上线官方插件ChatFile,可基于长文档进行问答和摘要2023.8.9 上线指令中心功能2023.8.16 上线及升级多款原生插件(览卷文档、E言易图、说图解画)2023.10.17 发布文心大模型4.0,不逊色与GPT-4回答问题文本生成与创作、文本改写提供具有逻辑清晰、条理分明的分析和解决方案回答问题,提供定义、解释和建议,文本翻译总结文本,生成文本,写故事,分析情绪,提供建议开发
39、算法,编写代码多模理解:上传图片素材,大模型完成识别理解,返回关于图片的准确描述视觉问答:围绕上传图片素材,响应用户的问题,大模型完成回答多模生成:根据用户的描述,生成符合期望的合成音频和视频虚拟人视频:描述期望的视频内容,整合AI虚拟人,快速生成匹配视频2023.4.7 正式发布产品2023.10.31 发布通义千问2.0发布后至今,一直在提升中英文生成、理解、代码、数学和逻辑能力2023.5.6 正式推出星火认知大模型,并上线插件开放平台2023.5.22 讯飞iCase会话智能系统2.0上线,上线星火助手2023.6.9 讯飞星火认知大模型升级,升级开放式知识问答、逻辑和数字能力、以及多
40、轮对话,三大综合能力升级。2023.8.15 发布讯飞星火认知大模型V2.0,发布代码能力与多模态能力,升级通用人工智能能力只有文本+其他多模态能力+图像+语音2.4 爆款应用对比(AI+对话):国产对话式AI产业链日益完善,但理解力、逻辑性仍有差距 通过横向对比各应用在完成不同细分领域任务时的效果,以及体验各应用的特色功能,认为各应用间存在差异化的定位:国内头部的对话模型已经具备较强的总综合实力。百度文心一言、讯飞星火为“六边形战士”型,在众多细分应用场景有垂类AI助理解决特定任务,具备除对话外的多模态理解能力,讯飞星火更是能够生成视频;通义千问划分相应垂类AI助理,但数量少于前两者,且现阶
41、段只具备文字理解和生成能力;腾讯混元也划分众多细分场景,但仍在内测阶段,关注其正式上线节奏。国内大模型发布数量与美国差距不大,但影响力和产品力仍存在差距。但从整体的影响力来看,国内大模型无法像OpenAI、谷歌一样形成世界性的影响力,且国内一级市场对大模型项目的投资并不如美国那样火热,国内更倾向于利用龙头企业的开源模型来做应用落地的创业,未来国产对话式AI的发展主要关注国内大模型的迭代速度。三款现象级应用“出炉”,付费模式基本已经形成,Dall-E 3和Midjourney各有所长。三块现象级应用:DALL-E是由OpenAI的通过文本描述中生成图像的人工智能程序,最新版本是DALL-E 3,
42、在图像的细节理解、准确度等多维度表现优秀。Midjourney是一款AI生成器,用户可通过Discord的机器人指令输入文本进行操作,创作图像作品,功能包括人物卡通化、轮廓生成、视频换脸、视觉问答和人脸合成等,其服务可以按月/年有偿订阅。Stable Diffusion是由Stability AI推出的基于LDM模型的开源产品,能够在给定任何文本输入的情况下快速生成图像。Dall-E 3和Midjourney各有所长:使用效果方面,Dall-E 3受益于GPT-4强悍的自然语言处理能力在对故事画面的理解上更胜一筹,画质上Midjourney更加出色,而StableDiffusion若在本地没有
43、足够的训练,图像视觉的美观度和连续性方面都明显落后于Dall-E 3和MidJourney。资料来源:Simplilearn,中航证券研究所整理图表19:海外AI+图像应用对比DALL-EMidjourneyStable Diffusion特点专门从文本描述中生成图像,擅长创造逼真且高质量的视觉效果。专注于图像操作和变换,提供工具和滤镜以修改和风格化现有的视觉效果。AI模型,通过去除噪点和提高整体质量来增强图像。特别擅长恢复低分辨率或质量下降的图像。访问方式Dall-E官网或ChatGPTMidjourney是独立软件,可以购买并安装在个人设备上。可以通过兼容AI的框架或库访问,通常需要技术专
44、长才能有效实施和使用。成本官网15美元/115次,或购买ChatGPT plus 20美元,在ChatGPT中直接访问使用基础/标准/pro/Mega:每月10/30/60/120美元可免费使用付费分为学徒/工匠/大师三个级别,每月12/30/60美元图像质量生成高质量的图像,对输入描述的细节和忠实度表现出色,经常展示出逼真的纹理和形状。取决于输入的视觉效果和应用的修改,提供广泛的艺术滤镜和效果,以创造性地增强和风格化图像。通过减少噪点、锐化细节和提高整体清晰度来提高图像质量。在恢复图像清晰度和减少人工痕迹方面特别有效。创造力通过基于文本提示的图像生成,激发用户的创造力,使用户能够将想象力转化
45、为现实,可视化独特的概念或想法。通过提供工具,鼓励创造性地操作和变换图像。更注重图像的恢复和增强,而不是创造性探索。互动性通过文本输入提示进行,用户可以尝试不同的描述来生成对应的图像,提供即时的视觉反馈。提供直观的图形用户界面(GUI),允许用户直接与图像互动并实时应用修改。取决于在AI框架内的具体实现,并可能需要编码和技术专长来交互式使用。2.4 爆款应用对比(AI+图像):海外应用降本增效效能凸显,商业模式逐渐清晰资料来源:优设网,中航证券研究所整理2.4 爆款应用对比(AI+图像):海外应用降本增效效能凸显,商业模式逐渐清晰图表21:基于相同提示词Dall-E 3、Midjourney、
46、Stable difussion的表现对比坐落在悬崖上的现代建筑,有大玻璃窗,俯瞰日落时宁静的海洋。一个牛油果坐在治疗师的椅子上,上面写着“感觉内心很空虚”,中间有一个坑大小的洞。治疗师,一把勺子,潦草地写着笔记。这是一幅水墨速写风格的插图,一只小刺猬用它的小爪子拿着一块西瓜,闭着眼睛高兴地咬了几口。Dall-E 3能够理解更细微的差别和细节,堪当“行业标杆”。基于官方给出的对比图,在同一组提示词下,DALL-E 3 在图像质量和细节呈现上的表现比 DALL-E 2 更好。在和Midjourney、Stable difussion的对比中,Dall-E 3表现更好,能很好地理解“治疗师,一个勺
47、子”“闭着眼睛高兴地咬了几口”这样的自然语言,并准确呈现出对应的形象细节,还能正确地生成“Ijust feel so empty inside(我感到内心很空虚)”这样的文本内容,而Midjourney和Stable Diffusion还无法达到同样的效果。一幅富有表现力的篮球运动员扣篮油画,被描绘成星云的爆炸。图表20:基于相同提示词Dall-E2和Dall-E3的表现对比2.4 爆款应用对比(AI+图像):娱乐性应用“妙鸭相机”,领跑国内AI+图像业务发展资料来源:妙鸭相机官方微信公众号/小程序/APP、36氪、界面新闻等,中航证券研究所整理 妙鸭爆火的背后:超高性价比,产品效果稳定,易于
48、操作,通过社交裂变快速吸引用户。妙鸭相机是一款AI美图小程序,上传20张包含人脸或上半身的照片,支付9.9元,便可生成一个专属数字分身,挑选模板后可以得到各种风格的写真,出片质量不输海马体等专业摄影机构。小程序于7月17日正式上线,通过“分享好友送钻石”的方式在朋友圈快速传播实现高效裂变转化。面临的挑战:商业化进展缓慢,技术壁垒较低,用户隐私问题。图表22:妙鸭相机产品功能介绍制作数字分身 体验模式:首次免费 上传8张不同半身照片 专家模式:上传15-50张照片 附赠30+官方模版免费用生成写真 提供不同风格的写真模板 选择喜欢的模板 一键得到高质量写真造型精修写真 选择喜欢的造型 进行高清化
49、、更像我等精修操作 并对满意的照片进行下载 高清化、下载操作每次消耗2个钻石拥有小程序和App两处入口最大特色是数字分身技术。用户上传多张清晰、张多光线、多视角、多表情的上半身照片后,程序会根据这些照片生成一个数字分身。基于这个数字分身,用户可以选择自己喜欢的模板,进而得到一套个性化的AI写真。这种数字分身技术,让每个人都能够打造出独一无二的形象。制作写真主要功能商业模式服务模式特征免费体验模式专家模式品牌联名合作所有用户都能获得首次体验免费优惠;只需上传1张正面照+7张不同角度的半身照,即可生成体验模式数字分身;体验模式仅赠送一套“都市正装照”模板。赠送1次重置机会、10颗妙鸭钻石、解锁30
50、多套写真模板;同时妙鸭相机也开设了VIP专属通道,排队时间会更短。需要指出的是,目前iOS小程序暂不支持开启专家模式。同携程、同道大叔达成品牌联名合作,分别推出全球旅行和十二星座系列模板。后者是妙鸭相机首次上线IP联名付费模板,共计12款,单个售价为6元。瞄准生活服务领域使得妙鸭相机的产品角色愈发立体,升级为个人形象设计定制的“一条龙”服务,正式跨入高频而广阔的泛生活服务赛道。发型设计用户可以从给定的发型、发色中进行选择和搭配,再结合已生成的个人数字分身制作出不同发型的写真照片。该功能目前仅有女生版可供使用,首批推出的发型包括日系短发、法式波浪、半扎高马尾、甜美麻花辫等9种款式,发色则涵盖棕色
51、、蓝色、绿色、粉色、薄藤紫等10种颜色。是其由“AI摄影师”走向“AI造型师”、追求精细化运营的关键一步。2.4 爆款应用对比(AI+办公):微软Copilot发布,多平台联动全面优化用户体验9月21日,微软召开发布会发布Microsoft Copilot。将人工智能引入到用户最常用的微软产品中并构成单一体验,包括GitHub编程工具、Microsoft 365生产力协同工具箱、Bing搜索引擎、Edge浏览器和Windows操作系统中,同时还将个人隐私和数据安全放在首位。根据发布会公布数据,在一个工作日内,微软最繁忙的用户平均需要检索18次,收到超过250 封Outlook 电子邮件,并发送
52、或阅读近150条Teams 聊天信息。全球范围内,Teams用户每周参加的会议数量相比2020年增加了三倍。而在Windows上,有些人一天内就需要使用11个应用程序来完成工作。可见,Copilot的更新能大幅提高从操作系统到办公软件的工作效率,AI办公迎来价值提振空间。正式集成Win11150项新功能将把Copilot的力量和全新人工智能体验带入到 Windows操作系统中,并融入到画图、照片、Clipchamp 等应用程序中,推出超过150项新功能。任务栏打开使用Windows Copilot 将直接集成到 Windows 11 中,并可在任务栏中打开和使用,适用于所有应用。借助Micro
53、soft 365 Copilot和 Windows 重塑工作体验浏览器Copilot 得到功能优化多模态可视化搜索和图像创建工具用户的聊天记录可以为结果提供参考。例如,如果用户用 Bing 查找过最喜欢的足球队,那么下次该用户计划旅行时,Bing 就会主动告诉 Ta 该队是否正在目的地城市进行比赛。当然,用户可以随时在 Bing 设置中关闭此功能。OpenAI DALL.E 3借助 DALL.E Bing能更好地呈现手指、眼睛等细节。微软将 Microsoft Designer 直接集成到 Bing 中,用户可以更轻松地编辑作品。Microsoft 365 Chat在 Microsoft 36
54、5 Copilot中引入Microsoft 365 Chat。帮助梳理检索工作中的数据,可以回答简单的问题,帮助快速完成复杂、繁琐的任务。文档、预订商旅行程或跟进电子邮件。图表23:微软Copilot发布,多平台联动全面优化用户体验资料来源:Microsoft官网、澎湃新闻等,中航证券研究所整理商业化进展加快Bing Chat Enterprise未来将作为独立产品提供,每人每月5美元;Microsoft 365 Copilot将携手Microsoft 365 Chat登录微软Office软件,在基础的订阅费用上增加每人每月30美元。更新隐私保护新的”内容凭证“使用加密方法为 Bing 中所有
55、A生成的图像添加隐形数字水印,包括最初创建的时间和日期;Bing Chat Enterprise(预览版)为组织提供 AI 支持的网络聊天和商业数据保护。办公软件Copilot将会被内置到用户每天都会使用的Microsoft 365应用中去,其中包括Word、Excel、PowerPoint、Outlook、Teams等2.4 爆款应用对比(AI+办公):WPS已全面接入AI,将开启付费测试 WPS AI基于大语言模型,锚定三大战略方向,目前已接入多个产品线并开启公测,AI应用率先落地。金山办公发布基于大语言模型的智能办公助手WPS AI,并定位为大语言模型应用方。WPS AI已接入WPS文字
56、、演示、表格、PDF、金山文档等多条产品线,并于2023年11月16日开启公测。WPS AI已备案获批,现阶段WPS会员可以直接使用内置AI插件,针对不同用户的使用频次和使用场景上线不同价格区间,预计在2024年1-2季度开放WPS AI付费。图表24:大模型语言接入与应用资料来源:金山办公官网、金融界,中航证券研究所整理图表25:WPS AI三大应用战略大模型文心一言科大讯飞Minimax智谱通义千问统一接入基础功能统一认证报表分析异步任务模型测试超时处理合规审查日志存储限流熔断监控告警管理后台系统合规审查合规审查合规审查合规审查计费账单WPS AI三大应用战略AIGC(内容创作)Copil
57、ot(智慧助手)Insight(知识洞察)文字中应用:通过WPS AI改写、续写、润色演示中应用:通过WPS AI改写、续写、润色文字中应用:秒速分析文本,概括文章深意PDF中应用:快速提炼重点,依据内容回答自然语言指令AI实现复杂操作2.4 爆款应用对比(AI+办公):万兴科技产品大版本升级、AIGC功能上线及多个AI创意新品落地资料来源:万兴科技官网,中航证券研究所整理公司四条主线打造多元化AI+创意软件与服务:视频创意线,强化视频领域AI算法研发,发力多产品多端多垂直场景的AI能力构建,实现视频换脸、影像追踪、AI音乐生成、AI语音增强等功能的落地或优化,同时扩展视觉渲染技术,加强虚拟人
58、训练算法;绘图创意线,全面提升绘图产品智能化能力,增加智能生成、分析和展示等AI功能,增强用户粘性,提升用户体验;文档创意线,进一步扩充文档创意产品矩阵,提升智能化水平,打造智慧文档服务综合解决方案;实用工具线,优化实用工具产品性能,拓宽使用场景,发力移动端和云端数据产品潜力,提升产品价值和市场影响力,保持业务稳健可持续发展。图表26:万兴科技主营业务产品线实用工具线视频创意线绘图创意线文档创意线视频编辑:图片编辑:亿图系列:2.4 爆款应用对比(AI+教育):OpenAI携手教育公司推动应用落地 海外多种教育产品推出AI服务,OpenAI正在探索如何让ChatGPT进入教室 2023年11月
59、17日,OpenAI的首席运营官Brad Lightcap表示,公司正在探索如何将其广受欢迎的聊天机器人ChatGPT带入课堂,OpenAI将在2024年组建一个团队,以研究ChatGPT对于教育行业的应用前景。OpenAI已经与可汗学院(Khan Academy)等教育集团建立了合作伙伴关系,以创建一个人工智能导师与学生对话解决他们的问题,并与施密特未来公司(Schmidt Futures)合作,向服务不足社区的教育集团提供资助。OpenAI在教育领域的布局,在年内已初见成效,包括多邻国在内的多家上市公司业绩和估值均受益于GPT-4的接入。值得注意的是,GPT-4V版本的推出使其具备了对话和
60、图片识别功能,在某种程度上已经能够替代老师来辅助学生完成一部分工作。未来伴随AI大模型的逐步完善,教育领域的垂类小模型出现迭代,叠加国内教育领域的需求驱动,相关应用有望加速推出,具备技术优势和渠道整合能力的公司或将受益。资料来源:36氪、OpenAI官网、OnlineEducation、可汗学院官网等,中航证券研究所整理图表27:海外AI+教育产品梳理产品/服务使用模型具体应用DuolingoGPT-4Duolingo Max接入GPT-4,AI协助解释答案与角色扮演综习对话SpeakGPT-4AI Tutor功能由GPT-4支持,该动能允许学习者参与开放式对话,并获得关于他们的语言技能在词汇
61、、语法等方面的母语的反价CourseraGPT-4基于GPT-4的插件,可以使用该插件在 Coursera 上识别学习内容。类似于学术顾问,该插件可以根据学习者兴参探索推荐新课程Khan AcademyGPT-4使用GPT-4为Khanmigo提供支持,Khanmigo是一款人工智能助手,既可以充当学生的虚拟导师,也可以充当教师的课堂助手Jill Watson-人工智能助教,可以回答学生有关特定课程和课程的问题,通过预训练可以适应不同课程的问题Thinkster Math-通过AI增加概念上不相关的数字,以实现学生对知识的掌握Copyleaks-监测文本、代码等内容是否由AI工具生成,还可实现
62、抄袭检测、AI评分等功能图表28:可汗学院(Khan Academy)接入GPT-4案例展示2.4 爆款应用对比(AI+教育):政策发力+教育需求,国内诸多AI应用加速落地 AI赋能教育已获政策支持,AI辅导机器人在未来或成为“最佳课外导师”,掀起K12教育变革新浪潮。“双减”之下,AI为教育赋能已获政策认可。2023年6月,中办、国办印发关于构建优质均衡的基本公共教育服务体系的意见,明确支持AI+教育在校园内多场景落地。通识/个性化/素质教育需求仍然旺盛,AI赋能将有效助力家长减负,有利于推进教育公平。待到AI能力进一步提升,辅助效果增强,将在一定程度上替代老师的角色,有效提升学生学习效率和
63、减少家长教育付费负担,有望带动相关教育产品市场规模增长。国内相关产品正在加速涌现,科大讯飞、学而思、网易有道有望成为行业领先者。资料来源:公司官网、亿欧网、中商情报网、投资界、财联社、中国科技报等,中航证券研究所整理图表30:国内AI+教育产品落地情况AI学习机智慧课堂AI辅导/课程AI模型图表29:国内AI+教育公司布局情况国内厂商 模型或技术底座名称 落地场景 产品赋能 好未来MathGPT学而思推出基于自研大模型AIGC课程作文助手、口语助手、阅读助手、数学助手科大讯飞星火认知大模型科大讯飞AI学习机星火语伴APP讯飞听见智能屏文本生成、逻辑推理、语言理解、数学能力、代码能力、知识问答、
64、多模态能力七大能力网易有道子曰有道生态内的软硬件LLM翻译、虚拟人口语教练、AI作文指导、语法精讲、AI Box、文档问答中公教育全三维数智人职业教育大模型内部测试阶段课堂内容传递者学习辅助者CONTENTS目录大模型未来:应用多点开花,产业智能跃迁1大模型演进:工业革命级的生产力工具324大模型现状:GPT引领,百模征战投资建议:关注数据端&模型端&应用端资料来源:量子位、Gartner、界面新闻、钛媒体,中航证券研究所图表31:AIGC产业图谱3.1 内容变革:大模型能力变革式提升,助推AIGC步入快车道从AI产业结构来看,大模型是连接底层算力和上层应用的重要一环,成熟的大模型能力和生态是
65、真正实现通用人工智能和未来应用端繁荣的基础。不断创新的生成算法、预训练模型、多模态等技术融合带来了AIGC技术变革,拥有通用性、基础性多模态、参数多、训练数据量大、生成内容高质稳定等特征的AI大模型成为了自动化内容生产的“工厂”和“流水线”。从AI市场规模来看,随着 GPTstore 的出现,AI 大模型将迎来自己的“APP Store”时代,AIGC 商业应用的前景愈发广阔。根据 Gartner的估算,2025年AIGC产生的数据将占所有数据的10%;根据量子位智库的估算,预计到2030年,AIGC 市场规模将超过1万亿人民币规模。AIGC+工业AIGC+医疗AIGC+金融AIGC+传媒AI
66、GC+教育AIGC+娱乐AIGC+电商.文本情感分析新闻撰写剧情续写虚拟客服视频插帧电影风格转换AI换脸搜索引擎Copilot摘要生成问答系统短视频配音地图语音导航.文本生成音频生成图像生成视频生成跨模态生成文本理解结构化写作非结构化写作交互性文本语音机器人音乐合成语音克隆图像编辑与融合2D图像生成3D模型切换视频风格画质增强修复视频内容创作动态面部编辑文本生成图像文本生成音频文本生成视频文本生成代码图像/视频生成文本自然语言理解 NLU自然语言生成 NLGTransformerFlow-based models BERTVAECLIPNeRFGANGLMDiffusionVAEDALLE.C
67、PUGPUDPUTPUFPGAASIC场景层应用层功能层模型层算力层通用数据、垂直领域数据、特定任务下的标注数据、创作者生态数据等数据层资料来源:灼识咨询,中航证券研究所图表:AIGC产业图谱3.1 内容变革:大模型能力变革式提升,助推AIGC步入快车道大模型助推AIGC技术升级,有望掀起新一轮产业革命。AIGC是继PGC和UGC之后,经由AI自动生成内容的新型内容生产方式。作为一种先进的生产力变革,AIGC的兴起让世界进入了智能创作时代;对于企业而言,AIGC在降低内容制作成本、加快内容制作效率的同时提升了内容的多样性及质量,AIGC与不同产业融合互动亦可孕育出新业态新模式;对个人而言,AI
68、GC则显著降低了内容创作门槛。图表33:不同内容生产阶段比较(2000年至今)视觉大模型-提升AIGC感知能力语言大模型-增强AIGC认知能力多模态大模型-升级AIGC内容创作能力图表32:大模型提升AIGC能力资料来源:中航证券研究所3.2 模型演绎:多模态模型重塑 AI 技术范式,进一步拓宽应用边界图表34:多模态泛化能力 AI大模型掀起多模态和多场景革命,重塑AI技术范式,提升模型能力天花板,应用价值显著提升。多模态大模型是结合文本、图像、音频等多种模态信息进行学习和理解的人工智能模型,通过充分利用大模型的泛化能力、构建多模态数据集、解决融合和对齐问题,以及提供强大的计算资源支持,可以将
69、不同类型的数据(如图像、视频、声音等)通过预处理转化为统一的表示形式,结合多个模态的信息进行联合建模和分析,从而提升其在多个感知任务上的性能和表现。多模态模型核心目标是模拟人类大脑处理信息的方式,以更全面、综合的方式理解和生成信息,最终实现更丰富的任务和应用为人工智能应用提供了更加丰富的可能性,也是行业发展的必然性。文字语音图像知识迁移与共享多模态泛化能力模态泛化层能力层多模态数据集文生文文生图图生文视频理解文生视频场景能力层医疗服务智慧办公智能交通病历诊断医疗影像内容梳理票据整理交通监测智能安防资料来源:清华大学、overfit,中航证券研究所3.2 模型演绎:开源 VS 闭源,平衡与适应,
70、协同演化图表35:底层通用大模型 图表36:开源与闭源商业模式的比较 模型层主要分为底层通用大模型和中间层模型。前者目前成为最受关注,建设和提升迫切性最强的领域,后者国内目前尚未出现相关玩家,适合AI公司凭借过往的行业积累和技术积累快速进入。其中,开源大模型意味着信息的自由流通和算法的持续演进,闭源模式更偏重于保护知识产权,确保公司的竞争优势和商业秘密不被轻易复制。开源软件:以开源软件因为开放的代码,能够吸引更多人参与,利用社区的力量不断改进和修复漏洞,提高软件质量;闭源软件:通过闭源,允许企业对技术发展持有更多控制权,以确保产品的稳定性和优化要求,企业可以安全地进行技术创新,而无需担心竞争对
71、手的直接模仿。从商业角度看,这不仅可以形成长期的收益,而且也有助于建立品牌的独特性。开放API:是指一个软件或平台允许第三方开发者使用其接口和数据,以便创建新的应用程序或服务。这种方式促进了跨应用之间的互操作性,从而可以提高整个生态系统的价值。盈利模式开源模型:通过支持服务、咨询、定制开发盈利,闭源模型:则依赖产品和许可证销售。市场竞争开源项目:降低市场进入门槛,增加竞争者数量;闭源项目:则倾向于形成更高的市场控制力。用户生态开源模型:有利于形成大规模用户社区;闭源模型:则维护较小但可能更忠实的客户群体。资料来源:灼识咨询,中航证券研究所3.3 应用落地:B端赋能数智化转型,C端优化智能化交互
72、,企业旨在降本增效图表37:大模型的终端用户分类 大模型的终端用户包括C端、B端和企业自用三类。C端用户一般使用标准化的模型产品,例如智能翻译、智能客服、智能推荐等。B端用户更倾向于选择能满足行业或企业特定需求的个性化解决方案,例如金融机构可以利用大模型来进行风险评估、欺诈检测、客户画像,制造企业可以利用大模型来进行产品设计、生产优化、供应链管理,零售企业可以利用大模型来进行商品推荐、会员管理、营销活动。企业自用的模型旨在降本增效、优化产品体验,例如用大模型来自动化数据处理、提高业务流程效率、改善产品质量等。主要用于个人娱乐、学习和创作。标准化程度高,普造性强强调用户友好性与互动性C端用户订阅
73、针对企业和机构,提供针对性解决方案的大模型通常基于基础大模型,根据不同企业、行业的需求进行一定程度的定制,模型较为异质化、用途多样。强调模型在不同领域的专业能力,以及客户的数据隐私和安全B端企业用户订阅或购买非定制化行业模型主要用于内部业务优化。个性化定制,解决企业独特的问题和需求数据保密性至关重要,强调内部控制和数据安全无直接变现,主要作用在于降低企业自身运营成本并提升效率C端B端企业自用主要特点主要变现模式应用案例资料来源:IDC、钛媒体,中航证券研究所3.3 应用落地:AI PC有望成为个人大模型普惠第一终端,重新定义个人AI助理图表:AI与PC的结合,将形成算力平台+个人大模型+AI应
74、用的新型混合体,即:AI PC,将AI的能力真正惠及每一个人。AI PC在硬件上集成了混合AI算力单元,且能够本地运行“个人大模型”、创建个性化的本地知识库,实现个人化的自然交互。从AI大模型的应用来看,AI PC有望作为个人大模型普惠的第一终端,大模型能够为终端更具效率,更好交互,更有个性,而PC是理想的大模型最优载体,有几点优势:丰富的交互方式和广泛的应用场景+通用计算能力强劲+存储容量大+保护个人隐私安全。AI PC的价值个人AI助理:大模型的计算负载不断从云端向终端下沉,公共大模型和本地大模型混合利用,组合形成专属自己的个人大模型。AI PC是为每个人量身定制的个人AI助理,不仅提高生
75、产效率,简化工作流程,而且更好的掌握用户的喜好,保护个人隐私数据安全。仿佛是用户的数字化拓展或是智能双胞胎。AI PC行业趋势:在AI PC的推动下,PC产业生态将从应用为本转向以人为本,从应用驱动转变为意图驱动。传统PC产业生态以操作系统为基础,用户在系统界面中直接进行操作,并管理和应用各式各样的应用程序。AI PC 产业生态中,个人智能体将成为第一入口,在大模型与应用生态的支持下,准确理解用户指令,给出恰当的反馈,跨应用进行调度,进而完成相对复杂的任务。模型、应用、算力厂商都需要围绕 AI PC(终端)形态下新的以人为本的需求做出改变,在研发工作中对 AI 的高效运行予以充分的考量,以适应
76、 AI PC 新时代。IDC预测,中国PC市场将因AI PC的到来在未来5年中保持稳定的增长态势,台式机、笔记本电脑、平板电脑市场总规模将从2023年的6800万台增至2027年的8000万台以上,增幅接近18%。图表38:PC与AI大模型的天然匹配图表39:PC与AI大模型的天然匹配能进行多模态自然语言交互需要基于个人数据和隐私信息进行微调和个性化服务需要强 AI 算力进行推理压缩后依然具备通用场景服务能力存储容量最大、最受信赖的安全终端最强的个人计算平台承数最多场景的个人通用设备且备全模态人机自然交互条件个人大模型PC传统PC产业生态AI PC产业生态用户应用功能数据通用计算机/芯片操作系
77、统用户应用应用模型混合算力芯片3.4 商业模式:目前以按内容产出为主,未来MaaS将成为主流商业模式多种变现模式初显,AIGC商业化潜力可期。目前来看,AIGC主流的营收模式可分为四种:MaaS、按产出内容量付费、软件订阅付费、模型定制开发费。目前,按照产出量收费的模式占据主流,但随着底层模型即AIGC生态的建立,最具长期增长潜力并将占据主要市场规模的为MaaS模式。据量子位预测,2023年AIGC不同商业模式规模约170亿元,预期2026将翻一番,2030年有望突破万亿市场规模。MaaS(模型即服务):MaaS是一种新型的商业模式,将AI大模型转变为可服务化的产品,通过API接口或者SanS
78、平台,将大模型能力出租给第三方客户使用,能使更多的企业和开发者快速构建自己的应用。MaaS服务模式的发展将促生新的产业生态-即以MaaS平台为核心,联合垂直行业的小公司,共同构建AI应用生态。这种生态模式能更好地满足不同行业和领圾的需求,推动AI技术的广泛应用。资料来源:量子位、灼识咨询,中航证券研究所 图表41:我国AIGC产业不同商业模式分布图图表40:AIGC主流商业模式AIGC主流变现模式案例MaaS,Model as Service,即基于模型调用量进行收费适用于底层大模型和中间层进行变现按照数据请求量和实际计算量计算。例如GPT-3对外提供API接口,四种模型分别采用不同的按量收费
79、方式。按产出内容量收费适用于应用层变现包括DALLE、Deep Dream Generator等AI图像生成平台大多按照图像张数收费关键在于如何从单次好奇驱动的行为切入,保证产品长期的复购率其中会受到具体属性影响,例如版权授予、是否支持商业用途、透明框架和分辨率等软件订阅付费直接对外提供软件Chat GPT Plus目前按月收费,20美元一个月例如个性化营销文本写作工具AX Semantics则以约1900人民币/月的价格对外出售,并以约4800欧元/月的价格提供支持定制的电子商务版本。模型定制开发费传统项目开发制适用于NPC训练等个性化定制需求较强的领域。其他模式包括广告/流量模式(依靠产品
80、获取用户点击,从中获得广告流量,关键在于产品如何获得复购)由于属于小型项目,在市场规模测算中暂不单独考虑60%10%25%5%2023年不同商业模式规模分布总市场规模约170亿人民币按内容产出量收费软件订阅付费模型定制开发票MaaS32%8%13%47%2027年不同商业模式规模分布总市场规模约602亿人民币图表42:OpenAI变现模式概览ChatGPT Plus:AI驱动的自然语言处理工具收费标准:每月20美元DALL.E:文本生成图像模型收费标准:15美元可购买115个积分,约能生成460张图片GPT-4 API接口:可以接受图像和文本输入,产生文本输出收费标准:不超过8K文本长度时,定
81、价为每1K个提示令牌0.03美元.每1K个补全令牌0.06美元ChatGPT API接口产品简介:AI技术驱动的自然语言处理工具收费标准:每1K个提示令牌0.002美元InstructGPT API接口产品简介:专注于解决指导性对话收费标准:每1K个提示令牌0.0004美元-0.02美元DALL.E API 接口文本生成图像Whispor API接口自动语音识别微调模型:增加分类器或特征映射微调GPT-3模型嵌入模型:将一个内容实体映射为低维向量,从而可以获得内容之间的相似度2C2B3.5 政策支持:地方鼓励,中央规范,以科学数据支持大模型开发 随着大模型相关政策的陆续出台,大模型产业发展有望
82、得到进一步推进和规范。数字经济发展的三大核心要素包括算力、数据和算法,其中算力和数据是研发算法的前提,三者缺一不可且需要更好地协同从而创造更大的经济效益。目前算力需要突破上游瓶颈,数据需要充分利用发挥规模优势,以AI大模型为代表的算法成为关键拼图。当前地方政策以鼓励为主,中央政策关注事前规范,地方围绕智能算力建设、公共数据流通和算法场景开放层层递进。资料来源:国家政府网站、每日经济新闻、金融界、金融日报等,中航证券研究所 图表43:国内大模型相关政策2011-2015“十二五”规划推进产业智能化改革促进基于互联网的人工智能应用2015年5月:国务院中国制造2025提出基于信息物理系统的智能制造
83、技术引领制造方式变革推进生产过程智能化2015年7月:国务院国务院关于积极推动“互联网+”行动的指导加速人工智能核心技术突破促进人工智能在生活、工作、公共领域的创新应用,如智能家居、智能终端、服务型机器人等2016-2020“十三五”规划强调人工智能为战略前沿领域制定人工智能发展目标2016年7月:国务院“十三五”国家科技创新规划加强智能机器人等关键技术研发和应用推广整合优化资源配置,瞄准引领未来发展的战略领域2017年7月:国务院新一代人工智能发展规划2023年成为世界主要人工智能创新中心深化人工智能在制造、农业、金融、教育、医疗、交通等领域的融合应用2020年7月:中央网信办等五部门国家新
84、一代人工智能标准体系建设指南加强人工智能领域标准化顶层设计,推动人工智能产业技术研发和标准制定2021-2025“十四五”规划明确人工智能应用的重点领域规范生成式人工智能服务2021年3月:全国人大中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要瞄准人工智能等前沿领域,实施一批具有前瞻性、战略性的国家重大科技项目2022年8月:科技部关于支持建设新一代人工智能示范应用场景的通知强调人工智能在重点领域的应用,包括公共安全、智慧城市、医疗健康、重大活动等需求迫切且普及性强的领域2023年4月:国家网信办生成式人工智能服务管理办法(征求意见稿)规定了提供生成式人工智能产品或服
85、务应当遵循法律法规的要求利用生成式人工智能生成的内容应当体现社会主义核心价值观2024年1月:“数据要素”三年行动计划(20242026年)培育数据驱动型产品研发新模式支持开展人工智能大模型开发和训练等CONTENTS目录大模型未来:应用多点开花,产业智能跃迁1大模型演进:工业革命级的生产力工具324大模型现状:GPT引领,百模征战投资建议:关注数据端&模型端&应用端4.1 AI大模型行业预判资料来源:中航证券研究所 图表44:AI大模型行业预判大模型作为工业革命级的生产力工具,赋能产业数字化大模型迭代升级,多模态化是大势所趋模型应用加速落地,朝着“垂直化、专业化、产业化”方向发展AI PC加
86、速发展,重新定义个人AI助理4.2 投资建议:大模型产业化落地加速,关注数据端&应用端资料来源:公司官网、证券日报、东方财富等,中航证券研究所投资建议(大模型应用方向):GPT产品的更迭标志着人工智能进入了新的发展阶段,模型技术、参数、训练数据、训练方法的演化融合方面取得了实质突破,AI大模型已成为优化算力瓶颈、放大数据优势、发展数字经济的重要拼图,掀起“数据-模型-应用”的飞轮效应。随着多模态大模型能力的跃迁、GPTs生态的建立以及对话、图像、办公、教育等领域AI标杆类应用的出现,AI已经具备从纯技术衍生的轻量工具产品向有具体落地场景的深度产品融合演变的能力,诸多行业将迎来工业级生产力变革,
87、降本增效效能凸显,数字化程度高、内容需求丰富的行业商业化及业绩兑现逻辑已完备。重点关注:数据端(中文在线/视觉中国/中国科传/中信出版/果麦文化/中文传媒/南方传媒);模型端:布局GPTs生态的模型公司(昆仑万维/科大讯飞);应用端:游戏(三七互娱/恺英网络/世纪华通/汤姆猫/神州泰岳);电商(小商品城/华凯易佰/吉宏股份/值得买);办公(万兴科技/金山办公/泛微网络);教育(世纪天鸿/创业黑马/奥飞娱乐);影视传媒(捷成股份/上海电影/光线传媒/人民网/新华网);广告营销(蓝色光标/三人行/风语筑)。黄金“三步走”(大模型应用方向)上游数据端中游模型端下游应用端数据作为新一代生产要素,被行业
88、誉为时代发展的“新石油”“新黄金”,是决定人工智能能否走向成功的底座;尤其是在GPTs模式下,最为关键的是核心专业知识与大模型通用能力的结合,以数据驱动业务变革,具备高壁垒专业正版数据内容或者垂直行业私域数据沉淀的企业和平台有望在大模型生产力变革浪潮中获得价值重估。不断创新的生成算法、与训练模型、多模态等技术融合带来了AIGC技术变革,未来多元化的AI大模型模型有望实现自动化内容生产的“工业流水线式部署”,模型即服务(MaaS)有望引领AIGC商业化路径,“以大数据预训练+小数据微调”的方式完成内容生产的精准度和颗粒度,重点关注布局大模型和垂类AI应用的企业。AI大模型是工业革命级的生产力工具
89、,很大程度上提升生产效率与服务效率,降低AI开发门槛,助力企业数字化转型到智能化升级,未来,随着模型更迭和算力升级,AI大模型将推动新一轮科技创新、产业升级、生产力跃迁,进入大规模验证和体系化发展的快速发展期,重点关注在游戏、电商、文化传媒、金融、办公等领域的垂直类应用。图表45:大模型+应用投资逻辑资料来源:公司官网、证券日报、东方财富等,中航证券研究所整理4.3 公司梳理(AI+应用场景)图表46:AI+应用投资标的(按应用场景划分)办公金山办公WPS软件,华为战略合作伙伴彩讯股份文心合作、参股电商接入OpenAI福昕软件公司在研PDF Editorfor Cloud集成ChatGPT泛微
90、网络腾讯持股,企业微信战略合作伙伴万兴科技AIGC赋能数字创意产业,GPT-4/文心合作游戏汤姆猫海外收入80%,海外产品接入GPT昆仑万维Opera接入GPT4,自研大模型推出神舟泰岳NLP+游戏深入布局公司盛天网络打造声音社交平台“带带电竞”巨人网络“球球IP赛道”启动全AI开发计划恺英网络战投企业应用AI工具,建立数据库世纪华通多款产品已开始接入AIGC工具广告营销蓝色光标海外收入72%,微软广告代理易点天下大厂出海营销龙头,微软广告代理开普云旗下数字人接入ChatGPT风雨筑投资的星图比特是“通义千问首批企业级生态合作伙伴,与百度签署战略合作协议三人行与科大讯飞战略合作,AI赋能营销影
91、视传媒光线传媒在摸索ChatGPT在业务上的应用华策影视AIGC技术应用于影视生产全链路新华网新华智云AIGC数字人领域走在前列人民网国家级数据云平台人民云上海电影收购上影元文化51%股权,发挥内容及IP优势,AI赋能文化输出宣发芒果超媒内容IP丰富+数字人内容IP中文在线百度参股,与澜舟合作孟子大模型视觉中国旗下元视觉网站推出AI作图应用果麦文化图书出版+AI创作机器人中文传媒内容版权+持有新华智云6%股份捷成股份版权运营+子公司接入ChatGPT教育盛通股份AI教育,已开展AI绘画课程世纪天鸿推出Al产品“笔神APP创业黑马达摩院合作,打造本土化模型奥飞娱乐发布首个儿童版chatGPT产品
92、智娃电子商务小商品城打造义乌全球数字自贸中心,全面数字化转型华凯易佰AIGC+跨境电商,降本增效吉宏股份跨境电商板块和SaaS吉喵云的主要业务模块里均有使用AIGC技术值得买MGC内容平台占比20%,接入文心一言打造智能化消费内容服务体系金融同花顺打造对话交互问答系统“问财”搜索引擎三六零自研大模型,搜索引擎应用场景酒店石基信息推出企业级酒店系统产品政务浙数文化聚焦数据资产,深度参与到浙江数字浙江和城市大脑智慧城市建设拓尔思自主研发NLP技术,在政务和媒体等领域有内容审查相关业务模块美亚柏科大数据分析、电子数据取证、智慧城市等业务交通佳都科技数据底座系统已积累大量行业数据信息发展交通部旗下交通运输通信信息集团为实控人