2024海外AI大模型发展现状及海外应用梳理分析报告.pdf

编号:163907 PDF 28页 1.41MB 下载积分:VIP专享
下载报告请您先登录!

2024海外AI大模型发展现状及海外应用梳理分析报告.pdf

1、2023 年深度行业分析研究报告 目录目录 1.1.模型层:大语言模型加深场景结合,多模态持续迭代模型层:大语言模型加深场景结合,多模态持续迭代 .5 5 1.1 大语言模型:开、闭源共存以满足不同应用开发需求.6 1.2 多模态模型:技术持续演进,混合多模态有望催生现象级应用.9 2.2.应用层:文本编辑类最成熟,国内有望复制海外路径应用层:文本编辑类最成熟,国内有望复制海外路径 .1111 2.1 应用分类:文本编辑类数量最多、访问量最高.11 2.2 海内外应用对比:整体差距较大,国内有望复制海外发展路径.14 3.3.海外应用梳理:模型能力决定体量下限,场景适配度决定上限海外应用梳理:

2、模型能力决定体量下限,场景适配度决定上限 .1616 3.1 文本编辑类应用:聊天机器人最成熟,虚拟角色和教育潜力最大.17 3.2 图像类应用:编辑强于生成,加深与 B 端场景融合方能实现增长.25 3.3 音视频/游戏类应用:场景上限最高,模型能力仍处探索期.27 图表目录图表目录 图 1:AI 大模型发展历程.5 图 2:AI 产业“基础设施+模型+应用”三层级.6 图 3:开源和闭源模型的发展历程.6 图 4:闭源和开源模型在基准测试中的得分对比.7 图 5:OPENAI 大模型 API 的发布及更新情况.7 图 6:OPENAI 模型 API 的价格.8 图 7:开源和闭源模型在五样

3、本 MMLU 语言理解基准测试中的得分对比.9 图 8:多模态模型的发展历程.10 图 9:OPENAI GPT-4O 演示.11 图 10:谷歌 PROJECT ASTRA 演示.11 图 11:按生成内容形式划分全球访问量前 100 的网页版 AI 应用.12 图 12:AIGC 技术的成熟应用进程时间表.13 图 13:4 月全球访问量前 100 的各类 AI 应用占比(%).13 图 14:4 月全球访问量前 100 的各类 AI 应用访问量(万).13 图 15:4 月海内外前十 AI 产品访问量总和(万)对比.14 图 16:4 月海内外首位 AI 产品访问量总和(万)对比.14

4、图 17:2024 年 2-4 月海内外访问量前十的 AI 产品访问量总和(万)对比.15 图 18:进入 4 月全球访问量增速前 50 的国内 AI 应用.15 图 19:4 月访问量及增速表现亮眼的国内 AI 应用.16 图 20:4 月全球访问量超千万的海外 AI 应用的细分类目.16 图 21:文本编辑类访问量超千万应用的访问量总和(亿).17 图 22:聊天机器人应用.17 图 23:搜索引擎应用.18 图 24:虚拟角色应用.19 图 25:4 月全球人均使用时长前 30 中的虚拟角色应用.19 图 26:翻译工具应用.20 图 27:写作工具应用.20 图 28:内容检测应用.2

5、1 图 29:生产力应用.22 图 30:教育应用.23 图 31:电商购物应用.23 图 32:营销工具应用.24 图 33:图像生成&编辑应用.25 图 34:PPT 工具应用.26 图 35:音频生成应用.27 图 36:视频编辑应用.28 图 37:游戏生成应用.29 1.1.模型层模型层:大语言模型大语言模型加深加深场景结合,多模态场景结合,多模态持续持续迭代迭代 谷歌谷歌B BERTERT开启开启大模型时代,大模型时代,ChatGPTChatGPT推升推升发展热潮发展热潮。1956年,达特茅斯研讨会正式提出人工智能,标志着人工智能学科诞生。此后60余年,专家系统、深度学习等关键技术

6、不断成熟,为大模型发展奠定基础。回顾大模型发展历程,可分为以下三个阶段:1 1)大模型)大模型开端开端:2018年,谷歌发布3亿参数规模的自然语言处理模型BERT,标志着人工智能正式进入大模型时代。2 2)大模型探索:)大模型探索:2020年,GPT-3发布,模型参数规模大幅提升至1750亿。随后,谷歌、微软和英伟达相继推出自然语言理解或生成模型,对大模型技术的探索持续推进。3 3)大模型热潮:)大模型热潮:2022年底,基于迭代后的GPT-3.5模型构建的ChatGPT发布,引起市场广泛关注,AI迎来新一轮发展热潮。此后,OpenAI的GPT-4、谷歌的Gemini 1.5 Pro、Anth

7、ropic的Claude 3相继推出,不断提高大模型能力边界。图 1:AI大模型发展历程 资料来源:AI 大模型发展综述,太平洋证券研究院 模型层模型层持续持续迭代迭代,带动下游应用带动下游应用层层发展发展。类比于软件行业,基于服务器、操作系统等硬件和系统,开发针对不同下游场景的软件,AI产业可分为以下三个层级:1 1)基)基础设施层:础设施层:由计算硬件GPU和TPU、为AI计算提供专用算力的智算平台、以及各类AI工具,如模型微调、数据标注等组成,三者共同构成了AI上层建筑的底层设施;2 2)模型)模型层:层:依托于大量训练数据、算力资源构建的AI模型层由闭源模型和开源模型组成。两者相辅相成

8、,共同推动AI应用发展;3 3)应用层:)应用层:AI时代的应用基于底层大模型构建。根据大模型的不同,应用层可分为基于第三方模型构建的应用和基于自建大模型构建的垂直应用两大类。图 2:AI产业“基础设施+模型+应用”三层级 资料来源:生成式 AI 现状 2023,太平洋证券研究院 1.11.1 大语言大语言模型:模型:开开、闭源共存以满足不同闭源共存以满足不同应用应用开发需求开发需求 双线竞争下,闭源模型和开源模型齐头并进。双线竞争下,闭源模型和开源模型齐头并进。与软件开发和分发类似,基于代码开发的AI大模型也面临着闭源或开源模型源代码和训练数据的选择。2022年5月,Meta宣布开源拥有17

9、50亿参数的大语言模型OPT,大模型由此开启了闭源和开源的双线竞争。随着模型能力的不断迭代与突破,目前闭源大模型以OpenAI的GPT-4、谷歌的Gemini 1.5 pro、以及Anthropic的Claude 3为代表;开源大模型以谷歌的Gemma、Meta的LLaMA 3、以及Mistral的Mistral 8x7B为代表。图 3:开源和闭源模型的发展历程 资料来源:ChatGPTs One-year anniversary:Are Open-Source Large Language Models Catching up?,太平洋证券研究院 闭源模型闭源模型:能力优于开源,:能力优于开

10、源,是是模型模型基础能力上限持续突破的主阵地。基础能力上限持续突破的主阵地。2023年3月,OpenAI发布最新大模型GPT-4,其不仅具备对图文输入生成应答文字等多模态能力,还-谷歌发布Gemini 1.0及更新后的Gemini 1.5 Pro,把上下文窗口容量再次提升。进入2024年,Anthropic发布最新大模型Claude 3,其在模型理解能力(MMLU)、推理能力(GPQA)等再次实现突破,得分超过GPT-4和Gemini 1.0 Ultra,成为目前能力最强的大模型。出于商业竞争、安全等因素的考量,这些模型仍均为闭源模型。对比它们与开源模型在基准测试中的得分,闭源模型表现明显更为

11、突出。头部大模型公司正凭借科研实力、人才、算力资源等优势,成为推动模型基础能力持续实现突破的主要力量。图 4:闭源和开源模型在基准测试中的得分对比 公司公司 模型模型 MTMT-BenchBench AlpacaEvalAlpacaEval-2.02.0 Open LLM LeaderboardOpen LLM Leaderboard 闭源 OpenAI GPT-3.5-turbo 8.39 14.13 70.21 GPT-4 8.99 23.58 85.36 开源 Meta LLaMA 2-70B-chat 6.86 13.87-HuggingFace Zephyr-7B 7.34 10.9

12、9 52.15 Mistral Mistral-8x7B 8.30 18.26 68.42 资料来源:ChatGPTs One-year anniversary:Are Open-Source Large Language Models Catching up?,太平洋证券研究院 基于闭源模型的应用通过基于闭源模型的应用通过APIAPI实现实现,同时同时APIAPI能力提升、价格下降。能力提升、价格下降。基于闭源模型的应用开发通过连接闭源模型API的形式实现。API接口允许用户将模型功能集成到自己的应用程序或服务中,实现数据的输入输出和模型功能的调用。随着模型不断更新迭代,模型API的能力也正

13、持续进化。以OpenAI为例,其大模型API已完成多次更新,并支持微调功能,逐步为用户提供能力更强、更易用的API服务。其中,最新的GPT-4o API实现速度提高2倍,价格便宜50%,调用模型的速率限制较GPT-4-Turbo提高5倍。价格方面,GPT API价格呈现随模型能力提升而下降的趋势,最新的GPT-4o API输入和输出百万tokens的价格分别为5、15美元,仅为GPT-4 API的16.7%和25%。图 5:OpenAI大模型 API 的发布及更新情况 时间时间 事件事件 内容内容 2020.9.18 API 发布 发布用于访问 OpenAI 开发的 AI 模型的 API,其提

14、供了一个通用的文本输入、文本输出接口,既简单易用,又足够灵活。2022.11.18 API 更新 1)完成了多项改进,包括提供更符合人类指令的指令系列模型、用于更真实的问题解答的专用端点,以及帮助开发人员减少滥用的免费内容过滤器。2)为了让开发人员更快速、安全的完成部署,提供了一系列开发工具。3)更新了使用指南,以清晰的阐述 API 能够生成的内容。4)引入了内容审计,以确保模型调用未被用于违法和有害的用途。2023.06.13 API 更新 1)Chat Completions API 具备新的函数调用功能,实现 GPT 模型能力与外部工具和 API 相连接的新方法。2)降低调用模型的价格。

15、2023.07.06 GPT-4 API 发布 1)向此前已成功付费的开发人员开放具有 8K 上下文的 GPT-4 API 访问权。计划2)因与 Chat Completions API 具有相同的功能,此前旨在让开发者基于指令实现提示词重新编辑的 Edits API 被弃用。2023.08.22 支持 GPT-3.5 微调的 API 发布 发布 GPT-3.5 的微调 API,以帮助开发者运行有监督的微调,从而让 GPT-3.5 的模型能力在开发用例中表现得更好。2024.01.25 API 管理平台发布 推出 API 使用情况和 API 密钥管理平台,以帮助开发者更好的管理 API 密钥,

16、以及更清楚地了解开发应用的使用情况。2024.04.04 支持微调的 API 更新 1)更新后的支持微调的 API 能力包括在每个训练周期内自动生成一个完整的微调模型检查点,以减少后续重新训练的需要;计算整个验证数据集的损失和准确性等指标,从而更好地了解模型质量等。2)推出辅助微调产品。该产品利用了支持微调的 API 以外的技术,以最大限度的帮助开发者提高开发用例的模型性能。2024.05.13 GPT-4o API 即将发布 即将向部分合作伙伴开放 GPT-4o 模型 API,其速度提高 2 倍,价格便宜 50%,调用模型的速率限制较 GPT-4-Turbo 提高了 5 倍。资料来源:Ope

17、nAI 官网,太平洋证券研究院 图 6:OpenAI模型 API 的价格 模型模型 输入(美元输入(美元/百万百万 tokenstokens)输出(美元输出(美元/百万百万 tokenstokens)GPT-4 30 60 GPT-4-Turbo 10 30 GPT-4o 5 15 资料来源:OpenAI 官网,太平洋证券研究院 开源模型开源模型:与闭源与闭源模型模型差距缩小差距缩小,基于基于开源模型开源模型的应用的应用通过通过finefine-tuningtuning实现实现。类比于互联网时代开源操作系统Linux和安卓在大量开发人员贡献代码、报告错误等社区共建中实现发展,人工智能时代开源模

18、型也正在社区群策群力、共同开发的支持下,实现模型能力的逐步提升。根据ARK基金统计的开源和闭源模型在五样本MMLU语言理解基准测试中的得分对比,开源模型与闭源模型的测试得分差距正不断缩小。在应用开发层面,以LLaMA为例,通过继续预训练和指令微调的方式,应用开发者能利用自有数据对开源模型进行微调,从而获得与应用更匹配的底层大模型。图 7:开源和闭源模型在五样本MMLU语言理解基准测试中的得分对比 资料来源:ARK,太平洋证券研究院 基于对闭源模型和开源模型的分析和思考,总结未来两者发展的两个趋势:趋势趋势一一:闭源模型能力:闭源模型能力或将或将长期优于开源模型。长期优于开源模型。闭源模型能力或

19、将长期优于开源模型。虽然开源模型与闭源模型的能力差距正在不断缩小,但通过对比开源软件和开源大模型之间的异同,我们认为,大模型能力的提升仍存在如训练数据的规模和质量、算力资源等开源社区无法突破的壁垒。并且,出于商业、伦理道德安全等因素的考虑,闭源模型不会将能力最强的大模型进行开源。因此,闭源模型能力或将长期优于开源模型。趋势趋势二二:开闭源共存以满足不同需求,开闭源共存以满足不同需求,基于成本和安全基于成本和安全等进行等进行选择。选择。连接闭源模型开放API的方式,具备调用便利、无需进行大模型本地化部署和维护的优势;而基于开源模型,并利用数据进行微调的方式,则为专业化、定制化模型或应用的开发提供

20、了支持,两者共存以满足不同的开发需求。我们认为,模型或应用开发者在调用大模型能力时会基于成本及安全等因素,在开闭源模型中进行选择。在成本方面,在成本方面,目前调用闭源模型API的费用根据使用量收取,随着使用量的增加必然会出现调用成本与模型部署和维护成本之间的权衡。当应用调用闭源模型成本大于模型开发和维护成本时,基于开源模型开发拥有更优的成本收益比。在安全方面,在安全方面,对于数据不能轻易泄漏的场景,如公司商业决策等,利用开源模型在私域进行本地化部署是更安全的选择。1.21.2 多模态模型多模态模型:技术持续演进,技术持续演进,混合多模态有望催生混合多模态有望催生现象级现象级应用应用 。跨模态数

21、据融合、人类认知能力模拟等研究的加深,多模态大模型不断发展。2021年初,OpenAI率先发布文生图模型DALLE,由此拉开多模态模型序幕。此后,文生图领域相继出现谷歌Imagen、Midjourney、Stable Diffusion等模型,不断推升文生图模型能力。在音乐领域,文生音乐模型Suno V3高质量的音乐创作能力让文生音乐开始受到市场关注。在视频领域,Runaway Gen-2、Pika等不断提高生成视频质量,此后OpenAI Sora不仅将视频长度提升至60秒,还让视频具备了3D一致性。此外,谷歌推出创新性的AI生成式交互环境Genie,实现由单张图像提示生成交互式视频。多模态模

22、型正在头部AI公司与细分赛道领先者的共同推动下持续突破,技术愈发成熟。图 8:多模态模型的发展历程 资料来源:太平洋证券研究院整理 混合多模态混合多模态实时交互实时交互变革人机交互方式变革人机交互方式,有望催生强交互性场景应用有望催生强交互性场景应用。随着图像、音频、视频多模态技术的不断发展,OpenAI发布集成文本、图片、语音、视频的全能混合多模态模型GPT-4o,谷歌发布实时多模态AI助手Project Astra。这两个产品均实现了跨模态的实时推理,能将文本、图像、语音、视频的任意组合作为输入,生成文本、图像、语音、视频的任意组合输出,具备实时语音及视频交互的能力,与人和世界交互的方式一

23、致。我们认为,混合多模态的实时交互改变了用户与机器交互的方式,有望在强交互性场景中催生现象级应用。userid:93117,docid:163817,date:2024-06-04,图 9:OpenAI GPT-4o 演示 图 10:谷歌 Project Astra 演示 资料来源:OpenAI 官网,太平洋证券研究院 资料来源:谷歌官网,太平洋证券研究院 2.2.应用层:应用层:文本编辑文本编辑类类最成熟,最成熟,国内有望复制海外路径国内有望复制海外路径 2.12.1 应用分类:应用分类:文本文本编辑编辑类类数量最多数量最多、访问量访问量最最高高 全球访问量前全球访问量前1 100 00 A

24、IAI应用可分为应用可分为文本文本编辑编辑、代码、代码编程编程、图像、音视频、图像、音视频/游戏四大游戏四大类类。按照生成内容形式的不同,4月全球访问量前100网页版AI应用可划分为基于大语言模型的文本编辑类和代码编程类应用,以及基于多模态模型的图像类和音视频/游戏类应用。对四大分类涉及的24个细分类目进行统计:文本编辑类应用涉及的领域最广,包括聊天机器人、搜索引擎、虚拟角色、翻译工具等14个细分类目;代码编程类、图像类和音视频/游戏类应用则分别包括2、4、4个细分类目。图 11:按生成内容形式划分全球访问量前100的网页版AI应用 基于大语言模型基于大语言模型 基于多模态模型基于多模态模型

25、文本编辑文本编辑类类 代码编程代码编程类类 图像图像类类 音视频音视频/游戏游戏类类 聊天机器人 代码助手 图像生成&编辑 音频生成 搜索引擎 网页搭建 图像生成 视频生成 虚拟角色 图像编辑 视频编辑 翻译工具 PPT 工具 游戏生成 写作工具 内容检测 生产力 ChatPDF 教育 金融 电商购物 营销工具 法律助手 旅游计划 资料来源:太平洋证券研究院整理 四大类应用中四大类应用中文本文本编辑编辑类类技术技术最成熟,最成熟,音视频音视频/游戏类游戏类技术技术发展潜力最大。发展潜力最大。应用层基于模型层进行开发,因此在技术层面模型的成熟程度就决定了应用的成熟程度。具体来看,基于此前自然语言

26、处理等相关技术积累、文本数据获取和处理难度相对较低等因素,AI文本生成技术最早发展起来。从1966年世界上第一个聊天机器人Eliza诞生,到2022年ChatGPT发布,近60年的发展让AI文字生成技术及应用的成熟度最高。同时,随着模型架构、多模态数据处理等技术的不断突破,图像、音视频等跨模态内容的生成技术及应用崭露头角。但因发展时间相对较短,其在技术路径探索上仍存在较大发展潜力。我们认为,大模型作为支撑AI应用发展的底层技术,模型能力决定了应用体量的下限,模型能力与应用场景的适配度决定了应用体量的上限。图 12:AIGC技术的成熟应用进程时间表 资料来源:红杉资本,太平洋证券研究院 四大类应

27、用中四大类应用中文本编辑类文本编辑类数量数量最多、最多、访问量访问量最最高高,图像类,图像类次之次之。底层大模型的技术差距造成了应用智能程度、用户体验等的不同,从而使得目前不同分类应用的数量和访问量呈现出明显的不同。在四大类应用中,文本编辑类应用数据表现突出:从应用数量来看,4月访问量排名前100的应用数量最多,占比达58%,访问量过亿的8个应用有7个为文本编辑类;从访问量来看,文本编辑类应用访问量总和达60.4亿,显著高于其他分类。此外,图像类应用成为多模态技术演进中最先发展起来的类目,4月访问量排名前100的应用数量占比达23%,访问量总和达9.16亿,仅次于文本编辑类。图 13:4月全球

28、访问量前100的各类AI应用占比(%)图 14:4月全球访问量前100的各类AI应用访问量(万)文本编辑类58%图像类23%音视频/游戏类11%其他6%代码编程类2%60403719899158913907 2.22.2 海内外应用海内外应用对比对比:整体整体差距较大差距较大,国内有望复制海外发展路径国内有望复制海外发展路径 海海内内外外前前十十应用应用访问量存在访问量存在约约4 46 6倍差距倍差距,国内尚未出现国内尚未出现超超级级应用应用。目前海内外AI应用仍存在较大差距。从进入全球访问量前100的应用数量来看,海外共94个应用入榜,而国内仅有Kimi、百度文心一言等6款应用入榜;从访问量

29、来看,海外前十AI产品的访问量共计55.02亿,而国内仅1.20亿,两者存在约46倍的差距。此外,海外访问量第一的应用ChatGPT访问量达18.6亿,而国内访问量第一的应用Kimi访问量仅2004万,两者存在约93倍的差距(在国内AI产品榜中排名第一的为百度文库AI功能,但因其为在百度文库网页上新的AI功能,访问量或包含未使用AI功能的访问,因此本文选取Kimi的访问量进行对比)。图 15:4月海内外前十 AI产品访问量总和(万)对比 图 16:4月海内外首位 AI产品访问量总和(万)对比 资料来源:AI 产品榜,太平洋证券研究院 资料来源:AI 产品榜,太平洋证券研究院 国内应用持续国内应

30、用持续缩小与海外缩小与海外应用应用的差距的差距,头部头部应用应用高速增长高速增长。对比2024年2-4月海内外排名前十的AI产品访问量总和,两者差距从2月的163倍逐渐缩小至4月的46倍。并且,根据4月访问量增速全球前50网页版AI产品榜单,有8个国内应用入榜,且其中7个应用为国内访问量前十应用,表明国内头部应用正高速增长。我们认为,国内AI应用正随底层大模型持续追赶海外主流大模型不断发展,多个头部应用增速表现亮眼,静待超级应用出现。55018712007海外国内4646倍倍1860002004ChatGPTKimi9393倍倍图 17:2024年2-4月海内外访问量前十的AI产品访问量总和(

31、万)对比 资料来源:AI 产品榜,太平洋证券研究院 图 18:进入4月全球访问量增速前50的国内AI应用 全球全球增速排名增速排名 国内国内访问量排名访问量排名 名称名称 增速(增速(%)4 4 月访问量(万)月访问量(万)1 4 360AI 搜索 1303.09 1188 3 7 天工 AI(昆仑万维)122.58 408 11 2 Kimi(Moonshot)60.20 2004 14 5 秘塔 AI 搜索 54.56 1086 18 16 liblib.art 51.26 207 35 6 阿里通义千问 33.33 690 37 8 AiPPT.cn 32.46 353 42 10 抖音

32、豆包 27.11 345 资料来源:AI 产品榜,太平洋证券研究院 国内头部应用集中于文本编辑类,国内头部应用集中于文本编辑类,国内有望复制海外发展路径国内有望复制海外发展路径。从应用分类来看,目前访问量及增速表现亮眼的国内头部应用主要集中于文本编辑类,且有一个图像类应用AiPPT.cn入列,与海外应用的发展类似。展望未来,国内AI应用有望复制海外应用的发展路径。文本编辑类应用率先发展,图像类应用次之,且文本编辑类有望最先出现超级应用。48779853602755018729935699120072月3月4月海外国内163163倍倍9494倍倍4646倍倍图 19:4月访问量及增速表现亮眼的国

33、内AI应用 国内访问量排名国内访问量排名 二级分类二级分类 三级分类三级分类 名称名称 4 4 月访问量(万)月访问量(万)增速(增速(%)全球增速排名全球增速排名 1 文本编辑类 写作工具 百度文库 AI 功能 3896-5.46-2 聊天机器人 Kimi(Moonshot)2004 60.20 11 3 聊天机器人 百度文心一言 1691 13.91-4 搜索引擎 360AI 搜索 1188 1303.09 1 5 搜索引擎 秘塔 AI 搜索 1086 54.56 14 6 聊天机器人 阿里通义千问 690 33.33 35 7 聊天机器人 天工 AI(昆仑万维)408 122.58 3

34、8 图像类 PPT 工具 AiPPT.cn 353 32.46 37 9 其他 模型训练 火山方舟 346 3.56-10 文本编辑类 聊天机器人 抖音豆包 345 27.11 42 资料来源:AI 产品榜,太平洋证券研究院 3.3.海外应用梳理:海外应用梳理:模型能力决定模型能力决定体量体量下限,场景适配度决下限,场景适配度决定上限定上限 四大类应用中有四大类应用中有1 18 8个细分类目个细分类目的的5 54 4个海外个海外应用访问量超千万。应用访问量超千万。根据上文的文本编辑类、代码编程类、图像类和音视频/游戏类AI应用分类,对AI产品榜统计的4月全球前100网页版AI产品进行细分,可分

35、成24个细分类目。在此基础上,筛选出访问量超千万的海外应用,得到共18个细分类目、54个应用。基于这些细分应用对目前AI应用的发展情况进行分析。图 20:4月全球访问量超千万的海外AI应用的细分类目 基于大语言模型基于大语言模型 基于多模态模型基于多模态模型 文本编辑文本编辑类类 代码编程代码编程类类 图像图像类类 音视频音视频/游戏游戏类类 聊天机器人 网页搭建 图像生成&编辑 音频生成 搜索引擎 图像生成 视频编辑 虚拟角色 图像编辑 游戏生成 翻译工具 PPT 工具 写作工具 内容检测 生产力 教育 电商购物 营销工具 资料来源:AI 产品榜,太平洋证券研究院 3.13.1 文本编辑类应

36、用:文本编辑类应用:聊天机器人最成熟,虚拟角色聊天机器人最成熟,虚拟角色和教育和教育潜力最大潜力最大 1 1)聊天机器人聊天机器人:访问量最高,访问量最高,加强加强与场景结合度有望提高与场景结合度有望提高体量体量上限。上限。聊天机器人是访问量超千万的文本编辑类应用中访问量总和最高的细分应用,共24.5亿。4月访问量超千万的聊天机器人应用共5个,其中OpenAI的ChatGPT和谷歌的Gemini访问量过亿,ChatGPT更是以18.6亿的访问量位列第一。聊天机器人应用是大语言模型能力的展示窗口,因此均为原生AI应用。并且,得益于大语言模型的持续迭代,聊天机器人应用的底层大模型能力较强,应用体量

37、的下限较高。但因没有与具体场景相结合,应用体量上限受到一定的限制,头部应用访问量增速出现了一定程度的放缓。这类应用要提高规模天花板,则需提升与具体场景的结合度。以OpenAI为例,其推出GPT-4o提高了易用性;并且用户可通过GPT-4o访问应用商店GPTs,调用为特定用例定制的智能助手。对比国内,聊天机器人头部应用Kimi、百度文心一言的访问量均为千万级别,与海外头部产品均仍存在百倍差距,具备较大的增长空间。展望未来,随着国内大模型持续追赶海外主流大模型,这类应用有望最先出现超级产品。图 22:聊天机器人应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B

38、/to C AIAI 原生应用原生应用 简介简介 ChatGPT 186000 2.20%to B&to C 是 ChatGPT 是 OpenAI 在 2022 年 11 月底推出的基于 GPT-3.5 大语言模型的聊天机器人,目前其模型已迭代至 GPT-4。基于 GPT-4 的强大能力,ChatGPT 具备自然语言对话、代码生成、语言翻译等功能。图 21:文本编辑类访问量超千万应用的访问量总和(亿)资料来源:AI 产品榜,太平洋证券研究院 24.516.43.573.222.772.542.451.370.970.28Gemini 42749-4.54%to B&to C 是 Gemini

39、聊天机器人是 Google AI 开发的大型语言模型聊天机器人。基于强大的语言理解能力和文本生成能力,以及丰富的知识库,其具备聊天、问答、翻译等功能。Claude 6731 21.70%to B&to C 是 Claude 是 Anthropic 推出的基于 Claude3 大语言模型的聊天机器人。其拥有强大的自然语言理解能力和生成能力,具备处理数据类型灵活,实际运用场景广泛的特点。Poe 4961-4.10%to C 是 Poe 是海外版知乎 Quora 推出的 AI 聊天机器人应用,在 Poe 上可与 ChatGPT、GPT-4、Claude-3-Opus、DALLE 3 等数百万机器人进

40、行交谈。Google Bard 3401-25.05%to B&to C 是 Google Bard 是基于谷歌对话应用语言模型LaMDA 的轻量级版本聊天机器人。随着谷歌Gemini 模型的推出,Google Bard 已于 2024 年2 月正式更名为 Gemini。资料来源:AI 产品榜,公司官网,太平洋证券研究院 2 2)搜索引擎:搜索引擎:AIAI赋能传统搜索是大势所趋,赋能传统搜索是大势所趋,AIAI原生搜索引擎原生搜索引擎有望重塑有望重塑原有原有格局。格局。4月访问量超千万的搜索引擎应用共3个,其中New Bing以15.5亿位列第一,作为非原生AI应用,其高访问量反映出传统搜索

41、引擎利用AI技术赋能原有搜索服务取得进展。Perplexity以7353万访问量位列第二,作为原生AI搜索引擎,其高访问量反映出AI搜索引擎通过解决传统搜索引擎罗列搜索结果、无法准确定位最佳答案的痛点,实现规模增长。我们认为,进入AI时代,传统搜索引擎利用AI技术赋能原有服务将是大势所趋,同时原生AI搜索引擎有望重塑传统搜索引擎格局,实现较高的市场规模。与海外应用发展类似,国内也有望出现表现亮眼的AI原生搜索引擎,重构现有市场格局。图 23:搜索引擎应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 New

42、Bing 155000 5.82%to B&to C 否 New Bing 是微软基于 OpenAI 的 GPT-4 大型语言模型开发的新一代 AI 搜索引擎。具备强大的多模态对话、实时获取最新信息、智能搜索和信息整合、来源引用和事实核查、浏览器集成和插件扩展等功能。Perplexity 7353 15.33%to C 是 Perplexity 是一款基于 GPT-3.5 开发的对话式 AI搜索引擎。与传统关键词搜索机制不同,其可理解用户输入的自然语言查询,并以摘要和引用的形式输出最相关的搜索答案。You 1163 12.65%to C 是 You 是由前 Salesforce 首席科学家 R

43、ich Socher 和Bryan McCann 于 2020 年创立的 AI 搜索引擎。具备AI 驱动搜索、按资料来源组织搜索结果、无广告、注重用户隐私等特点。资料来源:AI 产品榜,公司官网,太平洋证券研究院 3 3)虚拟角色虚拟角色:场景场景容错率高容错率高且体量上限且体量上限高,高,现已快速起量现已快速起量,未来,未来情感陪伴场景情感陪伴场景潜潜力最大力最大。4月访问量超千万的虚拟角色应用共4个,其中头部应用Character AI的访问量超2.6亿,在全球访问量前100产品中位列第6。值得注意的是,虚拟角色应用的使用时长在所有细分类目中的表现最为亮眼。根据4月全球人均使用时长前30榜

44、单,虚拟角色应用有8个上榜,占比超25%。排名最高的为SpicyChat,人均使用时长近20分钟。我们认为,AI原生虚拟角色应用的高访问量和人均使用时长一方面表明情感陪伴这一市场需求存在,技术与场景的适配度较高,应用体量上限较高;另一方面表明目前应用的设计和成熟度能满足用户需求、实现一定的用户积累,应用体量下限较高。并且,未来随着混合多模态技术逐渐成熟,人机实时交互还将有望持续提升应用体量下限。图 24:虚拟角色应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 Character Al 26772 10.9

45、7%to C 是 Character.Al 是由谷歌 LaMDA 前开发者创立的虚拟角色聊天机器人,其允许用户创建、训练和自定义 AI 聊天机器人,具备能够生成类似于人类文本响应并参与上下文的对话,用户可以定制AI 伴侣的特点。JanitorAl 5008 46.73%to C 是 Janitor AI 是一个提供虚拟 AI 角色聊天的在线平台。其允许用户从各种预设角色中进行选择,也可以根据自己的喜好创建自定义角色,并与这些角色进行各种类型的对话,包括角色扮演、聊天、提问等。SpicyChat Al 2162 21.05%to C 是 SpicyChat AI 是一个提供虚拟 AI 角色聊天互

46、动的在线平台。用户可与平台提供的或自定义的虚拟 AI 角色进行对话互动。其具备免费、易用、无限制对话、保护用户隐私等特点。CrushOn.AI 1792-17.14%to C 是 Crushon AI 是一个在线虚拟 AI 角色聊天平台。其允许用户根据自己的偏好定制原创角色,并与各种 AI 虚拟角色伴侣,包括名人、动漫角色、YouTubers 等,进行角色扮演和聊天,推动了虚拟伴侣关系和成人内容的界限。资料来源:AI 产品榜,公司官网,太平洋证券研究院 图 25:4月全球人均使用时长前30中的虚拟角色应用 排名排名 名称名称 4 4 月人均使用时长月人均使用时长 9 SpicyChat AI

47、00:19:04 10 JanitorAI 00:18:01 13 CrushOn 00:16:38 14 Character AI 00:16:30 16 Chub.ai 00:15:51 18 PepHop 00:15:06 22 Charstar 00:13:44 26 Joyland 00:12:37 资料来源:AI 产品榜,太平洋证券研究院 4 4)翻译工具:翻译工具:功能单一,较难实现大规模用户积累。功能单一,较难实现大规模用户积累。4月访问量超千万的翻译工具应用仅有1个,为本身就积累了一定的用户基础、非原生的翻译工具DeepL,访问量达2.77亿。我们认为,目前聊天机器人已具备多

48、语言翻译功能,未来翻译功能更可能作为子功能集成在多功能应用中,只聚焦单一功能的翻译工具较难实现大规模用户积累,市场规模有限。图 26:翻译工具应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 DeepL 27711 0.51%to B&to C 否 DeepL 是一款基于 AI 技术的翻译应用。其提供文本、语音、图像和文件的多语言翻译服务,支持 30 多种语言的翻译。此外还提供了 Deep Write 写作助手功能,辅助用户改善写作内容。资料来源:AI 产品榜,公司官网,太平洋证券研究院 5 5)写作工具:

49、写作工具:头部应用功能类似,关注内容创作应用起量。头部应用功能类似,关注内容创作应用起量。4月访问量超千万的写作工具应用共4个,均为已有一定用户基础的非原生AI应用,Notion AI访问量最高,达1.71亿。从功能来看,目前访问量破千万的4个写作工具应用功能类似,均集中于写作内容的改写、润色等,模型能力能较好的支持功能实现,但市场规模空间有限。展望未来,写作生成与需要大量内容产出的场景相结合,如内容营销、媒体出版等,有望提升写作工具应用体量上限。关注提供内容创作功能的写作工具起量,如访问量位列LanguageTool之后、聚焦于故事生成的NovelAI,其4月访问量达667万。图 27:写作

50、工具应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 Notion Al 17112-1.84%to B&to C 否 Notion AI 是 Notion 公司发布的利用大语言模型和数据收集的写作生成 AI。其拥有自动整理笔记、改正错别字、列出文章重点、翻译、制作表格等功能;具备方便用户进行高效管理数据和任务等特点。Grammarly 7477-3.32%to B&to C 否 Grammerly 一款利用 AI 技术提供英语写作辅助的应用。其能帮助用户检查文本中的语法、拼写、标点符号和风格错误,并提供改

51、进建议。此外,其还能帮助用户调整语气、声调,并为个人、职业写作选择合适的用词。Quillbot Paraphraser 6522 2.24%to C 否 Quillbot Paraphraser 是一个在线改写工具。其利用 AI 技术帮助用户改写文本,以提高原创性和清晰度;其可对句子、段落、文章或论文进行改写,提供多种改写选项,以满足用户的不同需求。LanguageTool 1127 1.94%to C 否 LanguageTool 是一款基于 AI 的多功能写作助手,它能识别并纠正文本中的各种错误,包括但不限于拼写、语法、用词选择等;具备改写句子能进行全面的写作分析,帮助用户改进语言风格。它

52、支持超过 30 种语言,包括英语、西班牙语、德语、法语、荷兰语和葡萄牙语等。资料来源:AI 产品榜,公司官网,太平洋证券研究院 6 6)内容检测:内容检测:应用需求或将随生成式应用需求或将随生成式AIAI普及实现增长。普及实现增长。4月访问量超千万的内容检测应用共2个,访问量较高的为非原生AI应用、在线抄袭检测和学术诚信服务平台Turnitin,达1722万。从功能来看,内容检测应用用于检测抄袭、区分人类编写内容和AI生成内容。主要面向B端用户,如学校、学术机构等,也可为C端用户提供服务。我们认为,内容检测应用的需求或将随生成式AI逐渐普及实现增长。图 28:内容检测应用 名称名称 4 4 月

53、访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 Turnitin 1722 15.30%to B&to C 否 Turnitin 是一个在线抄袭检测和学术诚信服务平台,它提供了一系列的工具和功能,帮助教育机构确保学生作业的原创性。其 AI 功能,特别是其 AI写作检测功能,旨在帮助教育工作者识别学生提交的作业中是否使用了 AI 写作工具。GPTZero 1118 11.07%to B&to C 是 GPTZero 一款专业的 AI 文本内容检测工具,可帮助用户区分人类编写的文本和 AI 生成的文本。资料来源:AI 产品榜,公司官网

54、,太平洋证券研究院 7 7)生产力:生产力:聚焦于提升工作流效率,聚焦于提升工作流效率,浏览器插件表现突出。浏览器插件表现突出。4月访问量超千万的生产力应用共8个,应用功能各不相同,但均聚焦于提升个人或团队的工作流效率。其中,访问量排名第一的是集成在Figma白板工具FigJam中的AI助手Jambot,但其并非原生AI工具,访问量统计或包含未使用AI助手的访问。排名第二的是提供浏览器拓展功能的Liner,访问量达6623万,是第三名的2倍。并且,同为提供浏览器拓展功能的MaxAI.me,4月访问量达1198万,增速达219.07%,在全球访问量增速前50 AI产品榜中排名第2。我们认为,AI

55、浏览器插件是生产力应用中最具潜力的应用。其能将聊天机器人、内容总结、翻译等功能集成到现有的搜索场景中,提高用户使用AI工具的易用性;并且,能基于现有浏览器大规模的用户体量实现用户积累。技术与场景的结合度较高,具备较高的应用体量上限。图 29:生产力应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 Jambot 9157 1.53%to B&to C 否 Jambot 是由 Figma 推出的一款集成到其在线白板工具 FigJam 中的 AI 助手。其基于ChatGPT API 构建,旨在通过 AI 增强设计

56、师的工作流程和创造力,以提高他们的工作效率。其拥有创建视觉思维导图、总结笔记、文本重构等功能。Liner 6623-6.36%to C 是 Liner 是由韩国初创公司推出的一款基于ChatGPT、专注于提高工作效率和优化流程的AI 工具,具备快速生成文章摘要、与 PDF 文档互动、辅助写作,与 GPT-4 模型聊天等功能。此外,该工具还提供了浏览器扩展,可在用户浏览网页时提供信息提取、自动摘要等即时帮助。Feedly 3212 2.81%to C 否 Feedly 是一款帮助用户解决信息过载问题的AI 工具。通过读取和分析文章,它可以为用户减少阅读时间,让用户专注于真正重要的话题和趋势。Mi

57、ro 3133 4.37%to B&to C 否 Miro 是一款集成了 AI 功能的数字协作白板平台,旨在帮助团队在设计、项目管理、教育等多个领域提高工作效率和创造力。其具备自动化内容结构、内容识别、提供智能建议等功能。MaxAI.me 1198 219.07%to C 是 MaxAI.me 是一款旨在提高工作速度和效率的浏览器扩展程序,其利用 ChatGPT、Bard、Bing Chat 和 Claude 的功能来提高在线工作效率,让用户能在任何网站上完成简单的重复性任务,包括使用 AI 进行写作、一键总结视频摘要等。Zapier 1079 4.04%to B&to C 否 Zapier

58、AI 是自动化集成平台 Zapier 推出的AI 工具,旨在通过 AI 简化自动化任务的构建。用户只需描述想要自动化的内容,Al 工具便会自动创建步骤、编写代码并构建应用。DeepAl 1062 3.92%to B&to C 是 DeepAI 是集合了 AI 工具和资源的平台,平台拥有聊天机器人、图像生成和编辑、虚拟角色生成、视频生成等 AI 工具。WolframAlpha 1004 5.53%to B&to C 是 WolframAlpha 是一个计算智能引擎,为用户提供从数学解题到科学研究、历史事实和日常生活问题的专业级解答和分析。其能理解自然语言查询,快速提供精确的计算结果和信息,使其成

59、为学生、教育工作者、科研人员、专业工程师和日常用户寻求知识和解决问题的理想工具。资料来源:AI 产品榜,公司官网,太平洋证券研究院 8 8)教育:教育:场景容错率低场景容错率低但但体量上限体量上限高,高,未来未来有望随有望随模型能力模型能力提升及交互方式演进提升及交互方式演进实现增长。实现增长。4月访问量超千万的教育应用共3个,排名首位的为集成在卡片式学习应用Quizlet中的AI导师Q-Chat,访问量达1.47亿。原生AI教育应用也获得了较高的访问量,21位。我们认为,教育场景较低的容错率意味着其对模型能力有着较高的要求,因此模型能力无法满足低容错率要求成为目前限制教育应用实现大规模增长的

60、关键因素。而教育场景的强交互性与大语言模型适配度高,因此教育应用拥有较高的规模上限。展望未来,随着模型能力、AI生成内容准确性提升,以及用户与AI应用交互方式从文本对话过渡到语音、视频交互,教育场景下的AI应用访问量有望实现增长。图 30:教育应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 Q-Chat 14654 6.94%to C 否 Q-Chat 是 Quizlet 推出的以 OpenAl ChatGPT API 为基础的完全自适应式的 AI 导师。其不仅仅是一个基本的聊天机器人,还具备帮助用户理解

61、材料、指引学习语言,提供学习指导的功能。CheggMate 5130 4.36%to C 是 CheggMate 是一个先进的 AI 教育平台。其提供的功能包括利用 AI 技术,分析学生的学习风格、优劣势等以提供个性化的学习方案;为家庭作业问题提供详细的分步解决方案;实时的家庭作业指导和支持等。Khanmigo 4736 1.56%to C 是 Khanmigo 是 KhanAcademy 推出的全球领先的免费网上教育平台。具有可使用对话式 AI 聊天机器人与学生互动,个性化辅导,提供游戏化挑战和活动,为教师提供有关学生学习进展的洞察的功能。资料来源:AI 产品榜,公司官网,太平洋证券研究院

62、9 9)电商购物:电商购物:集成于现有购物网站,集成于现有购物网站,较难较难脱离平台独立发展脱离平台独立发展。4月访问量超千万的电商购物应用仅有1个,为集成在Shopify开发的购物网站Shop内的AI购物助手,访问量达9735万。但因其为非原生AI应用,网页访问量统计值并非仅包含对Shop AI的使用。我们认为,电商购物场景中的AI应用主要提供智能导购、智能客服的功能,极大可能主要以集成在现有购物网站的形式存在,市场规模空间较小。图 31:电商购物应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 Shop

63、 AI 9735-0.59%to C 否 Shop AI 是由 Shopify 开发的购物网站 Shop 内的 AI 购物助手,其能为用户提供个性化的购物支持,帮助客户快速准确的找到想要购买的商品。资料来源:AI 产品榜,公司官网,太平洋证券研究院 1 10 0)营销工具:营销工具:技术与场景适配度高,有望技术与场景适配度高,有望革新数字革新数字营销营销工作流程工作流程。4月访问量超千万的营销工具应用共4个,其中3个均为非原生AI应用,这一方面表明数字营销领域内的应用正在积极利用AI技术赋能原有业务开展,另一方面说明营销场景应用的发展需要具备一定的行业经验积累。我们认为,数字营销业务以数据驱动

64、、客户具有高度实现降本增效。营销场景与技术的高适配度有望革新数字营销业务工作流程,营销工具应用具备较高的应用体量上限。并且,数字营销领域内的公司积累了一定的数据、客户资源,具备开发AI营销工具的优势。未来关注由营销公司开发的AI营销工具起量。图 32:营销工具应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 Salesforce Al 8792 1.62%to B 否 Salesforce AI 是 Salesforce 旗下的一系列AI 产品和功能,旨在帮助企业利用 AI 来提高效率、洞察力和决策能力。其

65、包括基于 AI 的分析平台,可帮助企业从数据中获取洞察力;聊天机器人,可帮助企业自动化客户服务和支持;基于 AI 的营销平台,帮助企业个性化营销活动并提高投资回报率;基于 AI 的销售平台,帮助销售人员提高效率并达成更多交易。Beacons Al 2.0 2276 0.29%to C 是 Beacons AI 2.0 是一个专为内容创作者设计的由 AI 驱动的一体化平台。其提供了 AI 网站构建器、AI 电子邮件营销、AI 广告助手、AI内容生成、AI 聊天机器人的功能,旨在帮助内容创作者建立品牌、发展粉丝群等。Mailchimp 1539-6.38%to B&to C 否 Mailchimp

66、 是一个基于云的营销自动化和电子邮件营销平台,提供集邮件发送、自动化营销、数据分析等功能。其利用 AI 分析客户的购买历史和浏览行为,为他们推荐他们可能感兴趣的产品;识别客户的行为模式,向他们发送个性化的营销活动;预测客户行为,帮助企业更好的规划营销活动并提高客户留存。Systeme.io 1067 21.68%to B&to C 否 Systeme.io 是一个全能在线营销平台,集成了营销漏斗构建、电子邮件营销、在线课程创建、会员管理、营销自动化等功能。并且提供生成高转化率的销售文案和广告素材、图片、视频等 AI 工具,帮助用户提高营销和销售效率。资料来源:AI 产品榜,公司官网,太平洋证券

67、研究院 总结:总结:应用成熟多样,应用成熟多样,模型能力与场景适配度提升有望促进垂类场景应用发展模型能力与场景适配度提升有望促进垂类场景应用发展。目前访问量最高的是聊天机器人应用,其次是搜索引擎应用。未来这两类应用有望随模型能力提升,实现用户规模的线性增长。其次,因模型能力与场景适配度高,虚拟角色和教育应用体量上限较高;但因两者的场景容错率不同,使得目前的访问量表现不同。容错率高的虚拟角色应用受益于模型能力迭代已快速起量,而容错率低的教育应用则有望在未来随模型能力提升及交互方式演进实现增长。最后,翻译工具、电商购物、营销工具应用主要以集成于具体场景或应用的形式存在,独立应用的体量较小。我们认为

68、,随着国内大模型持续追赶海外主流大模型,国内AI应用有望复制海外AI应用发展路径,最先在文本编辑类应用中取得突破。其中,聊天机器人、搜索引擎及虚拟角色应用有望最先实现访问量的大幅增长。3.23.2 图像类应用:图像类应用:编辑强于生成,编辑强于生成,加深与加深与 B B 端场景融合端场景融合方能方能实现增长实现增长 1 1)图像:图像:多数应用集成图像生成和编辑功能,多数应用集成图像生成和编辑功能,仅仅提提供图像生成供图像生成功能的应用功能的应用体量仍体量仍较小较小。4月访问量超千万的图像应用共11个,其中8个应用同时包含图像生成和图像编辑功能,为用户提供从生成图片到对图片进行更换背景、风格转

69、化等编辑工作的AI辅助。平面内容设计平台Canva集成了DaLLE、Stable Diffusion等第三方模型,为用户提供多样化AI功能,4月访问量超6亿,在图像应用中断层第一,在全球产品中位列第3。2个应用仅提供图像生成功能,它们聚焦于某一细分领域,Yodayo聚焦动漫风格的图片生成、AI Time Machine聚焦于生成不同历史时期和主题的人物头像。我们认为,目前图像应用访问量不高,整体处在1000-2000万水平,未来有望通过加深与B端场景融合实现规模增长。图 33:图像生成&编辑应用 分类分类 名称名称 4 4 月访问月访问量(万)量(万)变化变化 to B/to Cto B/to

70、 C AIAI 原生应用原生应用 简介简介 图像生成&编辑 Canva 61297 3.45%to B&to C 否 Canva 是一个可用于创建社交媒体图形、演示文稿、海报、文档和其他视觉内容的平面设计平台。其 AI 图像生成器 Text to Image 基于 Stable Diffusion 文生图模型,可将用户输入的文本提示转换成视觉图像。其提供的功能包括 AI 图片生成、AI 背景去除、AI 魔术抠图、为图像添加动画效果等。Leonardo.AI 1757-8.81%to B&to C 是 Leonardo.AI 是一个由 Stable Diffusion 驱动的高质量图片生成平台,

71、其深度集成了Stable Diffusion 的各种插件,以帮助用户生成图像,具备 OpenPose 姿势参考、局部重绘、prompt 提示等功能。此外,还提供画布编辑器等功能。Midjourney 1744-8.02%to C 是 Midjourney 是一个基于 AI 技术的图像生成工具,能根据用户输入的文本提示词或图片生成高质量的图像。提供图像拓展、背景替换、图像移除等功能。其最新版本 V6 在图像质量、语义理解、图像放大等方面进行了改进,提高了模型对细节的捕捉能力。Cutout Pro 1646 2.31%to B&to C 是 Cutout Pro 是一个提供 AI 图像和视频处理功

72、能的平台,旨在简化图像和视频的编辑和设计过程。其提供包括 AI 背景移除、照片增强和放大、AI 驱动的编辑工具等。Fotor 1505-1.04%to C 否 Fotor 是一款图片编辑和平面设计应用,可利用 AI 来增强照片、创建设计和拼贴画。其提供的功能包括 AI 文生图、一键增强、智能美肤、背景移除、画质修复、AI 设计模板、AI拼图工具等。Photoroom 1287 9.94%to B&to C 是 Photoroom 由法国巴黎初创公司发布的一款AI 在线照片编辑平台,旨在帮助个人和商业用户提高照片专业程度,特别是在电商行业和内容创作领域。其提供的功能包括 AI 文生图、快速去除背

73、景、AI 生成背景、调整图片Pixlr 1239-3.97%to B&to C 否 Pixlr 一款基于云的图像编辑和设计工具,旨在利用 AI 技术简化图片编辑过程,并提供多种功能来帮助用户创建设计作品。其提供的功能包括 AI 图像生成器,AI 背景去除、AI图像填充、AI 图像扩展、AI 人像编辑、AI 风格迁移等。SeaArt 1026-7.40%to C 是 SeaArt 是一个 AI 图片生成和编辑工具,它允许用户通过输入文本提示词来生成高质量的图片。并且,还提供多种图片风格和预设供用户选择,以及多种可用于微调图像的高级编辑工具。图像生成 Yodayo 1711 11.44%to C

74、是 Yodayo 是一个专为虚拟 YouTuber(VTuber)和动漫爱好者设计的 AI 艺术平台。其 AI 功能能根据文字或图片自动生成高质量的动漫风格艺术作品。此外,该平台还设置了动漫虚拟角色聊天功能,并且为动漫迷提供了探索、分享和与其他动漫爱好者交流的空间。Al Time Machine 1131-9.01%to C 是 AI Time Machine 是一款由 MyHeritage 开发的基于 AI 技术的虚拟头像生成工具。通过对上传照片进行分析,识别照片人物面部特征,可生成适配各种历史时期或主题的人物头像。图像编辑 Remove.bg 6015 0.20%to B&to C 否 R

75、emove.bg 是一款基于 AI 技术的自动去除图片背景在线工具。其能检测图像中的物体边缘,并自动去除背景,以获得透明背景或替换为新背景的图片。此外,还支持编辑背景、调整图片大小、添加文本等功能。资料来源:AI 产品榜,公司官网,太平洋证券研究院 2 2)PPTPPT工具:工具:旨在提高效率、辅助设计,市场规模空间旨在提高效率、辅助设计,市场规模空间较为较为有限。有限。4月访问量超千万的PPT工具应用共3个,均为旨在提高制作效率及提供AI辅助设计的非原生AI应用,访问量在1000-2000万之间。我们认为,PPT工具应用市场规模空间较低,与图像应用类似,模型能力提升是其访问量进一步增长的关键

76、。对比国内,目前国内PPT工具应用访问量最高的为AiPPT.cn 353万,位列国内AI产品访问量第8,仍与海外产品存在3-6倍的差距,具备一定的增长空间。图 34:PPT工具应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 prezi 2004 5.82%to B&to C 否 Prezi 是一款基于云端的演示文稿制作工具,通过利用 AI 技术来增强演示文稿并使其更具吸引力。其提供智能模版、AI 辅助设计、演讲者教练帮助用户练习演讲、实时分析以帮助用户了解观众对 PPT 的反应等功能。Gamma 1431

77、 25.35%to C 否 Gamma 是一款由 AI 驱动的演示文稿制作工作,旨在帮助用户快速创建易于实时讨论或异步共享的演示文稿,包括 PPT、网页、博客等格式。其具备制作模板多样,AI 自动化,内容模块化等特点。SlidesGo 1234 7.82%to C 否 SlidesGo 是一款专注于演示文稿设计的在线平台,提供了大量 PPT 模板和幻灯片设计元素,帮助用户快速创建专业演示文稿。具备快速生成、在线编辑演示文稿等功能。资料来源:AI 产品榜,公司官网,太平洋证券研究院 总结:总结:编辑强于生成,编辑强于生成,模型能力模型能力提升是关键。提升是关键。目前多数图像应用都集成了图像生成和

78、图像编辑功能,而受限于多模态模型能力,图像编辑功能强于图像生成功能。并且,目前图像应用的访问量在1000-2000万之间,仍处于低位,未来有望通过加深与B端场景融合实现规模增长。3.33.3 音视频音视频/游戏类应用:游戏类应用:场景上限最高,场景上限最高,模型能力仍模型能力仍处探索期处探索期 1 1)音音频频生成:生成:多模态领域首个多模态领域首个UGCUGC应用应用表现亮眼,表现亮眼,面向面向B B端具备更大市场空间端具备更大市场空间。4月访问量超千万的音频生成应用共2个,包括音乐生成应用及语音生成应用。其中,音乐生成应用Suno V3因可根据文本生成高度逼真、风格多样的音乐备受市场关注,

79、4月访问量达3176万,在全球前100AI应用中排名第26;语音生成应用Eleven Labs具备文本转语音、生成克隆声音等功能,4月访问量达2017万,在全球前100AI应用中排名第32。我们认为,作为多模态领域的首个UGC应用,Suno V3收获了超3000万的访问量,为目前多模态应用最高。这表明UGC应用可释放用户内容品类创新潜力,吸引大量用户加入,为未来多模态应用发展的重要方向之一。但受限于音乐应用的商业模式,音乐生成应用的市场规模或较为有限。而可面向B端客户提供服务的语音生成应用具备更大的市场空间。图 35:音频生成应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to

80、B/to Cto B/to C AIAI 原生应用原生应用 简介简介 Suno Al 3176 38.04%to C 是 Suno AI 是一款强大的 AI 音乐生成器。它可以将文本转化为高度逼真的音乐和语音,支持多种音乐风格,如电影、RAP、翻唱等,并提供了多语言和不同性别的声音选择。目前其 V3 版本是首个能生成广播质量音乐的模型,该版本在音频质量、音乐风格的多样性、对提示词的遵从性等方面都有显著提升。Eleven Labs 2017 0.40%to B&to C 是 Eleven Labs 是一个提供创建和编辑 AI 生成音频内容的平台。其允许用户创建高质量的 AI 语音,用于文本转语音

81、和角色 AI 生成,并且还提供即时和专业的声音克隆服务,以 20 多种语言在数百种新声音和现有声音中生成语音的功能。资料来源:AI 产品榜,公司官网,太平洋证券研究院 2 2)视频编辑视频编辑&生成生成:革新视频制作流程,未来有望出现现象级视频革新视频制作流程,未来有望出现现象级视频UGCUGC应用应用。视频应用包括视频生成和编辑应用。其中,视频生成领域已有多个模型发布,如Runaway Gen-2、Pika、Sora等,但受限于模型能力,尚未有访问量超千万的应用出现。视频编辑应用方面,表现强于生成,目前访问量超千万的2个视频应用均为视频编辑应用。除了为C端用户提供更方便快捷的视频编辑工具外,

82、这2个应用还面向B端客户提供便于团队协作的编辑功能,进一步扩大市场规模。我们认为,未来随着模型能力提升,视频应用有望革新视频制作流程,提升制作效率,释放创作者创作潜力。并且,降低IP内容升维门槛,实现IP内容资产价值重估。此外,面向C端用户的UGC应用是视频领域出现现象级应用的重要方向。视频UGC应用有望释放用户内容创新潜力,在一定规模的用户基础上,实现优质视频创作与分享、吸引更多用户进入应用的正向循环。图 36:视频编辑应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 Loom 1888-0.79%to

83、B&to C 否 Loom 是一个具有 AI 功能的视频录制和共享平台,允许用户录制屏幕和摄像头画面,并将其分享给他人。其 AI 功能可实现自动为视频添加字幕,生成视频摘要,识别视频中的亮点并标记等。Veed.io 1335 7.98%to B&to C 否 Veed.io 是一个在线 AI 视频编辑工具。其具备自动为视频添加字幕,使用文本转语音功能生成画外音,为视频添加特效、转场、音乐音效,为视频内容进行翻译,为视频创建并添加虚拟人物等功能。具有操作简单、支持多层轨道编辑等特点。资料来源:AI 产品榜,公司官网,太平洋证券研究院 3 3)游戏生成:游戏生成:实时视频生成实现有望撬动更大市场实

84、时视频生成实现有望撬动更大市场,游戏,游戏UGCUGC应用应用释放玩家创作释放玩家创作潜力潜力。目前游戏生成应用的底层模型能力仍处在探索期,尚未出现表现亮眼的相关应用。4月访问量超千万的仅有非原生AI应用,由游戏引擎公司Unity开发的实时3D互动内容创作和运营平台。展望未来,随着2D、3D内容生成模型能力的逐渐提升,游戏生成应用有望革新游戏开发。并且,更成熟的实时视频生成技术能让视频内容的观众变成视频内容的一部分成为可能,让游戏玩家亲自参与到游戏进程中,收获沉浸式的游戏体验。因此,AI技术赋能游戏开发有望提高制作效率、创新玩法设计,玩家体验升级有望进一步挖掘潜在游戏用户,撬动更大的市场。此外

85、,游戏UGC应用有望成为C端游戏玩家共创游戏生态的重要入口。通过构建支持UGC的工具和环境,吸引大量玩家通过游戏生成应用自定义游戏内容资产,释放游戏玩家内容创作潜力。图 37:游戏生成应用 名称名称 4 4 月访问量(万)月访问量(万)变化变化 to B/to Cto B/to C AIAI 原生应用原生应用 简介简介 Unity 1214-0.98%to B&to C 否 Unity 是游戏引擎公司 Unity 开发的实时 3D 互动内容创作和运营平台。其 Unity Muse AI 辅助创作平台,能让用户通过输入简单的文本提示词,实现快速开发游戏。其中的 Muse Chat 能利用 AI

86、搜索帮助用户在 Unity文档、培训资源和支持内容中快速找到所需信息,以加快开发速度并解决问题。其 Unity Sentis 允许开发者在游戏构建中嵌入神经网络,使得 AI 模型能够在任何运行 Unity 的设备上运行。资料来源:AI 产品榜,公司官网,太平洋证券研究院 总结:总结:场景天花板高,未来场景天花板高,未来AIAI+UGCUGC视频和游戏将是视频和游戏将是C C端端应用应用的重要方向的重要方向。音视频、游戏作为更高维度的内容形式,对应的场景天花板最高:根据共研研究院数据,2023年全球在线音频市场规模有望增长至943亿元;根据贝哲斯咨询数据,2023年全球数字视频内容市场规模达1.

87、15万亿元;根据伽马数据,2023年全球游戏市场规模达1.18万亿元。但因多模态模型能力仍处在探索期,目前各类应用体量仍较低:音乐应用呈现一家独大的格局。视频生成应用因生成视频质量不稳定、时长限制等因素,用户访问量仍未出现大规模增长。游戏生成则尚未出现表现亮眼的应用。我们认为,随着多模态模型能力的提升,应用有望在两个方面实现快速起量:一方面,赋能内容制作环节。如在视频行业有望大幅降低内容生成门槛,推动内容资产价值重估,让专业创作者能够专注于内容创意本身。另一方面,推出面向C端用户的UGC应用。在拥有一定用户规模的前提下,释放用户内容创新潜力,实现内容制作和分享、吸引更多用户进入应用的正向循环。展望未来,我们认为多模态现象级应用将在面向C端用户的AI+UGC视频和UGC游戏中诞生。

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2024海外AI大模型发展现状及海外应用梳理分析报告.pdf)为本站 (2200) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠