1、请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 2023.11.02 多模态加速燃烧算力多模态加速燃烧算力 李博伦李博伦(分析师分析师)0755-23976516 证书编号 S0880520020004 本报告导读:本报告导读:GPT-4V正式发布后,大模型演进正式进入多模态时期,对于算力的需求也大幅增加,正式发布后,大模型演进正式进入多模态时期,对于算力的需求也大幅增加,短期继续看好算力板块。短期继续看好算力板块。摘要:摘要:投资建议:投资建议:短期继续看好算力板块投资机会。GPT-4V 发布,多模态时代正式开启,无论在训练阶段还是在推理阶段,对于算力的需求都相较于单模态模
2、型有极大的提升,短期继续看好算力板块,推荐标的神州数码、浪潮信息、拓维信息、恒润股份、淳中科技,受益标的紫光股份、中科曙光、四川长虹、真视通、中国长城、莲花健康、鸿博股份、润建股份、中贝通信、烽火通信、恒为科技等。AIAI 模型全面多模态化是必然趋势。模型全面多模态化是必然趋势。2023 年 9 月 25 日,OpenAI 正式在 ChatGPT 中推出语音和图像处理功能,多模态模型的核心是处理和整合这些不同类型的数据源。这种模型可以捕获跨模态的复杂关系,使机器能够更全面地理解和分析信息,从而在各种任务中表现得更好。人工智能领域研究一直致力于以技术实现计算机对于人类认知世界方式的高度效仿,单模
3、态交互显然是一个局限的、并不完整的模型。所以“多模态”研究的大势所趋已十分明朗。GPT-4V 打开更广阔的应用场景。打开更广阔的应用场景。单模态和多模态模型在数据输入、设计结构和数据相关性方面有明显的差异。根据微软的测评,GPT-4V在视觉-语言能力、视觉标记提示、时间和视频理解、抽象视觉推理、情商测试等方面表现极为出色。我们认为,多模态模型会显著打开下游应用场景,破除单纯文字交互的局限性,将打开工业领域、医学领域、汽车保险领域、自定义字幕生成器、图像智能、具身智能等等下游应用场景。算力需求持续爆发。算力需求持续爆发。OpenAI 认为自 2012 年以来,大规模 AI 训练所需的算力呈指数级
4、增长,每 3.4 个月翻一番。2012-2018 期间已增长超过 300,000 倍。我们认为当前多模态大模型仍在不断迭代,训练阶段的算力将保持增长。根据我们测算,GPT-4 对于算力的需求在同等训练时长下相比 GPT-3 增长 445 倍,训练成本持续高企,算力租赁商业模式具备可行性,短期持续看好算力以及算力租赁三道。风险提示:风险提示:应用端发展进度低于预期;政策风险;企业管理风险 评级:评级:增持增持 上次评级:增持 细分行业评级 计算机 增持 相关报告 计算机 视频监控安全新标准发布,商用密码行业需求有望爆发 2023.10.31 计算机 江淮接力赛力斯,华为智选模式高歌猛进 2023
5、.10.29 计算机增发国债有望扭转政府信息化投资预期 2023.10.25 计算机美国加大制裁,国产 AI 算力重要度跃升 2023.10.18 计算机 华为鸿蒙生态攻坚克难,自主可控正当时 2023.10.16 行业专题研究行业专题研究 股票研究股票研究 证券研究报告证券研究报告 计算机计算机 行业专题研究行业专题研究 请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 2 of 27 目目 录录 1.GPT-V4 发布,ChatGPT 正式进入多模态时代.3 1.1.多模态大模型性能全面领先.3 1.2.多模态模型主要经历三个时代.5 2.多模态技术逐步成熟,下游应用场景逐
6、步打开.5 2.1.多模态大模型历经迭代,成功落地.5 2.2.多模态 VS 单模态大模型,差异显著.7 2.3.微软官方测评,GPT-4V 任务表现出色.8 2.3.1.视觉-语言能力:掌握多领域的视觉语言识别和输出.8 2.3.2.视觉标记提示:具备视觉和时间维度的理解能力.13 2.3.3.时间和视频理解:图像和视频方面的解析推理能力强大.15 2.3.4.抽象视觉推理:善于处理和解读抽象视觉刺激.16 2.3.5.情商测试:提供情感洞察、审美判断功能.18 2.4.GPT-4V 新增多样化需求,未来应用前景广阔.19 3.多模态大模型算力需求仍在持续增长.22 3.1.模型数据量显著增