1、2023 年深度行业分析研究报告 内容目录内容目录 1.海外大模型形成一超多强格局,海外大模型形成一超多强格局,OpenAI 被加速追赶被加速追赶.5 1.1.Google Gemini:原生多模态且能力有望追平 GPT-4.5 1.2.大模型 Mixtral 通过专家混合结构提质增效.8 1.3.OpenAI 推出 GPT-4V 并持续保持领先.9 1.4.Claude3 震撼发布,能力略超 GPT-4.10 1.5.Meta 持续打造开源生态,加购算力研发 LLaMA3.11 2.国内大语言模型能力突破,逐步达到甚至超过国内大语言模型能力突破,逐步达到甚至超过 GPT3.5 水平水平.12
2、 2.1.智谱推出 GLM4,能力超过 CodeGeex2-6B.12 2.2.百度推出文心一言 4.0.13 2.3.讯飞正式发布星火大模型 3.5,能力比肩 GPT-4.14 2.4.通义千问推出 2.0 版本,能力赶超 GPT 3.5.15 2.5.Minimax 在国内推出 MoE 模型 abab6.15 2.6.百川智能上线 Baichuan3,中文、医疗能力表现优秀.15 3.多模态生成新技术不断突破,正处于技术突破的关键期多模态生成新技术不断突破,正处于技术突破的关键期.16 3.1.SORA 模型横空出世,视频生成模型的 GPT3 时刻来临.16 3.2.pika 推出 1.0
3、,模型效果快速提升.16 3.3.Stability.ai 发布并开源 Stable Video Diffusion 模型.17 3.4.Google 发布 VideoPoet,基于 LLM 的技术路径表现出亮眼的视频生成能力.18 3.5.Midjourney 推出 V6,大版本迭代带来更优异的图片生成能力.18 3.6.微软推出针对数字人的大模型 GAIA.18 3.7.阿里巴巴推出 Animate Anyone,让图片动的更自然.19 4.应用端应用端 OpenAI 正式推出正式推出 GPT store,生态体系正式建立,生态体系正式建立.20 5.海外模型大厂算力需求持续增加,模型海外
4、模型大厂算力需求持续增加,模型 Scaling 趋势仍在继续趋势仍在继续.20 图表目录图表目录 图 1:Gemini 采用原生多模态的模型结构.5 图 2:Gemini 可用来修订学生作业.5 图 3:Gemini 模型有三种等级的参数.5 图 4:Gemini 基准测试量化结果.6 图 5:Gemini 模型结合了多种多模态能力.7 图 6:Gemini 1.5 pro 拟人(humaneval)能力对比.7 图 7:Gemini 1.5 pro 多模态能力对比.7 图 8:混合专家层结构.8 图 9:Mixtral 8*7B 标化测试结果.8 图 10:LMSys 排行榜(2023 年
5、12 月 22 日).8 UZ3U1XDXSV5XOY8ObPaQsQmMnPsOlOqQtQeRpOqRaQqRmMwMoNvNuOsQsN 图 11:Mixtral 8x7B、LLaMA2 测试结果对比.9 图 12:Mixtral 8x7B 与 LLaMA2、GPT-3.5 对比.9 图 13:GPT-4V 输入、输出模式和应用场景.9 图 14:Claude2.1 开放式 Q&A 精度提升.10 图 15:Claude2.1 减少长文本错误率.10 图 16:Claude3 模型的部分测试结果超过 GPT-4.11 图 17:LLaMA1 与 LLaMA2 模型家族的参数和性能等.11
6、 图 18:闭源模型基准测试对比结果.11 图 19:LLaMA2 软硬件投入.12 图 20:GLM-4 基础能力和中文对齐能力.13 图 21:智谱 GLM Store.13 图 22:百度“芯片+平台+模型+应用“4 层架构.13 图 23:千帆 AI 原生应用商店覆盖 B 端 5 大领域.13 图 24:ERNIE 赋能文心产业级知识增强大模型.14 图 25:ERNIE 效果对比.14 图 26:用于训练新一代星火大模型的“飞星一号”平台.14 图 27:讯飞星火 V3.5 七大能力提升.14 图 28:讯飞大模型总开发者总数超 35 万.14 图 29:星火开源-13B 上线.14