1、2022 年 11 月 ChatGPT 发布,引爆国内百模大战,创业玩家如雨后春笋,互联网巨头也纷纷下场,巅峰时期国内公开大模型数量超越 300 个。如今一年半过去,巨头们依托固有业务,更早形成壁垒,率先晋级。而创业玩家这边,胜局也已锁定,目前或许只有少数几家公司拿到了和巨头角逐下半场的门票。他们分别是智谱 AI、MiniMax、阶跃星辰、百川智能、月之暗面和零一万物,这六家公司背后都转起了一个关键飞轮模型、应用和融资飞轮,这使得他们能够与巨头同场竞技。另外,这一赛道上还有面壁智能和 DeepSeek。他们共同组成了许多人认为,继移动互联网之后的 AI 时代,新的巨头或将从这八家公司中诞生。而
2、放眼全球,美国大模型行业同样存在类似的阶段性竞争格局变化,像曾经的移动互联网时代一样,中美再次在两个“平行宇宙”中上演新的历史进程在本篇报告中,量子位智库将以一个逐步放大的视角,从国内创业玩家“6+2”格局、国内巨头玩家格局、海外玩家格局三个层次,力求为读者描绘大模型行业格局完整画卷。分类创始人模型C 端产品B 端产品最新估值学院派学院派唐杰GLM智谱清言、清影 API、云端私有化、本地私有化约 30 亿美元青年派青年派闫俊杰abab星野、海螺、TalkieAPI约 25 亿美元杨植麟MoonshotKimiAPI约 30 亿美元大佬派大佬派姜大昕Step跃问、冒泡鸭AI 金融、AI 内容创作
3、约 20 亿美元*王小川Baichuan百小应、健康顾问MaaS+AaaS 行业解决方案超 20 亿美元李开复Yi-数字人解决方案全行业 ToB 解决方案、AI Infra 解决方案超 10 亿美元模型创始人DeepSeek梁文锋模型创始人MiniCPM李大海刘知远创业特别关注创业六小强2019.062019.06智谱 AI 成立2021.122021.12MiniMax 成立2022.082022.08面壁智能成立2023.04.062023.04.06阶跃星辰成立2023.04.102023.04.10百川智能成立2023.02023.03 3月之暗面成立2023.05.162023.05
4、.16零一万物成立2023.07.172023.07.17深度求索成立2020.06.112020.06.11OpenAI 发布 GPT-32022.112022.11OpenAI 发布 ChatGPT,引爆百模大战*为投前估值国内创业玩家“6+2”格局总览国内创业玩家核心竞争力四维度模型在模型维度上,本章将根据各家创业公司特点有侧重地介绍其研发历程、模型能力特点、架构特色、矩阵构成、Benchmark 成绩、AGI 路径规划等情况中的一到三项。竞争力维度具体内容应用在应用维度上,本章将根据各家创业公司特点有侧重地介绍其大模型应用矩阵、特色应用、主力应用、实现功能、用户数据、战略特点、生态布局
5、、付费模式等情况中的一到三项。团队在团队维度上,本章将介绍各家创业公司核心团队成员情况,具体包括教育背景、学术影响力、重要头衔、相关工作履历等信息。融资在融资维度上,本章将介绍各家创业公司融资历程,具体包括历次融资时间、轮次、金额、估值及投资机构。脱胎于高校实验室,技术成熟自然转化:脱胎于高校实验室,技术成熟自然转化:智谱 AI 脱胎于清华 KEG 实验室,是清华计算机系技术成熟到一定程度的转化成果,于 2019 年 6 月正式成立,2022 年 8 月发布自研百亿参数大模型 GLM,彼时 GPT-3.5 还未发布。自研底层框架打破垄断,矩阵全面对标自研底层框架打破垄断,矩阵全面对标 Open
6、AI OpenAI:2022 年 3 月,唐杰团队提出了全新自研的通用预训练框架 GLM,打破当时西方垄断主流大模型预训练框架技术路径的局面。智谱 AI 在模型和产品矩阵甚至投资策略上均对标 OpenAI,最新的 GLM-4 基座大模型能力多方位接近世界领先水平。智谱 AI模型:清华系成果转化,自研底层架构,对标 OpenAIOpenAI vs 智谱1996清华 KEG 实验室成立致力于网络环境下知识工程理论、方法和应用研究2015.12OpenAI 正式成立2022.08智谱发布开源千亿大模 GLM-130B,效果对标 GPT-3 175B2021智谱百亿参数大模型 GLM 发布,采用全新预
7、训练模型框架2020.06OpenAI 发布 GPT-32019.06智谱 AI 正式成立2022.12OpenAI 发布 GPT-3.5,引爆百模大战2023.08智谱上线 AI 助手应用“智谱清言”2024.01智谱发布最新一代基座大模型 GLM-4 性能达到国际领先水平2024.07智谱发布视频生成功能“清影”智谱 GLM-4(0520)在 GSM8K、MATH、BBH、GPQA、HumanEval 等多个国际主流 Benchmark 上成绩超过 GPT-4(0314)。信息来源:智谱及公开信息整理SoraCogVideo 清影面壁智能、生数科技、无问芯穹等产业投资视频生成Agent 开
8、发平台图像生成platform.openaibigmodel.aiChatGPTDALLECodexGPT-4oChatGLM 智谱清言CogViewCodeGeeXCogVLM应用产品代码多模态MaaS平台gptstore智谱清言智能体中心Helion、Rain AI、Anthropic等GPT底层框架GLM智谱 AI应用:工程基因,侧重 ToB,商业化进程身位领先ToToB B 基因突出,主打基因突出,主打 MaaS MaaS 平台:平台:智谱脱胎的清华 KEG 知识工程研究室自 90 年代就强调工程落地,造就了团队将技术落地到需求中的做事风格。智谱团队以 ToB 背景为主,商业化重心在
9、B 端,智谱大模型开放平台目前已有超 40 万的企业用户,主要覆盖金融、教育、互联网、零售、汽车、能源、传统制造业等行业。ToToC C 侧重生产力应用,视频生成功能侧重生产力应用,视频生成功能“清影清影”上线:上线:智谱 ToC 业务目前仍以免费为主,主力应用“智谱清言”,截至 2024 年 6 月历史下载量突破 500 万,同时智谱清言也是智能体开发平台,目前已有超过 30 万个智能体活跃在智谱清言 APP 可供使用,2024 年 7 月新上线视频生成功能“清影”,对标 Sora,免费公开使用不限次。智能座舱售后服务市场营销研发制造AI 汽车AI 手机售后服务生活服务助手AI 医疗AI 金
10、融 AI 旅行AI BIAI 陪伴AI 导购AI 客服AI 营销AI 质检AI 供应链AI 风控其他信息来源:智谱及公开信息整理智谱清影 AI 生成视频功能网页端依据量子位智库量子位智库发布的 AIAI 智能助手智能助手 APP 8APP 8 月榜单月榜单,智谱的 ToC 主力应用智谱清言下载量突破 500 万,位列第七。(完整报告数据请查看量子位智库公众号)API 单日调用量600 600 万万+API 单日调用 tokens400 400 亿亿+服务企业客户3 30 0 万万+融资金额及估值处于第一梯队:融资金额及估值处于第一梯队:智谱是目前国内估值最高的大模型初创公司之一,最新一轮融资估
11、值报据传为 30 亿美元,从团队背景、模型开发进展、商业化方向及资金储备情况来看,公司处于国内 AI 创业公司头部。积极布局产业生态,投资多家技术优势公司:积极布局产业生态,投资多家技术优势公司:为打造自己的 AI 大模型生态圈,智谱参与了十多家 AI 大模型产业相关创业公司的投资,被投企业多为清华系,且以技术导向为主。信息来源:智谱、相关报道及公开信息整理智谱 AI融资:融资轮次多、估值领先,全产业链投资积极布局生态时间轮次金额估值投资机构2024/09B+轮数十亿200 亿中关村科学城2024/05B+轮约 4 亿美元约 30 亿美元Prosperity7 Ventures2024/03B
12、+轮-顺禧基金2024/01B+轮-光速光合2023/10B+轮-蚂蚁集团2023/09B+轮12 亿25 亿好未来、小米、红杉、美团、腾讯投资、金山软件、阿里巴巴、顺为资本、高瓴资本、君联资本2023/07B+轮约 3 亿40 亿美团2023/05B+轮约 4 亿40 亿今日资本,蚂蚁金服,光速中国2022/09B 轮约 2 亿20 亿启明创投,君联资本,华控基金2021/09A 轮约 1.5 亿-图灵创投、凌云光、华控基金、将门创投、海南智桥、IMO Ventures、达晨财智、北京荣品2021/04天使轮-北京创新智源科技有限公司2019/08种子轮-中科创星、华控技术转移有限公司、清控
13、资管集团发起总额为 10 亿人民币的大模型创业基金,支持大模型原始创新,覆盖大模型算法、底层算子、芯片优化、行业大模型和超级应用等各方面。对创业者分别联合 CCF 中国计算机学会、中国中文信息学会社会媒体处理专委会发起了 CCF-智谱大模型基金、SMP-智谱大模型交叉学科基金,用于支持大模型理论、算法、模型、应用等相关研究和跨领域交叉创新。对学术界成立大模型开源基金,计划累计用 1000 张 GPU、1000 万人民币和 1000亿 tokens 来支持人工智能开源社区建设。对开源社区智谱投资布局依托清华依托清华 AI AI 人才资源:人才资源:截至 2024 年 9 月,公司员工共计 600
14、 余人,其中大模型研发人员接近半数,其余为客户服务落地人员及产品人员。公司借助清华系高校背景,持续吸引高端人才。团队具备从研发到落地全栈能力:团队具备从研发到落地全栈能力:公司团队源自清华知识工程研究室 KEG,该实验室自 90 年代成立起就走的是“科研+工程化落地”路线,团队成员具备深厚技术积累及综合运营经验;创始人唐杰教授是认知智能领域顶尖专家,具备 20 余年人工智能领域研究经验。信息来源:智谱及公开信息整理智谱 AI团队:学院派代表,清华计算机系人才众多王绍兰王绍兰总裁总裁 曾任清华数据科学研究院科技大数据研究中心副主任 凹凸科技北京公司总经理 获得授权发明专利 15 项,美国发明专利
15、 2 项 20余年技术和政府项目综合经验 清华数据科学研究院科技大数据研究中心副主任 中科院计算所博士,师从高文院士 获得授权发明专利 40 余项,国际标准一项刘德刘德兵兵董事长董事长 清华计算机系本硕博,中国新闻信息标准化分会委员 电子学会标准化工作委员会机器 人技术委员会委员 在 ICML、ISWC 等顶级会议上发 表 10 余篇文章张鹏张鹏 CEOCEO 清华大学计算机科学与技术工学博士、IEEE Fellow 清华大学计算机系教授,研究方向知识图谱 曾主导开发全球最大万亿级超大规模预训练模型悟道唐杰唐杰 创始人创始人技术顾问技术顾问 巴黎第十一大学计算机硕士、法国梅斯大学计算机硕士 曾
16、任大搜车集团 CTO,曾创立元因智能任 CEO,创立妙计旅行任 CEO,是智能技术领域连续创业者 曾在字节,腾讯,搜狗从事技术管理工作 张帆张帆 COOCOO信息来源:MiniMax 及公开信息整理MiniMax模型:选择混合专家架构技术路径,打造多模态模型Dense Dense 稠密模型稠密模型MMoE oE 混合专家模型混合专家模型由自注意力机制层(SA)和前馈神经网络层(FFN)组成,每一层都与前层直接相连。每次前向传播中所有的参数都被激活和使用,需要的计算量和显存更大。自注意力机制层(SA)后接了多个前馈神经网络层(FFN)。在每次前向传播中,由路由机制选择性激活部分 FFN。可减少计
17、算量和显存需求,同时提高模型在同等条件下的灵活性和容量。模型架构对比主流测试集成绩视频大模型abab-video-1压缩率高、文本响应好、风格多样,支持原生高分辨率、高帧率视频音乐大模型abab-music-1支持多功能端到端音乐生成,可合成多种音乐形式,支持伴奏人声同时生成语音大模型abab-speech-1支持粤语、韩语、班牙语等多语种,生成语句超拟人,情绪细腻自然模型矩阵单日交互次数3030 亿亿次次日均处理Tokens3 3 万亿万亿abab 6.5 系列包含两个模型:abab 6.5 和 abab 6.5s。在各类核心能力测试中,abab 6.5 开始接近 GPT-4、Claude-
18、3、Gemini-1.5 等世界上最领先的大语言模型。abab 6.5 与世界领先语言模型在多个开源测试集上的成绩对比国内最早研发国内最早研发 MoE MoE 及及 Linear AttentionLinear Attention:2023 年 6 月,MiniMax 在 MoE 混合专家架构仍是行业非共识时选择 All in MoE,彼时行业大部分公司仍在训练 Dense 稠密模型。2024 年 1 月,MiniMax 发布千亿参数 MoE 架构模型;4月底,推出万亿参数 MoE 架构模型。即将发布的 abab 7 模型将基于 MOE+Linear Attention。围绕产品需求打造全矩阵
19、多模态模型:围绕产品需求打造全矩阵多模态模型:截至 2024 年 9 月,MiniMax 已推出视频大模型、音乐大模型及语音大模型,最新主力模型 abab 6.5 在多项核心能力上开始接近世界最领先大语言模型水平。信息来源:MiniMax、Sensor Tower 及公开信息整理MiniMax 应用:以娱乐陪伴方向为主,专注打造超级应用海外海外 Talkie Talkie:Talkie 于 2023 年 6 月上线,主要面向北美市场。产品玩法与星野类似,用户可以定制 AI 智能体的形象、声音、人设、技能,并进行卡牌抽取及交易。根据 Sensor Tower 数据,Talkie 2024 年 H
20、1 在美国市场累计下载量 380 万次,位列美国同类 AI 产品排名第一,超过 Character.AI。目前 Talkie 全球月活数据已达到 1100 万,一半以上用户来自美国,与Character.ai 月活数据 1700 万的差距逐渐缩小。国内星野:国内星野:星野于 2023 年 9 月上线,用户可以在星野上通过简单描述定制 AI 智能体的形象、声音、人设、技能,并在后续对话中不断调整强化。也可以选择首页推荐的数百万款由用户创建的智能体进行多模态沉浸式互动。此外,星野还探索了订阅制和抽卡制的付费模式、以宝石为主的经济体系和以星念为中心的用户共创激励体系。依据量子位智库量子位智库发布的A
21、IAI 陪伴陪伴 8 8 月月 APPAPP 榜单榜单,星野 APP 下载总量超 1400 万,月新增下载及 DAU 均位列国内同类 AI 产品第一。生产力应用海螺海螺 AI AI:海螺 AI 于 2024 年 5 月上线,支持多种交互方式:可以发送文字消息、上传图片、PDF、PPT、TXT、DOCX 等格式文件,支持语音通话。8 月下旬最新开放音乐创作与视频创作入口,可由此进入海螺音乐及海螺 AI 创意视频平台,调用海螺视频生成大模型能力。API开放平台角色扮演AI客服聊天问答AI招聘智能硬件AI 教育AI办公AI 零售落地场景ToC ToC 打造超级应用工厂:打造超级应用工厂:MiniMa
22、x 是国内创业公司里做应用产品最早、最多的公司,2022 年早于 ChatGPT 一个月上线 Glow,又陆续推出了 AI 内容平台应用星野、Talkie,以及生产力助手海螺 AI。8 月最新发布海螺 AI 创意视频平台,可调用最新视频生成模型,视频生成能力尤其是人物表情生成方面受到海内外好评。ToToB B 布局开放平台:布局开放平台:ToB 方向布局 API 开放平台,目前已接入 3 万余家企业客户,主要落地场景包含零售、教育、办公、智能硬件、招聘、客服、聊天等。估值高、投资门槛高、融资金额高:估值高、投资门槛高、融资金额高:MiniMax 作为国内大模型创业六小强中唯二在 ChatGPT
23、 爆火之前就成立的大模型公司,很早就吸引了头部机构注意,目前已集集齐阿里、红衫、高瓴、经纬、IDG、顺为、明势、云启一众头部机构,估值约 25 亿美元。人才技术实力强,产品经验丰富:人才技术实力强,产品经验丰富:创始人兼 CEO 闫俊杰具备丰富的技术、产品和商业化管理经验,核心技术团队拥有世界顶尖自然语言处理、语音、计算机视觉、计算机图形学等工业和学术经验。信息来源:MiniMax 及公开信息整理MiniMax融资&团队:率先晋升独角兽,Under 35 创始人带队时间轮次金额估值投资机构2024/03A轮6 亿美元25 亿美元阿里巴巴、红杉中国、高瓴投资、经纬创投2023/06A轮2.5 亿
24、美元12 亿美元腾讯投资、绿洲资本、小红书、顺为资本、高瓴投资、IDG 资本2022/07A轮-超 2000 万美元IDG 资本、明势资本、高瓴创投、米哈游2022/01天使轮-云启资本团队成员闫俊杰闫俊杰创始人、创始人、CEOCEO中科院自动化所博士,在人工智能顶会及核心期刊发表论文 200余篇,谷歌学术被引用超 3 万次曾任商汤集团副总裁,从零打造通用计算机视觉模型、深度学习工具链和人脸识别相关的技术体系获得多项重要奖项和荣誉,包括超过 10 次重要国际学术竞赛的冠军,广东省技术发明一等奖,两次吴文俊人工智能二等奖等魏伟魏伟合伙人合伙人开放平台业务负责人开放平台业务负责人曾任腾讯云副总裁,
25、百度技术总监,中国云计算领域的早期贡献者涉足技术和业务两大领域,早在 2011 年就开始使用 GPU 驱动深度学习,支持算力平台的发展贠烨祎贠烨祎联合创始人、联合创始人、COOCOO毕业于约翰霍普金斯大学,主修电子计算机工程、数学和经济,主研深度学习在医疗影像领域的技术和应用曾任商汤科技投融资经理、战略/国际化总监、创新业务总经理,负责集团多项业务孵化、国际化探索,参与集团多轮融资主打长文本,专注迭代唯一模型:主打长文本,专注迭代唯一模型:月之暗面成立于 2023 年 3 月,同年 10 月首次发布支持 128k 上下文长度的模型时处于业界领先地位,目前 200 万文本长度功能内测中,仅发布唯
26、一一款千亿参数大语言模型,下阶段即将发力多模态。AGI AGI 路径战略有一定前瞻性:路径战略有一定前瞻性:多次在行业非共识阶段提出公司的 AGI 战略思路,如长文本是必经之路、通过ToC 产品实现数据 Scaling、专注迭代文本能力、在智力密集场景打造超级应用转动数据飞轮反哺模型等观念。信息来源:月之暗面 Kimi 及公开信息整理月之暗面模型:明确主打长文本能力,专注迭代文本模型2023.032023.03月之暗面成立2022024.084.08正式发布企业级 API 2022024.074.07Kimi 开放平台引入上下文缓存功能,加快模型响应速度 202024.0324.03Kimi
27、智能助手 200 万字上下文功能内测202023.1023.10推出 Kimi 智能助手,支持 20 万字上下文输入202024.0224.02Kimi 开放平台公测二百万字长文本根据月之暗面提供的信息,对于中文文本,1 个 Token 大约相当于 1.5-2 个汉字,如果按 1.75 的比例换算,200 万字相当于 114 万 t o k e n s。(Kimi 智能助手 200 万字上下文目前未对公众开放,只能通过申请内测使用。)Kimi 智能助手 200 万字上下文功能上传英伟达 2016-2024 年财报后进行长文本分析。流量领跑创业玩家,积极探索变现路径:流量领跑创业玩家,积极探索变
28、现路径:2023 年 10 月推出 kimi 智能助手,2024 年 3 月爆火,带涨 kimi 概念股;6 月网页端点击量超越百度文小言;2024 年 5 月,率先上线六档打赏功能,强调灵活性和趣味性,持续积极探索变现路径。营销能力突出,获客成本高引争议:营销能力突出,获客成本高引争议:营销年轻化、网感好,获客手段之一是投流,据传 CPA 高达 30 元,虽然在业内引起争议,但也投出了一个早期爆款应用。开始通过开始通过 API API 建设生态,加码建设生态,加码 B B 端业务:端业务:2024 年 2 月正式面向企业和开发者开放企业级 API 服务,在增加 B 端服务的同时也开始布局产业
29、生态。信息来源:量子位智库、月之暗面 Kimi 及公开信息整理月之暗面应用:高成本获客打造爆款应用,网感营销风格突出社交平台网感营销打赏项目价格高峰期使用权限平均每天价格送 Kimi 一朵花5.2元4天1.30元给 Kimi 加鸡腿9.9元8天1.23元请 Kimi 喝咖啡28.8元23天1.25元给 Kimi 充充电49.9元40天1.24元请 Kimi 吃顿饭99元93天1.06元和 Kimi 一起登月399元365天1.09元Kimi 智能助手积极探索变现路径,首发打赏制,相比传统订阅制度更加灵活机动,强调趣味互动,营造智能助手伙伴感。提供的高峰期不限速服务平均日价格约 1.2 元/天。
30、海外竞品 OpenAI 订阅价格为 20 美元/月(约人民币 140 元/月),国内竞品大多为免费制。根据量子位智库量子位智库AIAI 智能助手智能助手 APP 8APP 8 月榜单月榜单及及AIAI 智能助手智能助手 8 8 月月 WebWeb 端榜单端榜单,Kimi 智能助手截至 2024 年 8 月 APP 端历史总下载量近 3000 万,位列国内第二,仅次于豆包 AI;Web 端月访问量超 2000 万,位列国内第一。(完整报告请查看量子位智库公众号)信息来源:月之暗面 Kimi及公开信息整理月之暗面融资&团队:资本宠儿,小天才范本,创业流量担当创始团队时间轮次金额估值投资机构2024
31、/05B+-30亿美元腾讯、高榕创投2024/02B超10亿美元-阿里、红杉中国、小红书、美团、砺思资本2023/07A-美团龙珠2023/06天使超2亿美元-真格基金、红杉中国、今日资本融资估值高、金额高、门槛高:融资估值高、金额高、门槛高:截至 2024 年 7 月月之暗面已进行 4 轮融资,估值高达 30 亿美元,融资金额均为上亿美元,资方全部为头部机构。很大程度由于创始人杨植麟在求学之路早期就开始闪耀天才星光,符合资本投人“小天才”画像,早早吸引投资人押注,其中部分资方与杨植麟在创办循环智能时就已结缘。创始团队为清华计算机系四同门:创始团队为清华计算机系四同门:主要团队是清华计算机系本
32、科同学。灵魂人物杨植麟标签包括但不限于“天才学霸”、“连续创业”、“顶尖计算机学府”、“懂艺术”、“情智双高”。周昕宇周昕宇联合联合创始人创始人清华大学计算机系本科,本科曾与杨植麟共同组建乐队 Splay Tree在旷视科技从事算法量产工作,与旷视研究院基础科研负责人张祥雨合作在 CVPR 发表 ShuffleNet 论文,后影响包括苹果 3D 人脸解锁在内的各种手机毫秒级人脸解锁技术吴育昕吴育昕联合联合创始人创始人清华大学计算机系本科毕业,后到卡耐基梅隆大学深造,研究方向为计算机视觉中的检测和识别问题,谷歌学术被引超过 1.9 万次2018 年获欧洲计算机视觉会议 ECCV 最佳论文提名。同
33、年在 GeekPwn 国际安全极客大赛上成为 唯一破解人脸识别算法的参赛团队曾在 Meta 人工智能实验室 FAIR,与队员何恺明共同提出组归一化 Group Normalization 方法。期间还创建了 Detectron2,是 Meta 最受欢迎的 AI 项目之一杨植麟杨植麟创始人创始人高中竞赛保送清华大学,大二转去计算机系师从 IEEE Fellow 唐杰,2015 年以年级第一名成绩毕业,本科期间曾组建摇滚乐队 Splay Tree,任鼓手和词曲作者博士就读于卡内基梅隆大学,在语言技术研究所 LTI 深造,师从苹果 AI 研究负责人 Ruslan Salakhutdinov、谷歌 A
34、I 首席科学家William Cohen。博士期间,一作身份论文引用次数破万,顶会发表论文 20 余篇,和众多学术明星如 Yoshua Bengio、Yann LeCun、Quoc VLe 等合著论文博二时和张宇韬创办循环智能博士毕业后任清华大学交叉信息研究院助理教授蛰伏一年,亮相惊艳,蛰伏一年,亮相惊艳,Scaling Law Scaling Law 攀登者:攀登者:2023 年 4 月阶跃星辰成立,一年后首次发布 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态模型和 Step-2 万亿参数 MoE 语言大模型预览版三款大模型,团队主要从算力、系统、数据、算法四方面为攀登
35、Scaling Law 作准备。MoE MoE、多模态两手抓,迈入万亿模型俱乐部:、多模态两手抓,迈入万亿模型俱乐部:2024 年 7 月 4 日,阶跃星辰在 2024 年世界人工智能大会上第二次亮相,发布了 Step-2 万亿参数 MoE 语言大模型正式版、Step-1.5V 千亿参数多模态大模型、Step-1X 图像生成大模型三款 Step 系列模型新款。信息来源:阶跃星辰及公开信息整理阶跃星辰模型:模型矩阵能力全面,技术路径规划清晰算力通过自建机房+租用算力,积极储备算力。系统成员实践过单集群万卡以上的系统建设与管理,训练千亿模型的有效算力输出 MFU 达 57%。数据数据团队核心骨干来
36、自必应搜索引擎,曾支持全球 100 多种语言,为 200 多个国家和地区提供服务。对全球互联网高质量语料的分布有深入了解。并建立了高质量数据处理和知识图谱流水线。算法驾驭多种大模型架构,同时对大模型的认知以及发展路线进行深刻洞察。类型模型参数架构对标文本Step-2万亿MoEGPT-4多模态Step-1.5V千亿-GPT-4V图像生成Step-1X8BDiTDALL-E模型矩阵阶跃星辰 Step-2 在 VICUNA、AGIEVAL、BBH、DROP、MATH 等多个国际主流 Benchmark 上成绩超过 GPT-4-1106、Claude 3 和 Llama 3 70B Chat。主流测试
37、集成绩AGI路径早期当前未来语言模型视觉模型声音模型参数数据算力Scale多模理解多模生成多模态大模型统一理解及生成探索物理世界抽象归纳世界超级对齐System 2具身智能环境交互ToToC C 布局生产力和娱乐陪伴两款产品:布局生产力和娱乐陪伴两款产品:2024 年 3 月首发亮相时同步发布生产力智能助手“跃问”和 AI 内容开放平台应用“冒泡鸭”两款产品,跃问目前已实现 AI 联网搜索、多格式文档解析、拍照识图、语音输入等功能。推出模型开放平台,启动繁星计划布局生态:推出模型开放平台,启动繁星计划布局生态:阶跃星辰开放平台目前已上线,2024 年 7 月启动繁星计划,寻找多模态优秀初创企业
38、、团队和独立开发者,提供模型、算力及其他配套支持,补充丰富自身应用生态矩阵。信息来源:跃问、冒泡鸭、阶跃星辰及公开信息整理阶跃星辰应用:发力 ToC,繁星计划意图布局应用生态可实现长篇网页、复杂文档理解及总结理解方面:理解方面:目前已支持拍照识图、语音输入、pdf、doc/docx、excel、csv、png、jpg 等多格式文档解析。生成方面:生成方面:可以快速完成内容创作、逻辑推理、数据分析等任务。功能方面:功能方面:优化了联网搜索、文档解析、推理速度等性能,最新推出浏览器插件。可实现拍照问答、图片理解冒泡鸭网页端用户在冒泡鸭上可以根据自身偏好打造智能体和剧情。冒泡鸭支持用户自定义智能体的
39、形象、个性、声音、记忆、背景经历等。目 前 优 秀 案 例 包 括 胃 之 书 APP、野猫子工作室融资进展神秘,资方选择审慎:融资进展神秘,资方选择审慎:成立至今未正式披露融资情况,据传仅在 2023 年 11 月完成过一轮融资,投资方或包括红杉中国、启明创投、五源资本,据量子位报道,2024 年 6 月阶跃星辰正在接洽新一轮估值 20 亿美元的新融资,阿里巴巴在投资机构名单中。研发实力突出,人才引力强,据传背景深厚研发实力突出,人才引力强,据传背景深厚:有深厚研发技术积淀,数据算力经验丰富,CEO 技术强,有大团队经验,核心团队聚集来自微软、谷歌、字节、腾讯、旷视等公司相关人才,成立短短一
40、年,规模已达 150 人,先后吸引多位行业大牛加入。据传有著名基金管理合伙人、独角兽公司创始人、微软华人大佬等支持。信息来源:阶跃星辰及公开信息整理阶跃星辰融资&团队:团队聚集学术大牛,大模型相关经验丰富朱亦博朱亦博系统负责人系统负责人毕业于美国加州大学圣芭芭拉分校曾任微软研究院研究员,曾任职字节跳动,负责公司 AI 基础设施与基础 AI 框架,积累了万卡集群的搭建经验,曾任 谷歌高级主管,直接支持 Anthropic段楠段楠天津大学博士、中国科学技术大学、西安交通大学兼职博导,天津大学兼职教授曾任微软亚洲研究院MSRA资深首席研究员,自然语言计算团队研究经理,主要从事自然语言处理、多模态智能
41、、代码智能、机器推理等研究,多项研究成果成功应用到微软AI产品中,担任微软 NWA 系列模型家族项目研究组长和导师谷歌学术被引用次数逼近 1.9 万,与 CEO 姜大昕合著过 44 篇论文俞刚俞刚主任研究员主任研究员山东大学本科,上海交通大学计算机硕士,南洋理工大学博士曾任腾讯担任研究总监,旷视 Detection 组长,负责检测、分割、跟踪、骨架、动作行为等方面的研究以及算法落地工作,后在腾讯 PCG 光影研究室从事 CV 相关算法及技术研究张祥雨张祥雨西安交通大学与微软亚洲研究院博士生联合培养项目,师从孙剑和何恺明,博士学位曾在微软亚洲研究院工作,期间与何恺明、孙剑、任少卿共同完成了著名的
42、 ResNet,负责底层框架和编码,2016 获得 CVPR 最佳论文奖,2023 未来科学大奖“数学与计算机科学奖”,谷歌学术被引用数已超 23 万曾在旷视工作,与周昕宇共同完成移动端高效卷积神经网络 ShuffleNet姜大昕姜大昕创始人、创始人、CEOCEO纽约布法罗州纽约州立大学计算机科学博士,南洋理工大学担任助理教授在机器学习、数据挖掘、自然语言处理、生物信息等领域有丰富经验前微软全球副总裁、微软亚洲互联网工程院 STCA 首席科学家,在微软期间主导多个人工智能项目,曾为 Microsoft 365、Azure、智能语音助手 Cortana 等核心产品提供关键技术支持焦斌星焦斌星数据
43、负责人数据负责人中科大和 MSRA 联合培养博士微软必应引擎核心搜索团队前负责人,负责利用数据挖掘和 NLP 算法优化索引和搜索质量曾开发全球高质量站点的自动挖掘算法并用于索引和排序开源模型生态建设表现突出:开源模型生态建设表现突出:百川智能成立于 2023 年 4 月,同年 6 月发布国内第一款开源模型,同年 8 月首批通过了生成式人工智能备案,是名单中最年轻的公司;百川大模型支持 LLAMA 热插拔,兼容及可拓展性好,开源后下载量领先,累计下载超 700 万次。搜索引擎技术基因,先天优势:搜索引擎技术基因,先天优势:自 2023 年 4 月 10 日成立以来,持续迭代基座大模型,最新一代基
44、座超千亿参数大模型 Baichuan 4 在 SuperCLUE 评测中处于国内大模型第一梯队,在知识百科、长文本、生成创作等文科类中文任务方面,表现优于国外大模型。信息来源:百川智能、hugging face及公开信息整理百川智能模型:开源生态突出,模型矩阵全面2023.042023.04百川智能成立2022024.014.01发布超千亿参数大语言模型 Baichuan 32022023.093.09发布 Baichuan2 大模型,开放 API 接口202023.0823.08发布 530 亿参数模型,同步启动千亿参数模型训练2022024.054.05发布 Baichuan 4,并推出智
45、能助手应用百小应2022024.074.07联合天津大学推出 Sibyl System Agent 框架,GAIA 排名第一202023.0623.06推出 70 亿参数大模型 Baichuan-7B202023.0723.07推出 130 亿参数大模型 Baichuan-13BBaichuan 开源模型 huggingface 8 月月下载量百川智能 Baichuan2 系列开源模型在开放社区公开累计下载量已经突破 700 万次,最新 hugging face 月下载量超 6 万次。开源模型下载量百川智能 Baichuan4 在 MMMU、MMBench-EN、CMMMU等多个国际主流 Be
46、nchmark 上成绩接近 GPT4V。ToC 布局生产力应用,发力 AI 生命医疗方向:百川智能于 2024 年 5 月发布了 ToC 生产力助手百小应,主打多轮搜索能力。另外,还在 2024 WAIC 上发布了 AI 健康顾问应用,具备丰富医学知识,高度拟人,可连续交互并给出诊断建议,百川智能计划在 2025 年实现 L3 级别 AI 医疗。ToB 以 MaaS 平台为业务重心:百川智能在 ToB 方向推出 MaaS(Model as a service)+AaaS(Agent as a service)服务,Maas 为重心,分旗舰版和专业版,AaaS 服务已开启公测,API 调用能力接
47、近 OpenAI。信息来源:百川智能、蝶境内测及公开信息整理百川智能应用:ToC 上线生产力应用,发力 AI 生命医疗等级百川智能划分 AI 医疗水平L5完全自动化健康管理AI 能够管理患者的整个健康旅程,从预防、诊断到治疗,无需人工干预L4高度自动化诊疗AI 可以在大多数常见疾病中独立做出诊断和治疗决策,仅复杂案例需要医生介入L3条件自动化诊疗AI 可以在特定条件下自动推荐治疗方案,但在关键决策时需要医生确认L2多模态辅助AI 可以整合多种数据源(如病历、影像、实验室结果),提供更全面的辅助信息L1辅助诊断AI 可以提供数据分析活图像识别等单一功能的辅助,帮助医生做出更好的决策L0传统医疗医
48、生负责所有的诊断和治疗决策,没有 AI 介入百川智能计划在 2025 年实现 L3 级别 AI 医疗发力 AI 医疗ToB业务ToB云服务AI 法律AI 教育AI 医疗AI 供应链百小应主打多轮搜索功能,相比单轮搜索,在市场调研、产业分析等复杂场景下,能更有效地获取专业深度信息,搜索结果可结构化呈现,还能实现网页链接、PDF、word 文档长文理解分析。百小应 APP 端页面已完成已完成 A A 轮融资,金额大、估值高:轮融资,金额大、估值高:截至 2024 年 7 月,百川智能已完成 A 轮融资,7 月最新一轮融资规模 50 亿人民币,资方包括阿里巴巴、腾讯投资、小米集团等机构以及北京市人工
49、智能产业投资基金、上海人工智能产业投资基金、深创投等国资基金。目前已经以 200 亿估值开启 B 轮融资。王小川带队,携搜狗核心班底再创业:王小川带队,携搜狗核心班底再创业:作为搜狗前任 CEO,王小川是大模型创业六小强中唯一具备创业并上市经历的创始人,他带领搜狗核心班底创立百川智能,团队技术实力不容小觑,由强系统性工程经验人才,语言模型认知优势的研发人员两部分组成。信息来源:百川智能及公开信息整理百川智能融资&团队:A 轮融资已完成,搜狗核心班底再创业团队成员时间轮次金额估值投资机构2024.07A50 亿人民币-三七互娱、中金资本、亚投资本、信雅达、卓源亚洲、好未来、小米集团、慕华资本、深
50、创投、红点中国、腾讯投资、阿里巴巴、顺为资本、上海人工智能产业股权投资基金合伙企业、临港科创投、北京市人工智能产业投资基金、顺禧基金、中贝通信集团股份有限公司2023.10A3.5 亿美元19 亿美元阿里巴巴、腾讯投资、小米集团、心资本、愉悦资本、金山软件、顺为资本、好未来、清华控股、深创投、红点中国、慕华科创、淡策资本、卓源亚洲、众为资本2023.04天使轮5000 万-王小川王小川王小川创始人、创始人、CEOCEO清华大学计算机科学与技术专业,拥有工学学士、工学硕士、工程博士及 EMBA 学位与清华大学共建天工智能计算研究院,任联席院长曾任搜狗公司 CEO、董事、搜狐高级副总裁兼 CTO,
51、带领搜狗在美国纽交所上市焦可焦可联合创始人、产品负责人联合创始人、产品负责人清华大学计算机系本科,中科院计算所硕士曾任智融集团创始人兼 CEO、百度高级产品经理茹立云茹立云联合创始人、联合创始人、运营负责人运营负责人清华大学计算机系博士,浙江省高考状元,清华大学天工智能研究院副院长 曾任搜狗公司 COO,负责运营及搜索事业部,人工智能教育公司葡萄智学创始人兼 CEO洪涛洪涛联合创始人、联合创始人、商业负责人商业负责人清华大学电子工程系本科,长江商学院 EMBA曾任搜狗科技 CMO、腾讯 PCG 商业化 GM信息来源:零一万物、零一万物大模型开放平台及公开信息整理零一万物模型:AI Infra
52、技术领先,模型开闭源并重开源模型矩阵Yi-1.5 系列模型大幅提高了数学逻辑及代码能力,在多个国际中英文主流数据集中表现优于同量级模型。零一万物最新闭源模型 Yi-Large 在 HumanEval、MATH、MT-Bench 等数据集上,成 绩 超 越 GPT-4。2023.052023.05零一万物成立2022024.064.06Yi-Large 系列大模型正式登陆阿里云百炼平台2022024.014.01发布开源多模态语言大模型 Yi-VL 202024.0324.03发布开源 Yi-9B 大模型,并发布 Yi 大模型 API 开放平台202023.0723.07李开复官宣零一万物,官网
53、同步上线202023.1123.11发布首款 340 亿参数预训练大模型 Yi-34B2022024.054.05发布千亿参数闭源大模型Yi-Large,升级开源系列模型2022024.094.09发布系列开源模型 Yi-Coder,支持 52 种主要编程语言Yi-1.5-9B&6B chat 模型在多个国际主流测试集成绩Yi-Large千亿参数基座模型Yi-Large-RAGRAG 检索增强Yi-Large-Turbo高性能高性价比Yi-Medium中型尺寸升级微调Yi-Medium-200K超长文本窗口Yi-Spark 小型精悍轻量极速闭源模型矩阵Yi-Large 多项国际 SOTA 成绩
54、领先领先 AI Infra AI Infra 技术节约训练成本:技术节约训练成本:构建数千卡 GPU 集群进行训练、调优和推理,提高数据有效参数量,以及使用的高质量数据的密度,以构建连续、可控、科学化的训练能力。目前,零一万物具备全栈 Al lnfra 能力,在国内率先端到端实现全球先进 FP8 训练框架。模型取得国际模型取得国际 SOTA SOTA,闭源开源并重:,闭源开源并重:2023 年 11 月首次发布 Yi 系列大模型,涵盖闭源和开源。2024 年 5 月闭源模型 Yi-Large 在测试集 LMSYS 中成绩位列国产第一,以千亿参数尺寸追齐硅谷巨头万亿模型。开源矩阵目前已经推出多模
55、态模型、代码模型及通用模型等。零一万物致力于通过自主创新架构加速追赶 OpenAI。Yi-1.5-6B/9B/34B开源基座模型Yi-1.5-6B/9B/34B-Chat消费级显卡可部署Yi-VL-6B/34B多轮文本/图像对话Yi-Coder-1.5B/9B 开源代码大语言模型大脑长短记忆智能对话知识库多语言形象形象复制口型对齐表情生成动作训练声音多国语言高度还原情感表达风格迁移数字人基础大模型多模态底座电商话术大模型角色大模型直播声音大模型语言模型视觉理解文生图声音模型文生视频多模态协同训练AI 伴侣IP 形象本地电商直播办公会议媒体营销应用场景信息来源:零一万物及公开信息整理数字人解决方
56、案零一万物应用:BG 端多种解决方案,探索 Make AI Work电商数字人解决方案部署快、成本低:解决方案围绕品牌连锁,主打极简直播和短视频解决方案,通过构建专属电商语言和声音大模型,实现高质量话术和互动内容。全行业 ToB 解决方案“一横一纵”打法:ToB 模型解决方案发挥基座模型横向泛化能力,辅以 SFT 监督学习能力纵向做深做透各行业,提供标准化、垂直精细化全行业 ToB 整体解决方案,目前落地零售、医疗、教育等领域,涉及 AI 搜索、AI 生产力工具、AI 智能巡检等场景。AI Infra 赋能 BG 端客户:面向 BG 端客户协助政企搭建大模型算力与服务平台设施,加速大模型低成本
57、端到端落地,赋能企业群体、政务服务。全行业ToB解决方案ToB 合作伙伴AI 翻译智能巡检 AI 字段捷径AI 智能助手落地场景创始团队信息来源:零一万物及公开信息整理零一万物融资&团队:半年就成独角兽,李开复亲自带队时间轮次金额估值投资机构2024/08-数亿美元-某国际战投东南亚财团2023/11天使-超 10 亿美元阿里云2023/05天使-创新工场创新创新工场孵化工场孵化,阿里云等多家头部机构押注:作为创新工场塔尖孵化的第七家公司,零一万物可谓“含着金汤匙出生”,估值狂奔半年就成独角兽。2024年8月,据媒体报道,零一万物已获新一轮数亿美元融资,融资参与方包括某国际战投、东南亚财团等多
58、家机构。七大技术模块招揽顶尖人才领头:七大技术模块招揽顶尖人才领头:零一万物将研发拆解为七大模块技术路线图,各模块均招募顶级科学家和工程师,集合全球最先进的大模型技术认知和论文实践,搭建国际化人才团队。李开复创始人CEO 卡内基梅隆大学计算机博士 曾任谷歌全球副总裁兼大中华区总裁 曾任微软公司副总裁,创立微软亚洲研究院 曾任苹果公司副总裁戴宗宏戴宗宏联合联合创始人创始人 曾任华为云 AI CTO、华为云技术创新部部长 阿里巴巴达摩院前 AI Infra 总监 曾领导多家主体 AI infra 部门,支持中国三大 100B+大型 LLM 模型训练祁瑞峰祁瑞峰联合联合创始人创始人 曾为 Aibee
59、 联合创始人 曾任美菜网高级副总裁 曾任史宾沙 Spencer Stuart 大中华区科技互联网行业负责人 曾任甲骨文、微软和 SAP 前业务高管马杰马杰联合联合创始人创始人 曾任百度安全、IT 和元宇宙副总裁 曾为基于 SaaS 的云安全初创公司“安全宝”创始人兼 CEO,后被百度收购 曾任瑞星杀毒软件研发主管创业六小强共同点:转动关键飞轮融资优势支撑模型持续迭代模型开发能力是融资决策核心要素强大模型能力提升应用使用体验海量真实应用数据反哺模型迭代充足粮草助力应用更快落地增长商业化探索提升资本增值想象空间创业六小强 AGI 生态位智谱 AI月之暗面MiniMax百川智能零一万物阶跃星辰市场估
60、值市场估值综合实力综合实力AGI 生态位信息来源:DeepSeek、暗涌采访及公开信息整理DeepSeek模型:自研 SOTA 开源 MoE,海外技术传播效果好脱胎于量化私募机构,自带万卡:脱胎于量化私募机构,自带万卡:DeepSeek 深度求索脱胎于国内知名量化私募机构幻方量化,幻方量化以人工智能技术进行量化投资而闻名,早年储备万卡算力,不仅如此,幻方量化可为深度求索提供每年几亿的资金支持,在算力和财力上都为深度求索的诞生打下独特基础。架构创新,模型开源:架构创新,模型开源:DeepSeek 坚持进行零到一前沿架构创新和模型开源战略,据创始人表示这源于公司的理想主义基因和技术普惠信仰。开源模
61、型矩阵在 DeepSeek 内部中文评测中,DeepSeek-V2.5 和 GPT-4o mini、ChatGPT-4o-latest 的对战胜率(裁判为 GPT-4o)相较于 DeepSeek-V2-0628 均有明显提升。20152015幻方量化成立2022024.064.06深度求索发布 DeepSeek-VL 多模态大模型2022023.073.07深度求索成立20202 21 1幻方 AI 投入 10 亿建设萤火二号20201919幻方量化资金规模超 100 亿,成立幻方 AI20202020幻方 AI 投入 2 亿建设的千卡萤火一号超级计算机正式运行2022022.112.11深度
62、求索发布开源代码大模型DeepSeek Coder2024.052024.05深度求索开源国内首个 MoE 大模型 DeepSeekMoE2022024.054.05深度求索发布 DeepSeek-V2 模型,模型降价引发价格战 架构创新类型模型参数架构通用基座+代码DeepSeek-V2.5-MoEMoEDeepSeek-MoE8B/16BMoE多模态DeepSeek-VL7B/1.3B混合视觉编码器数学推理DeepSeek-Math7BMoE数学定理证明DeepSeek-Prover7BMoE“DeepSeek V2 论文可能是今年最好的一篇。”SemiAnalysis 首席分析师“Dee
63、pSeek 论文充满惊人智慧。”OpenAI 前员工 Andrew Carr“这种强烈的反响源自架构层面的创新,是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。”多位行业人士表示LMSYS 大模型竞技场结果信息来源:DeepSeek 及公开信息整理DeepSeek应用:价格战始作俑者,代码生成能力受关注大厂之外罕见万卡持有者,打响大模型价格战:大厂之外罕见万卡持有者,打响大模型价格战:值得注意的是,DeepSeek 的降价不靠烧钱靠模型性能,2024 年 5 月,DeepSeek 发布开源模型 DeepSeek V2 采用先进 MoE 稀疏架构将模型 API 调用成本降至 1 元/百万
64、tokens,随后字节、腾讯、百度、阿里等大厂纷纷跟进,打响国产大模型价格战。不过早做应用,代码生成能力引起关注:不过早做应用,代码生成能力引起关注:DeepSeek 目前仅发布网页端 DeepSeek V2.5 通用对话助手、DeepSeek V2.5 代码助手面向公众开放模型能力免费使用,不急于发布 ToC 产品,追求引领技术前沿,希望与应用创业者共创生态。目前网页端助手的代码能力在行业内引起讨论受到关注。2 0 2 4 年 5 月,DeepSeek 发布 V2 开源模型,先进架构大幅降低 API 成本至仅 1 元/百万 tokens,是当时 GPT-4 Turbo 的七十分之一。随后字节
65、、腾讯、百度、阿里等大厂也纷纷降价,中国大模型价格战由此触发,DeepSeek 也因此被冠以“AI界拼多多”称号。DeepSeek 5 月发布的彼时各大模型 API 价格对比DeepSeek 同名网页端主要作为免费调用模型能力的公开入口存在,没有推出 APP 和小程序,也没有 AI 智能助手类产品的很多优化。通用对话和代码助手两个功能分别对应 DeepSeek 的通用模型 DeepSeek-V2.5 和代码模型 DeepSeek-Coder-V2.5,通用模型的数学能力和代码模型的编程能力在用户中被讨论和使用较多。DeepSeek 同名应用网页端界面信息来源:DeepSeek、暗涌采访及公开信
66、息整理DeepSeek团队:量化私募出身,团队秘而不宣脱胎于幻方量化,脱胎于幻方量化,团队保持神秘:团队保持神秘:DeepSeek-V2 模型发布后行业内对于其研发团队构成有诸多猜测,从历史来看,DeepSeek 脱胎于幻方量化,或继承其人才基因,而成立后新吸纳人才中据称既没有硅谷海归也没有高管大佬,而是以本土应届和毕业一两年“没有经验但有潜能”的年轻人才为主,具体人员名单仍保持神秘。组织架构或利好创新:组织架构或利好创新:ChatGPT 没有发生在巨头公司,而是诞生于 OpenAI,这让很多人相信 AI 时代的创新需要全新的组织架构,DeepSeek 既不同于大厂也不同于纯除初创公司的组织架
67、构也许有利于创新。据创始人梁文锋表示,“在公司内部,每位员工都可以调动算力和人力,无需审批,同时因为不存在层级和跨部门,员工也可以灵活调用所有人,只要对方也有兴趣。”权限自由据创始人梁文锋表示,不同于很多模型公司高薪招聘海外及巨头公司大模型人才,“V2 模型的研发团队没有海归,都是本土青年人才,目前 AI 前 50 名顶尖人才也许不在中国,但 DeepSeek 或许可以靠自己打造这样的人才”。不拘履历据创始人梁文锋表示,“DeepSeek 全是自下而上。一般不前置分工,而是自然分工。相信每个员工自带想法,无需push。探索过程中遇到问题,自己会拉人讨论。当一个idea显示出潜力时,也会自上而下
68、地调配资源。”松散管理梁文锋梁文锋创始人创始人CEOCEO 浙江大学本科、硕士,人工智能专业 创立幻方量化,2016 年首次上线运行 AI 策略,到 2017 年底时,投资策略全面 AI 化,2019 年资金规模破百亿,2021 年破千亿,后稳居国内量化私募“四巨头”创始人幻方量化幻方量化投资团队投资团队 奥林匹克数学、物理、信息学金银牌得主 ACM金牌得主 AI领域大牛和领军人物 拓扑学、统计学、运筹学、控制论等学科博士幻方量化人才画像深度求索人才画像深度求索深度求索模型团队模型团队 本土 Top 高校应届毕业生 博士实习生信息来源:面壁智能及公开信息整理面壁智能模型&应用:大模型端侧落地先
69、锋,性能四两拨千斤面 壁 智 能 2024 年 8 月发布最新小钢炮 系 列 模 型 MiniCPM-V 2.6,仅 8B 参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,将端侧AI多模态能力拉升至 GPT-4V 水平。最新端侧开源模型性能20182018面壁智能脱胎于清华大学 NLP 实验室,发布全球首个知识指导的预训练模型 ERNIE2022022 2面壁智能成立,发布生物医学领域大模型 KV-PLM 及可控生成大模型 CPM-320212021与北京智源人工智能研究院联合成立“语言大模型加速技术创新中心”20202020面壁智能成为悟道大模型的首发主力阵容2023.01
70、2023.01面壁智能发布百亿参数多语言大模型 CPM-Bee 登顶 ZeroCLUE2024.052024.05面壁智能发布千亿参数多模态大模型 CPM-Cricket,对标 GPT-3.5 2023.042023.04面壁智能发布 BMTools 开源工具学习平台,完成数千万元的天使轮融资 2024.082024.08面壁智能发布 8B 参数多模态端侧模型 MiniCPM-V 2.6,对标 GPT-4V MiniCPM-V26 多模态性能对比创始人回应抄袭事件端侧端侧“小钢炮小钢炮”性能领先,端云协同探索者:性能领先,端云协同探索者:2024 年苹果开发者大会后端侧模型概念进入主流视野,国
71、外 OpenAI 和苹果等厂商纷纷发布端侧模型,面壁智能在国内很早聚焦端侧,最新开源模型性能达国际水平,探索端云大小模型协同推理技术,实现模型精细化“降本增效”,在 AI 端侧设备可预见普及后,端侧模型前景乐观。被斯坦福团队抄袭,意外走红国际:被斯坦福团队抄袭,意外走红国际:2024 年 6 月,三位美国斯坦福大学学生团队承认开源模型 Llama3-V 抄袭面壁智能开源模型 MiniCPM-Llama3-V 2.5,两者拥有几乎完全相同的模型架构与代码,面壁智能因此意外在国际走红。面壁智能 CEO 李大海在朋友圈回应抄袭事件信息来源:面壁智能及公开信息整理面壁智能融资&团队:脱胎清华,知乎布局
72、,华为投资清华清华+知乎知乎研发研发团团队队:面壁智能名称来源于著名科幻小说“三体”,团队脱胎于清华大学 NLP 实验室,聚集杰青、欧洲科学院外籍院士、谷歌前员工、智谱 AI 团队前成员等行业优秀人才,CEO 李大海为知乎合伙人、CTO。已进行天使轮及已进行天使轮及 A A 轮两轮融资:轮两轮融资:早期天使轮获知乎及智谱 AI 投资,A 轮知乎加注,春华创投、华为哈勃、北京人工智能产业投资基金是新加资方。融资情况时间轮次金额估值投资机构2024/04A轮-数亿元春华创投、华为哈勃、北京市人工智能产业投资基金、知乎2023/04天使轮-数亿元知乎、智谱华章刘知远刘知远联创联创首席科学家首席科学家
73、清华大学清华大学计算机系副教授,清华自然语言处理与社会人文计算实验室 THUNLP 成员,清华人工智能研究院基础模型研究中心副主任,智源青年科学家研究方向自然语言处理、知识图谱和社会计算,在著名期刊和会议发表论文 200 余篇,谷歌学术被引用超 3.1 万次曾获教育部自然科学一等奖,入选国家青年人才计划,麻省理工科技评论中国区 35 岁以下科技创新 35 人李大海李大海创始人创始人CEOCEO北京大学数学系硕士曾为谷歌中国创始员工,云云网工程总监,豌豆荚搜索技术负责人,是连续12年创业者曾任知乎合伙人、CTO,负责整体技术体系搭建,分管社区治理和用户体验中心,从零开始为知乎搭建搜索和推荐业务,
74、知乎 AI 智能社区发起人,帮助知乎实现从百万到亿级的跨越研究方向人工智能和大模型应用曾国洋曾国洋C CT TO O8 岁开始学习编程,高中竞赛金牌保送到清华大学,大二加入清华 NLP 实验室,师从刘知远高三曾在旷视实习,开始接触 AI 领域曾为智源悟道文源中文预训练模型团队骨干成员,研究方向计算机视觉和深度学习作为联合发起人创建 OpenBMB 开源社区,是模型训练加速和推理加速 BMTrain、BMInf 的主要作者之一国内巨头玩家格局总览信息来源:百度、百度 2024 Q2 财报及公开信息整理百度:国产 AI 第一重镇,中文大模型头号玩家起步最起步最早,早,布局完整,布局完整,模型模型全
75、面全面:百度是国内互联网大厂中最早布局大模型的玩家之一,截至 2024 年,百度已建立百度大脑及百度智能云千帆大模型平台,推出了 ERNIE、VIMER 等系列模型并布局文小言、文心一格等基于大模型能力的 AI 应用。2024 2024 年年 Q2 Q2 大模型落地成绩亮眼:大模型落地成绩亮眼:据百度财报显示,截至 2024 年 Q2,文心大模型日调用量超 6 亿次,近半年来增长 10 倍,文心大模型日均 tokens 使用量超 1 万亿,飞桨文心社区开发者数量已达 1465 万。公开数据显示,百度智能云千帆大模型平台已累计服务 15 万客户,帮助用户累计精调 2.1 万个大模型。文心大模型矩
76、阵业务架构智能云依据 IDC 报告,2023 年百度智能云在中国 AI 公有云服务市场份额第一昆仑芯高速互联、AI 服务器、GPU 虚拟化、弹性训练飞桨底座平台数据标注、部署运行、模型开发、知识生产文心大模型行业大模型、NLP 大模型、视觉大模型、跨模态大模型、生物计算大模型行业、应用、社区智慧能源、智能制造、智慧金融、智慧城市、文小言、文心一格、旸谷社区日均模型调用量6 6 亿亿+日均处理tokens1 1 万万亿亿+截至 2024Q2 文心大模型:文心大模型:行业大模型浦发百度文心航天百度文心国网百度文心深燃百度文心吉利百度文心泰康百度文心TCL百度文心电影频道百度文心冰城百度文心视觉大模
77、型OCR 图像表征学习 VIMER-StructTexT多任务视觉表征学习 VIMER-UFO视觉处理多任务学习 VIMER-TCIR自监督视觉表征学习 VIMER-CAE跨模态大模型文档智能 ERNIE-Layout文图生成 ERNIE-ViLG视觉语言 ERNIE-ViL视觉语言 ERNIE-SAT生物计算大模型化合物表征学习 HelixGEM蛋白质结构预测 HelixFold单序列蛋白质结构预测 HelixFold-Single文心一言 ERNIE Bot对话 PLATO跨语言 ERNIE-M搜索 ERNIE-Search代码 ERNIE-CodeNLP大模型语言理解与生成 ERNIEE
78、RNIE 3.0鹏城-百度文心ERNIE 3.5ERNIE 4.02024发布文心大模型 4.0 工具版及 4.0 Turbo2023发布 AI 应用文心一言(现文小言)及多模态大模型和百度智能云千帆大模型平台2019发布文心大模型 1.0 及 2.02016 发布百度大脑及深度学习框架 飞桨 PaddlePaddle2021发布知识增强百亿参数文心大模型 3.02023发布文心大模型 4.0名称行业功能定位通义听悟语音识别生产力助手,提供工作学习语音转写通义晓蜜智能客服为企业提供更高效的客服解决方案通义智文文本理解帮助用户高效地阅读并理解各类文本通义灵码代码编程为开发者提供代码生成、补全等功
79、能通义万相图片生成实现图像、视频等多模态理解生成通义星尘角色扮演实现娱乐社交场景的个性化虚拟角色创建通义法睿法律服务提供法律咨询、合同审查等服务通义仁心医疗服务为用户提供健康管理、疾病预防建议通义点金金融服务为金融行业提供投资研究、风险分析服务信息来源:阿里巴巴及公开信息整理阿里巴巴:投资与自研并举,开源模型代表,借助云优势推进 MaaS投资与自研并举,坚持开源:投资与自研并举,坚持开源:在自研大模型的巨头玩家中,阿里是投资最多创业“同行”的一家,截至 2024 年 9 月,阿里已经投资大模型创业六小强中的五家,据消息阿里对最后一家亦有投资意向。另外,阿里也是大厂里代表性的模型开源玩家,通义千
80、问系列开源模型在全球深受开发者群体欢迎,总下载量已突破 2000 万次。MaaS MaaS 布局早,服务全面布局早,服务全面:阿里云早在 2022 年开始布局 MaaS 业务,并搭建了一套以 AI 模型为核心的云计算技术和服务架构,积累了丰富的大模型研发经验、工具和平台,这套能力全部向大模型初创企业和开发者开放,提供包括模型训练、推理、部署、精调、测评、产品化落地等的全方位服务。20202020启动中文多模态预训练模型 M6 项目,同年推出 3 亿参数基础模型20202222 发布通义系列大模型,推动 AI 向通用智能进化202021.0521.05发布万亿参数模型并投入使用,可实现文生图20
81、2021.0121.01发布十亿参数规模模型202023.0423.04发布通义千问大模型,可实现多轮多语言对话、多模理解、逻辑推理202024.0524.05发布通义千问最新 2.5 版本202023.1023.10发布千亿参数通义千问 2.0 大模型,及 8 大行业模型和应用开发平台阿里云百炼等底座高质量数据集领先算法框架丰富行业知识与生态大模型矩阵通义千问通义千问-Turbo通义千问-Plus通义千问-Max通义千问-Long通义千问-VL-Plus通义千问-VL-Max通义千问开源Qwen2.5Qwen2-mathQwen1.5QwenQwen-1.8B-长文本Qwen-1.8BQwe
82、n-VL-V1Qwen-VL-Chat-V1开发者社区ModelScope模搭社区LlamaIndexHugging Face三方及行业大模型Llama 大语言模型Llama3-8B百川开源大语言模型ChatGLM 开源大语言模型Llama3-70BLlama3-7BStableDiffusion 文生图模型Llama2-13B信息来源:腾讯及公开信息整理腾讯:全链路自研大模型,ToC 应用背靠微信,ToB 落地内外并行全链路自研,模型训练紧跟前沿:全链路自研,模型训练紧跟前沿:腾讯选择了一条基于自主体系的全链路自研道路,从零开始启动预训练,从 AI 基础设施到机器学习框架,再到模型算法实现全
83、链路闭环。2023 年 9 月,腾讯发布超千亿参数混元大模型,是行业内较早采用 MoE 及 DiT 等先进架构的大模型。ToC ToC 背靠微信,背靠微信,ToB ToB 对内赋能对外开放对内赋能对外开放:ToC 应用元宝基于混元大模型能力,最大特色是深度整合微信生态资源,特别是微信公众号这一内容平台。而在 ToB 方面,混元大模型目前已成功应用于广告、搜索和对话等 50 多个腾讯内部业务和产品,并已通过腾讯云服务对外开放,助力全行业多种应用场景。元宝AI 聊天助手元器开发平台面向普通消费者的 AI 智能助手应用,提供 AI 搜索、总结、写作等日常应用功能。面向企业或开发者,提供一站式 AI
84、智能体创作与分发平台,支持企业或开发者根据自身需求开发特定的 AI 应用。202022.0422.04首次对外发布混元大模型研发进展,混元集 CV、NLP 和多模态理解能力于一体2024.052024.05发布基于混元大模型能力的 C 端助手 APP“腾讯元宝”2023.2023.0909腾讯混元大模型正式亮相,并通过腾讯云对外开放202022.1222.12发布国内首个低成本、可落地的 NLP 万亿参数大模型混元 NLP2022022 2.0505混元大模型在 CLUE 三个榜单同时登顶2023.2023.1010混元大模型能力升级,并发布自研混元文生图模型2024.092024.09发布新
85、一代大模型混元 Turbo底座AIGC 云存储HCC 高性能算力集群星脉高性能网络云 TI 平台TI-ONE精调数据准备/精调训练/模型评测验证TI-OCR智能反馈误识别/水印识别准确率达 95%TI-AOI高速迭代/超复杂场景 0 漏检三大引擎知识引擎图像创作引擎视频创作引擎应用场景风险管控研发提效智能营销知识管理智能客服内容创意办公协同数据分析大模型矩阵混元大模型混元 turbo文生文API/专属模型/精调模型混元 DiT文生图混元 vision图生文推理效率提升 100%,成本降低 50%中文原生 DiT 文生图开源模型支持最高 7K 分辨率主流开源模型行业大模型金融大模型传媒大模型文旅
86、大模型教育大模型信息来源:华为及公开信息整理华为:AI 算力优势明显,传统行业解决方案广受认可算力基础设施实力强,算力基础设施实力强,提供提供英伟达替代方案:英伟达替代方案:华为构建以昇腾为基础的 AI 算力底座和 AI 云服务,布局华为云 CloudLake 和 CloudPond 边缘云平台,构建云-网-边-端协同的 AI-native 算力平台,并提供异构计算架构 CANN、全场景 AI 框架昇思 MindSpore,AI 开发生产线 ModelArts 等,提供英伟达 AI 算力服务国产替代方案。盘古大模型盘古大模型 5.0 5.0 专注专注 ToB ToB,赋能行业,赋能行业:盘古大
87、模型 5.0 分别有 E、P、U、S 四级可选,对应从端侧到跨领域复杂任务的不同场景,及文本、视觉、可见光、红外等不同类型数据处理能力,同时大幅度提升复杂任务规划能力。目前盘古大模型已经进入到中国 30+行业,400+应用场景,包括汽车、交通、气候、重工业等。底座层超节点互联网络、昇腾算力集群、高性能存储模型层盘古大模型、生态大模型场景层AI for Business、AI for Data、AI for IT生态架构盘古大模型矩阵模型矩阵模型模型参数特点Pangu E(Embedded)十亿适用端侧手机、PC 场景Pangu P(Professional)百亿适用低时延、高效率推理Pangu
88、 U(Ultra)千亿处理复杂推理任务Pangu S(Super)万亿处理跨领域多任务X 个 L2细分场景大模型皮带质检PCBA 缺陷识别电力缺陷识别案件关键词抽取电商情感分析多轮对话企业财务异常检测空气质量检测工业参数检测时尚版权保护时尚辅助设计图文搜索短临气象预报近海养殖台风预测智慧育种N 个 L1 行业大模型煤矿英语/小语种生产线质检数字人大脑电力巡检司法金融风控时尚销量预测电商搜索工业耗能参数预测图文搜索气象海浪智慧育种NLP 大模型内容生成/理解CV 大模型分类/分割/检测多模态大模型跨模态搜索/生成/看图说话预测大模型回归/分类/时序预测科学计算大模型分子/金融/气象大模型5 个
89、L0 基础大模型AI 开发生产线 ModelArts昇腾算力底座信息来源:科大讯飞及公开信息整理科大讯飞:国产自主可控代表玩家,云边端软硬件全栈齐备星火大模型星火大模型 V4 V4 全面实现自主、可控、国产全面实现自主、可控、国产:科大讯飞 2024 年 6 月推出最新讯飞星火 V4 大模型能力突出,全面对标 GPT-4o。V4 是在全国产算力平台上训练的大模型,所有算法自主可控,每一行码、每一个数据都由科大讯飞自行编写、清洗。两个一体化布局两个一体化布局,G G 端收紧端收紧 C C 端倾斜,财务指标回暖:端倾斜,财务指标回暖:科大讯飞打出云边端一体化及软硬一体化组合拳,2023 年主动收紧
90、 ToG 业务,向 ToC 业务倾斜,包括学习机在内的相关业务增长迅速,2024 新增相关研发投入超 6.5 亿元,上半年预计“营收毛利双增”,大模型战略短期暂时未带来明显财务回报,公司盈利能力持续承压。软硬一体化讯飞星火大模型业务矩阵云边端一体化细分场景细分场景功能功能定位定位企业服务讯飞星火大模型与企业内部知识库相结合,可实现知识问答、智能营销、会议纪要整理以及公文、公函、通知等固定问答格式自动生成等功能,提高企业运营管理效率,解放生产力智能硬件讯飞星火大模型打破了传统的基于规则的人机交互方式,弥补了机器在知识量和泛化能力方面的不足支持,让手机、电视、VR眼镜等传统的智能硬件,能更好地满足
91、人们日常生活需求。智慧政务讯飞星火大模型与政务结合,通过整合政务知识库,协助政府工作人员在公文写作、会议纪要优化、知识问答等场景,提升办公效率。智慧金融讯飞星火与企业自有知识库结合,可以实现智能问答、智能投顾、营销文案生成等功能,帮助企业实现降本增效,增加营销效果智慧生活讯飞星火大模型为我们的互联网生活提供了诸多便利,如:实时文本翻译、星座咨询、内容创作、知识问答等智慧医疗讯飞星火大模型结合医院自有知识库,通过自助机、虚拟人等方式,为患者提供智能问答和自助流程办理服务,减轻医院导诊人员的负担并提高整体运行效率智慧教育讯飞星火大模型在教育领域的应用,如AI学习机、个性化学习手册等,通过 AI 1
92、 对 1 答疑辅导功能、英语作文批改及润色、理科主观题批改等全新功能,提升教育质量和效率。智慧汽车讯飞星火大模型在智能汽车领域的应用,如智能车载系统,提供智能导航、语音交互、娱乐服务等功能,提升驾驶体验和安全性。+软件硬件星火大模型星火个人空间学习机、翻译机办公本、录音笔智慧黑板+自有硬件行业终端讯飞星火一体机行业解决方案行业大模型云侧边侧端侧202023.0523.05首次发布讯飞星火认知大模型202024.0624.06发布讯飞星火大模型 V4.0,部分能力超越 GPT-4 Turbo2023.102023.10发布讯飞星火认知大模型 V3.0,七大能力持续提升20202222发布讯飞超脑
93、 2030 计划启动星火大模型攻关202023.0823.08发布星火大模型 V2.0 版本,实现代码能力突破及多模态交互能力升级202023.0623.06发布讯飞星火认知大模型 V1.52022024 4.0101发布讯飞星火认知大模型 V3.5,对标 GPT-4 TurboAPP 历史下载量1 1 亿亿 +月活跃用户2600 2600 万万 +APP 智能体总创建量800 800 万万 +豆包聊天助手主力明星应用日均 tokens 使用量1.3 1.3 万亿万亿 +猫箱娱乐陪伴扣子开发平台即梦视频生成星绘图片生成河马爱学教育平台即创电商助手信息来源:字节跳动、IDC 报告及公开信息整理字
94、节跳动:C 端豆包数据领先,B 端火山引擎改写云计算格局入场晚,基础好,模型矩阵全面:入场晚,基础好,模型矩阵全面:字节直到 2023 年 8 月才爆出云雀大模型的消息,直到 2024 年 5 月,其他大模型早已多次迭代后,全新的豆包大模型家族才首次亮相,字节一口气发布了包括通用模型、角色扮演模型、语音模型、文生图模型等九大模型,7 月发布图生图模型,9 月底最新发布视频生成模型及同声传译模型。C C 端豆包端豆包流量流量大,大,B B 端火山引擎改写格局端火山引擎改写格局:2023 年底字节成立 AI 应用部门,推出多款 AI 应用全面覆盖热门 ToC 应用类型,截至 2024 年 8 月,
95、“豆包 AI”APP 端历史下载已破亿,暂列国产同类应用第一。同时,作为市场后来者,B 端的火山引擎平台也积极跟进价格战,以豆包大模型作为核心抓手,打破并改写云计算行业格局。字节是最早跟进大模型价格战的大厂,主力通用模型定价为 0.0008 元/千 Tokens。2024 年 9 月最新发布的视频生成模型在多动作多主体及多镜头能力上有突出表现,目前已开放企业用户邀测。作为云计算市场后来者,火山引擎抓住大模型机遇成功改写行业格局。依据 IDC 最新发布的中国智算服务市场(2023 下半年)跟踪报告,火山引擎已成中国 GenAI IaaS 领域市场份额最大的服务厂商。通用模型pro通用模型lite
96、角色扮演模型语音识别模型语音合成模型声音复刻模型文生图模型Function call模型向量化模型图生图模型视频生成模型同声传译模型信息来源:昆仑万维、昆仑万维 2023 财报、非凡产研及公开信息整理昆仑万维:AI 浪潮最敏锐跨界玩家,产品矩阵全、成绩好确立确立“All in AGI All in AGI 与与 AIGC AIGC”战略,全产业链布局:战略,全产业链布局:昆仑万维 2023 年确立“All in AGI 与 AIGC”战略,全产业链布局算力端、模型端、应用端,构建了 AI 多元业务矩阵,或成此次 AI 浪潮中嗅觉最敏锐的跨界玩家之一。ToC ToC 应用应用形成矩阵、数据形成矩
97、阵、数据表现亮眼:表现亮眼:昆仑万维目前已经初步形成包括聊天助手、搜索引擎、短剧平台、社交平台、游戏在内的 AI 应用矩阵。其中,于 2023 年 8 月推出的天工 APP 截至 2024 年 6 月累积下载量已突破千万,DAU 已破百万,APP 端累计下载量次于豆包 AI,在同类应用赛道数据表现突出。AI应用矩阵业务业务2023 年财报收入游戏业务5.34 亿元广告业务16.5 亿元社交业务14.5 亿元搜索业务11.4 亿元技术收入0.23 亿元其他业务1.12 亿元全产业链布局+2023 年增资控股算力芯片企业艾捷科芯。艾捷科芯专注于 AI 大算力及相关芯片研发。算力端 2023 年 4
98、 月发布“天工 1.0”大模型;2024 年 2 月发布 MoE 大语言模型“天工2.0”;2024年4 月发布“天工3.0”,采用 4000 亿参数的 MoE 架构。模型端基于天工 AI 推出了 AI 写作、AI 绘画、AI 数据分析、AI 伴侣等官方智能体,并在 AI 音乐、AI 视频、AI 游戏、AI 社交等产品方向积极尝试。产品端202024.0424.04发布 4000 亿参数的 MoE 架构语言大模型天工 3.02022024.024.02发布“天工 2.0”,模型能力有较大提升202023.0423.04发布“天工 1.0”大模型202023.0723.07国内上线天工 APP
99、应用,海外上线 AI 陪伴应用 Linky 202024.0424.04发布 AI 音乐生成模型 SkyMusic,开启 AI 游戏 Club Koala 测试 202024.0524.05浏览器 Opera One 及 Opera GX 正式接入端侧AI 大模型 202024.0824.08发布 AI 短剧平台 SkyReels 及 AI 流媒体音乐平台 Melodio天工聊天助手OperaAI 搜索SkyReelsAI 短剧LinkyAI 陪伴Club KoalaAI 游戏MelodioAI 音乐信息来源:快手、可灵 AI 及公开信息整理快手:聚焦视觉及推荐,专注业务耦合,AI 视频应用可
100、灵一鸣惊人大大模型模型矩阵矩阵姗姗来迟姗姗来迟,可灵亮相惊可灵亮相惊艳艳:2024 年 7 月,快手大模型矩阵及视频生成应用可灵首次亮相。快手搭建了以大语言模型、推荐大模型、视觉生成大模型为核心的矩阵,覆盖内容理解、分发、生成,深度服务快手 C 端内容业务生态。其中视频生成大模型可灵是国内第一家对标 Sora 并免费开放使用的产品。专注专注 ToC ToC 业务业务,赋能内容生产及消费:,赋能内容生产及消费:相比于其他互联网大厂,快手 AI 战略更加聚焦和落地,不做基建、不卷参数也不对外商业化,而是围绕赋能现有业务,提升生产力和用户体验进行布局。几款大模型和应用主要聚焦两个方向:内容生产和内容
101、消费。2024 年 7 月快手发布国内首部 AI 短剧山海奇境。模型矩阵可灵 AI 网页端2024 年年初 Sora 引爆互联网后,快手的可灵 AI 是国内第一家发布产品并开放免费试用的视频生成类产品。目前视频生成数量超 700 万,网页端限时免费,可单次生成时长最高可达 2 分钟。(目前可图大模型能力已合并到可灵 AI 网页端)推荐大模型SIM十亿参数大模型,提升用户粘性和活跃度视频生成大模型可灵网页端上线,限时免费,单次可生成 10s 及更长视频图片生成大模型可图目前已开源,使用快手数十亿中文语料训练大语言模型快意自主研发基座大语言模型快手 AI 短剧山海奇境之劈波斩浪国内首部 AI短剧信
102、息来源:昆仑万维、昆仑万维2023财报、非凡产研及公开信息整理商汤科技:AI 技术原生企业实现业务转型,算力模型应用全面布局AI AI 视觉四小龙实现生成式业务转型视觉四小龙实现生成式业务转型:商汤科技起家于 AI1.0 时代的视觉识别技术,生成式 AI 时代来临后积极投身新潮流,发布日日新大模型及系列 BC 端应用,2024 年生成式 AI 业务占比首次超越非生成式业务,成功实现转型。算力模型应用均有布局,业务矩阵算力模型应用均有布局,业务矩阵全:全:商汤早在 2018 年就开始自建算力,2020 年后又建设 AIDC 智算中心及多个计算节点。2024 年 7 月商汤发布最新的 MoE 架构
103、 6000 亿参数原生多模态模型“日日新 SenseNova 5.5”大模型,对标 GPT-4o,目前业务线主要包括智慧商业、智慧城市、智能汽车、智能生活以及 ToC 应用矩阵。总体业务矩阵生成式 AI商量 SenseChat如影格物小浣熊家族琼宇地界拟人日日新大模型Vimi大医秒画智能汽车智能座舱自动驾驶非生成式AI智慧城市智慧商业智慧生活产品产品场景代码小浣熊代码助手办公小浣熊办公助手商量聊天助手Vimi视频生成拟人娱乐陪伴如影数字人生成秒画图像生成琼宇三维重建格物3D 建模大医AI 问诊地界智能遥感生成式AI业务生成式 AI60%智能汽车10%非生成式 AI30%2024 年中期生成式
104、AI21%智能汽车6%非生成式 AI73%2023 年中期2024 年生成式 AI 板块收入近 11 亿元,同比大幅增长 256%,占比首次超越非生成式 AI 业务占比,标志着生成式 AI 现已成为商汤科技主导性业务。202024.0724.07发布最新 MoE 架构 6000 亿参数多模态模型“日日新 SenseNova 5.5”202023.0423.04首次发布商汤日日新 SenseNova 大模型体系,包括 1800 亿参数的语言大模型及生成式 AI 应用 202023.0723.07商汤日日新 SenseNova 大模型体系实现全面升级 202024.0224.02发布“日日新 Se
105、nseNova 4.0”大模型,全面超越 GPT 3.5 202024.0424.04发布“日日新 SenseNova 5.0”大模型,全面对标 GPT-4 Turbo 202023.1223.12发布 AI 代码助手应用“代码小浣熊”202024.0624.06AI 办公助手应用“办公小浣熊”正式上线微信小程序 信息来源:公开信息整理海外玩家格局图谱视觉生成模型通用大模型音频生成模型其他垂类具身智能代码生物医疗AI 搜索AI Agent&数字人数据治理开发平台云服务硬件站在 2024 年三季度的节点上回看,。面对新的大模型 scale 方向、高昂的研发投入、行业价格战的挤压和暂未实现的商业闭
106、环,大模型创业玩家中谁能扛住压力,持续不下牌桌并在新阶段的竞速中突出重围?有:第一,谁能持续推进模型高质量迭代?既要有天才,也需要数据能力。第二,谁能率先实现规模化商业变现?摆脱融资烧钱现状。上述关键指标,会成为外界对玩家综合实力认定的基准,有助于玩家占据有利地位,加剧马太效应。此外,大模型浪潮之所以令人激动着迷,核心还是其所代表的底层基座式机遇,而大模型玩家在完成底层基座通用大模型研发后,:第一,维度,谁拥有或掌握最高质量和规模的数据?第二,对于大模型的竞争力,将开始从性能最强向用户体验最好转移,而用户体验则借助应用、产品和终端触达,卷模型做深,卷开发者生态做广,所谓众行者远,得开发者得决赛
107、入场券。谁能率先建立真正的生态护城河?。微信号:Qbitbot020量子位智库小助手关于量子位智库:关于量子位智库:量子位旗下科技创新产业链接平台。致力于提供前沿科技和技术创新领域产学研体系化研究。面向前沿AI&计算机,生物计算,量子技术及健康医疗等领域最新技术创新进展,提供系统化报告和认知。通过媒体、社群和线下活动,基于专题技术报道及报告、专项交流会等形式,帮助决策者更早掌握创新风向。关于量子位:关于量子位:量子位(QbitAI),专注人工智能领域及前沿科技领域的产业服务平台。全网订阅超过500万用户,在今日头条、知乎、百家号及各大科技信息平台量子位排名均为科技领域TOP10,内容每天可覆盖数百万人工智能、科技领域从业者。