1、计算机行业深度研究报告Grok:xAI引领Agent加速落地Grok:马斯克创立,XAI公司旗下大语言模型。公司核心团队来自业内顶尖机构,曾参与GPT、AlphaStar等项目。Grok系列快速迭代,至2025年7月已发布五个版本:Grok-1、Grok-1.5、Grok-2、Grok-3和Grok-4。Grok-1是开源的纯文本MoE模型,在编码和知识测试中表现出色,优于ChatGPT-3.5。Grok-1.5引入长上下文和图像理解;Grok-2整合实时检索和图像生成,形成多模态闭环,在MATH测试中追平GPT-4o,DocVQA领先;Grok-3显著强化推理能力,在AIME、GPQA等高阶
2、测试及ChatbotArena中超越GPT-4o、Gemini-2Pro、DeepSeekV3、Claude3.5等旗舰模型;最新Grok-4上下文窗口翻倍至256Ktokens,保留多模态并计划新增语音交互及多智能体推理。Agent:多维Agent助力mathbfxAI光速迭代,Grok4领衔AI学术领域。7月10日,xAI发布Grok-4,宣称其综合性能全球领先,尤其在理工科和编程领域达到博士研究水平。该模型在权威的“人类级考试”中以44.4%准确率刷新纪录,并在AIME数学竞赛、SAT、GRE等传统测试中超越OpenAIo3、Gemini2.5Pro和Claude4等顶级模型。Grok-
3、4具备处理超长信息的能力,计算资源投入相比前代巨幅增加,并推出普通版和更强大的会员多智能体协作版“Grok-4Heavy”。它在多场景应用表现出色,如预测体育赛事、生成物理动画、优化商业运营及精准理解社交媒体内容。未来Grok-4将持续优化升级,8月将推出编程专用版本,9月发布多模态智能体版本,10月正式上线视频模型。xAI同时公布了庞大的算力建设蓝图,目标五年内达到相当于5000万块顶级AI芯片的规模以支撑发展。海外大模型引领行业发展,国产大模型多点突破持续追赶。对比分析国内外模型产品,海外方面:OpenAI持续推进GPT-4系列多模态升级,ChatGPTAgent在多项基准测试表现出色,G
4、PT-5已经问世;Anthropic的Claude4系列在软件编码能力上表现卓越。作为Google旗舰,Gemini2.5Pro通过增加深度思考模块、扩展上下文窗口及引入“思维预算”功能。国内方面:截至2025年6月底,我国生成式AI服务与应用备案登记体系规模化落地,累计备案服务439款、登记应用233款。国产模型表现亮眼:KimiK2性能逼近Claude4Opus,在多项评测中领跑国产开源模型,输入成本降至GPT-4.1的三分之一;新版DeepSeek-V3.1通过系统性Post-Training优化,在模型灵活性与推理效率的双重突破,显著提升了工具调用及复杂任务执行性能。DeepSeek-
5、V3.1新版本基于Post-Training优化显著增强Agent能力,大幅提升模型灵活性与思考效率,在工具使用与智能体任务执行上表现突出。;阿里巴巴Qwen3系列持续升级,新推出的Qwen3Coder编程模型在编码基准测试中媲美ClaudeSonnet4,在中文语义和垂直任务中保持优势。国产大模型在性能、成本效率上突破显著增强了国际竞争力。我们认为:1)全球大模型竞争格局,已由mathbfOpenAI一家独大,走向多极竞争格局;2)AI关注应聚焦模型即应用与AI+场景维度。企业级服务:1)办公:金山办公、合合信息、福昕软件、三六零;2)编程:卓易信息、普元信息;3)ERP:金蝶国际、用友网络
6、;4)OA:泛微网络、致远互联;5)多模态:万兴科技、美图公司、虹软科技、当虹科技;6)营销:迈富时、明源云;7)邮箱:彩讯股份等。行业场景:1)金融:大智慧、同花顺、恒生电子、京北方、宇信科技、第四范式、中科金财;2)教育:科大讯飞、视源股份、新开普、佳发教育、鸥玛软件;3)法律:华宇软件、金桥信息;4)医疗:阿里健康、卫宁健康、讯飞医疗科技、晶泰控股;5)电商:焦点科技;6)安全:深信服、三未信安;7)工业:华大九天、中控技术、中望软件、索辰科技、鼎捷数智;8)军用:中科星图、能科科技等。风险提示:技术进展不及预期;模型落地不及预期;商业落地不及预期。华创证券研究所行业基本数据相关研究报告