计算机行业深度研究报告：GrokxAI引领Agent加速落地-250923-在线下载-三个皮匠报告

1、计算机行业深度研究报告Grok:xAI引领Agent加速落地Grok：马斯克创立，XAI公司旗下大语言模型。公司核心团队来自业内顶尖机构，曾参与GPT、AlphaStar等项目。Grok系列快速迭代，至2025年7月已发布五个版本：Grok-1、Grok-1.5、Grok-2、Grok-3和Grok-4。Grok-1是开源的纯文本MoE模型，在编码和知识测试中表现出色，优于ChatGPT-3.5。Grok-1.5引入长上下文和图像理解；Grok-2整合实时检索和图像生成，形成多模态闭环，在MATH测试中追平GPT-4o，DocVQA领先；Grok-3显著强化推理能力，在AIME、GPQA等高阶

2、测试及ChatbotArena中超越GPT-4o、Gemini-2Pro、DeepSeekV3、Claude3.5等旗舰模型；最新Grok-4上下文窗口翻倍至256Ktokens，保留多模态并计划新增语音交互及多智能体推理。Agent:多维Agent助力mathbfxAI光速迭代，Grok4领衔AI学术领域。7月10日，xAI发布Grok-4，宣称其综合性能全球领先，尤其在理工科和编程领域达到博士研究水平。该模型在权威的“人类级考试”中以44.4%准确率刷新纪录，并在AIME数学竞赛、SAT、GRE等传统测试中超越OpenAIo3、Gemini2.5Pro和Claude4等顶级模型。Grok-

3、4具备处理超长信息的能力，计算资源投入相比前代巨幅增加，并推出普通版和更强大的会员多智能体协作版“Grok-4Heavy”。它在多场景应用表现出色，如预测体育赛事、生成物理动画、优化商业运营及精准理解社交媒体内容。未来Grok-4将持续优化升级，8月将推出编程专用版本，9月发布多模态智能体版本，10月正式上线视频模型。xAI同时公布了庞大的算力建设蓝图，目标五年内达到相当于5000万块顶级AI芯片的规模以支撑发展。海外大模型引领行业发展，国产大模型多点突破持续追赶。对比分析国内外模型产品，海外方面：OpenAI持续推进GPT-4系列多模态升级，ChatGPTAgent在多项基准测试表现出色，G

4、PT-5已经问世；Anthropic的Claude4系列在软件编码能力上表现卓越。作为Google旗舰，Gemini2.5Pro通过增加深度思考模块、扩展上下文窗口及引入“思维预算”功能。国内方面：截至2025年6月底，我国生成式AI服务与应用备案登记体系规模化落地，累计备案服务439款、登记应用233款。国产模型表现亮眼：KimiK2性能逼近Claude4Opus,在多项评测中领跑国产开源模型，输入成本降至GPT-4.1的三分之一；新版DeepSeek-V3.1通过系统性Post-Training优化，在模型灵活性与推理效率的双重突破，显著提升了工具调用及复杂任务执行性能。DeepSeek-

5、V3.1新版本基于Post-Training优化显著增强Agent能力，大幅提升模型灵活性与思考效率,在工具使用与智能体任务执行上表现突出。；阿里巴巴Qwen3系列持续升级，新推出的Qwen3Coder编程模型在编码基准测试中媲美ClaudeSonnet4，在中文语义和垂直任务中保持优势。国产大模型在性能、成本效率上突破显著增强了国际竞争力。我们认为：1)全球大模型竞争格局，已由mathbfOpenAI一家独大，走向多极竞争格局；2）AI关注应聚焦模型即应用与AI+场景维度。企业级服务：1）办公：金山办公、合合信息、福昕软件、三六零；2）编程：卓易信息、普元信息；3）ERP：金蝶国际、用友网络

6、；4）OA：泛微网络、致远互联；5）多模态：万兴科技、美图公司、虹软科技、当虹科技；6）营销：迈富时、明源云；7）邮箱：彩讯股份等。行业场景：1）金融：大智慧、同花顺、恒生电子、京北方、宇信科技、第四范式、中科金财；2）教育：科大讯飞、视源股份、新开普、佳发教育、鸥玛软件；3）法律：华宇软件、金桥信息；4）医疗：阿里健康、卫宁健康、讯飞医疗科技、晶泰控股；5）电商：焦点科技；6）安全：深信服、三未信安；7）工业：华大九天、中控技术、中望软件、索辰科技、鼎捷数智；8）军用：中科星图、能科科技等。风险提示：技术进展不及预期；模型落地不及预期；商业落地不及预期。华创证券研究所行业基本数据相关研究报告

计算机行业深度研究报告：GrokxAI引领Agent加速落地-250923（25页）.pdf

计算机行业深度研究报告：GrokxAI引领Agent加速落地-250923（25页）.pdf