1、演讲人:宁啸威01020304050601020304050601良好的开发体验AI 原生加持集成化 随时随地开发,支持跨终端和多场景 开箱即用的开发环境,轻量化、极速性能 良好的 AI 人机交互形态 研发提效,更快的完成编码 辅助决策,提供高质量回答 人人都有一个 AI 搭档 一站式部署能力 研发系统集成 多人协作核心出发点:用 AI 提升用户编码的效率02思考(Thought)规划(Plan)执行(Action)观察(Observation)用户IDE仅保留交互,所有逻辑、数据操作均由Agent Server管控,做到工具的渲染和逻辑分离高效的配置管理和 Prompt 迭代稳定的模型接入和
2、资源调度精准的向量索引和上下文召回03效果、成本、体验:绕不开的三座大山、和是决定 AI Coding 产品成败的“深水区”同样的基座模型,为什么效果有差异?如何在效果不打折扣的前提下,持续优化模型成本?哪些细节决定了用户的编码体验?从基础的交互循环(ReAct)到更具结构化的显式规划(Plan-and-Execute),再到应对复杂任务的多 Agent 系统,伴随着对规划、协调、记忆和反思等核心能力要求的不断提升。现代 Agent 设计呈现出明显的融合趋势,逐步倾向于结合不同范式的优点,并通过功能专门化来应对系统复杂性。先进的和机制正逐渐成为支撑 Agent 实现更高级智能行为的核心基础设施
3、。随着大语言模型能力的提升,应该让模型发挥更大的主导作用,减少固定工程流程的限制,从而提升效果和创造力。Agent v1.0 使用的 Proposal+Plan 这种偏向固定工程流程的方法需要调整;目标是用模型驱动工具的方式,取代较为固定的工程流程。Context engineering is the art and science of filling the context window with just the right information at each step of an agents trajectory 工作流驱动-Tool Call 驱动 主动提供上下文-模型自主决策
4、 大而全的召回结果-精准且必要的信息 CKG 构建:合理的数据索引方式决定了检索召回内容有效性的上限 CKG 存储:存储的方式决定了成本的下限和查询生效/时效性的上限 CKG 检索:通过检索流程优化逼近有效上下文召回准确性的上限(工作记忆)与(持久化记忆)结合会话中产生的信息用户操作产生的信息历史上下文RulesMomentoTodo List用户偏好和历史决策代码风格一致性错误修复与反思多轮对话连贯性自定义规则启发模型能力-约束模型行为Context 赋予模型完成工作所需的知识与工具,Prompt 告诉模型如何正确地思考 构建可恢复的压缩策略 维护上下文 Locality 使用小模型降低 S
5、ummary 成本 工程裁剪处理Input超限在有限的上下文窗口里,保留最大的信息熵 统一的模型接入层 多供应商集成 负载均衡与降级策略 JSON Response:通过 json_repair 库,对未闭合的 JSON 进行修补 流式 Tool Call:通过 Prompt+Prefill 引导模型先输出预期的字段 流式文件写入:Fast Apply 代替 Search-And-Replace利用模型流式输出特性,打造丝滑的产品体验1.让模型返回修改内容,未修改的内容用省略字符返回2.将大模型返回的 增量修改内容+做该修改的解释+原始内容,一起给到 Fast Apply 小模型3.借由 Fa
6、st Apply 小模型来将大模型输出的变更映射到原始代码中,从而实现较为稳定的代码增量变更04全链路追踪AB 实验数据洞察以高效迭代为核心,做好流程简化、Prompt 结构动态化和调优链路建设配置复杂、研发流程繁琐,调优效率低打开一个文件,选中一段代码,基于当前文件和代码进行提问 针对用户当前的代码及选中的内容,评估回复内容是否有对上下文进行针对性的回答 除对代码块本身考察外同样对文本内容进行考察端到端场景的评测手动测试-单机自动测试-容器评测环境持续提升效果置信度05为研