《来也科技:2025来也ADP:文档处理进入智能体时代白皮书(42页).pdf》由会员分享,可在线阅读,更多相关《来也科技:2025来也ADP:文档处理进入智能体时代白皮书(42页).pdf(42页珍藏版)》请在三个皮匠报告上搜索。
1、 来也 ADP:文档处理进入智能体时代 2 .4 1.1 企业流程自动化的“最后一公里”1.2 OCR 和 IDP 的局限性与瓶颈 1.3 大模型和智能体:文档处理的范式转移 .8 2.1 ADP 的定义:一个新范式的诞生 2.2 大模型ADP:操作系统与应用的关系 2.3 ADP 的三大核心特性 .14 3.1 为什么文档处理是企业智能体的理想入口?3.2 从 ADP 到企业智能体:渐进式演进路径 3.3 ADP 适用性自评:您的企业准备好了吗?3.4 组织变革:让人与 AI 协作成为现实 来也 ADP:文档处理进入智能体时代 3 .24 4.1 三层架构设计 4.2 性能指标 4.3 安全
2、合规 4.4 开放集成:与企业 IT 生态无缝融合 .30 5.1 制造业:采购订单处理自动化 5.2 制造业:全球发票处理自动化 5.3 保险行业:理赔文档处理自动化 5.4 银行业:中小企业贷款审核自动化 5.5 实施风险与应对策略 .38 6.1 短期愿景(2025-2026):成为被广泛应用的企业级智能体 6.2 中长期愿景(2027-2030):搭平台、建生态成为企业智能体的基础能力平台之一 .40 来也 ADP:文档处理进入智能体时代 4 想象这样一个场景:某跨国制造企业的财务部门,每月需要处理来自全球数百家供应商的数千张发票。这些发票有着不同的语言和版式。十多名财务人员每天的工作
3、就是逐一打开这些文档,找到关键信息并进行核对,然后手工录入到系统中。企业尝试过多种自动化和 AI 工具,面对供应商不断变化的发票模版,系统常常识别出错,反而增加了人工修正的工作量。这不是个案。企业在自动化和 AI 领域投入了大量资金,却仍然在文档处理这个看似基础的环节上受阻。根据 IDC 研究数据,非结构化数据已占企业数据总量的 80%以上,且正以 60%的复合年均增长率快速膨胀。到 2027 年,全球数据总量将达到 284.30ZB,其中非结构化数据将占到 86.8%。这些非结构化数据的主要载体正是文档,合同、发票、订单、报告等。它们携带着企业运营的关键信息,却因为缺乏有效的处理手段,成为了
4、业务流程自动化的主要瓶颈。为什么传统技术无法满足需求?我们需要深入分析 OCR 和 IDP 各自的局限与瓶颈。OCR(光学字符识别)技术能识别文档中的文字和位置,在标准印刷体文档上识别准确率可达 90%以上。但 OCR 的本质局限在于:只能识别文字,无法理解文档。面对多栏排版、图文混排、无框线表格、跨页表格等复杂版式时,OCR 更是无能为力。IDP(智能文档处理)在 OCR 基础上引入了机器学习、NLP、规则引擎等技术,能够识别文档类型和结构,提取结构化字段。然而,当企业试图大规模推广 IDP 时,很快就遇到了新的瓶颈。来也 ADP:文档处理进入智能体时代 5 首先是数据标注成本高。IDP 训
5、练模型需要大量标注数据:每种文档类型需要几十份到几百份标注样本,所需的标注时间和成本都不可忽视。更糟糕的是,当文档格式变化时,需要进行大量的重新标注。部分使用 IDP 的企业不禁感叹:我们不是在用人工智能,而是在用人工支撑智能。其次是场景碎片化。企业面临的文档场景远比想象中复杂:一家企业可能有数百种文档类型,IDP 的应对方式是一个场景一个模型,导致项目复杂度高、实施周期长、维护成本高昂。从 ROI 角度出发,企业往往只能将 IDP 应用于 10-20%最高频的场景,无法覆盖到更多场景。第三是对多语言的支持不够。对于不同的语言,IDP 往往需要多个不同的模型来处理。像上一节中提到的多语言供应商
6、发票,IDP 需要针对每种语言使用一个模型,这让企业的采购成本和维护成本都大幅提升。第四是系统割裂。为了应对不同需求,企业往往部署多套系统:OCR 系统 A 处理票据、OCR 系统 B 处理证件、IDP 系统 C 处理订单、IDP 系统 D 处理合同、这给系统的兼容、维护和升级都带来了极大的挑战。无论是 OCR 还是 IDP,都面临一个共同的根本性问题:它们都在记忆记住某个位置有某个字段,记住某种模板对应某种提取规则;而企业需要的是理解理解文档的语义,理解业务的逻辑,理解上下文的关联。就像我们不能要求一个只会背诵标准答案的学生去解决从未见过的新问题,OCR 和 IDP 也无法应对企业多变、复杂