《周华-AI大模型浪潮下的行业应用新模式和关键实现路径.pdf》由会员分享,可在线阅读,更多相关《周华-AI大模型浪潮下的行业应用新模式和关键实现路径.pdf(32页珍藏版)》请在三个皮匠报告上搜索。
1、AI大模型浪潮下的新型行业应用系统模式和关键实现路径演讲人:周华北京智源人工智能研究院 智能应用负责人0102030405目录AI大模型浪潮推动企业IT系统架构变革以AI大模型为核心的应用系统关键实现路径构建IndustryInstruction行业指令数据集总结MindForge自动化行业指令数据生产技术介绍AI大模型浪潮推动企业IT系统架构变革AI大模型浪潮推动企业IT系统架构变革5以大模型为核心以数据为核心以服务为核心以流程为核心20世纪80-90年代(计算机企业应用兴起)2000至今(互联网/移动互联网系统兴起)2010年至今(云计算和大数据系统兴起)2023年至今(人工智能2.0时代
2、开启,通往AGI)强调数据作为最重要的资产,系统围绕数据采集、存储、处理和分析展开。数据从单纯的支撑角色转变为驱动决策和创新的核心力量。系统设计围绕“可复用的服务”展开,通过服务化满足多个应用和业务场景需求。从单体架构逐步演进到分布式架构,再到微服务架构。强调系统内的业务流程优化,以支持复杂企业流程为目标。系统设计围绕流程自动化,从订单处理到客户管理的工作流全部打通。系统进一步整合数据、模型和任务,形成围绕大模型的智能业务生态。具有强大的任务泛化能力,能够通过统一模型支持多模态、多任务的灵活处理,并实现实时学习与适应,提供高效智能化服务。智能系统不再仅仅是工具,而是能主动学习、适应和协作的智能
3、体。ChatGPT问世人类进入大模型时代向以AI大模型为核心的应用系统架构演进企业/机构IT系统(执行服务功能)浏览/发现选择请求 设定任务目标 规划流程 分析过程信息 确定执行路径 获得任务结果实现服务功能用户应用开发者企业/机构IT系统(执行服务功能)浏览/发现选择请求 设定任务目标 获得任务结果实现服务功能用户应用开发者多智能体助手算法工程师实现智能体应用 作为助手代理用户业务 规划流程 分析确定路径 完成专业认知型任务 智能驱动非认知任务非认知类服务和功能(如企业流程、结构化数据存取等)训练行业应用大模型交办工作任务传统应用系统服务模式(客户端-服务器架构)以大模型为核心的应用系统服务
4、模式(多智能体架构)6以AI大模型为核心的应用系统关键实现路径以AI大模型为核心的应用系统关键实现路径(1/4)8需求分析和方案设计模型训练智能体应用系统开发数据工程应用集成部署以AI大模型为核心的应用系统关键实现路径(2/4)9以AI大模型为核心的应用系统关键实现路径(3/4)10以AI大模型为核心的应用系统关键实现路径(4/4)11定义模型能力,以模型能力需求出发训练模型12通用语言能力基础语言能力信息分析信息提取信息概括跨语言理解.高级语言能力学科问答语境理解.安全与价值观安全脏话辱骂违法犯罪身体伤害隐私财产敏感话题.价值观歧视偏见文明礼貌伦理道德.医疗业务能力医疗问诊能力单轮对话多轮对
5、话专科解答检验检查解读.导诊能力病情理解科室推荐院内导航.行业大模型能力评估体系 典型能力框架(以医疗为例)从模型能力需求出发选择基座模型从模型能力需求出发构建模型训练数据集从模型能力需求出发指导模型训练数据是大模型行业应用成功的关键 大模型行业应用涉及的五个方面,数据工程最重要!大部分行业的数据很丰富,但数据形态难以满足大模型行业应用开发要求:结构化数据:不能直接用于模型训练或RAG向量库构建;非结构化数据:需要使用复杂的数据转换工具,成本高昂;数据的数量和质量决定了模型的性能:模型性能不达标,表面原因模型没有学会,深层次的原因是缺乏某类训练数据或此类数据质量不高;需要重点从数据层面入手解决
6、大模型行业落地的技术瓶颈;2024年研究院一直在致力于制约解决行业应用落地最后一公里的数据问题:行业CPT预训练数据集:IndustryCorpus1.0和IndustryCorpus2.0 行业指令数据集:行业指令数据集:IndustryInstructionIndustryInstruction1.01.0构建Industry Instruction行业指令数据集为什么要构建行业指令数据为什么要构建行业指令数据15 智源研究院9月底发布了行业数据全景扫描行业数据全景扫描显示:当前行业数据总体存在着以下问题 数据缺失数据缺失:部分行业缺乏指令数据 质量参差不齐质量参差不齐:数据杂乱,质量不均