1、DataFunSummit#2023大语言模型在ICT运维领域的研究及应用陶仕敏-华为-2012文本机器翻译实验室技术专家个人及团队介绍 2016年至今:华为2012文本机器翻译实验室,技术专家。Lab北京团队及创新技术合作负责人。主要研究方向:智能运维、神经机器翻译、基于日志的大模型研究及应用 之前主要经历:百度。历任工程师、技术经理和智能运维负责人,主要工作职责:运维平台建设,智能运维产品开发 孟伟彬:华为数通产品线技术专家,清华博士毕业。刘逸伦:华为2012文本机器翻译实验室,助理研究员。01大语言模型观点02自然语言在ICT领域的发展03大语言模型在ICT的应用04未来畅想目录CONT
2、ENTDataFunSummit#202301大语言模型的发展及观点观点:ChatGPT 通过大语言模型技术引爆AI产业chatGPT下一代快速进化,GPT4在各种人类考试场景测试中大幅超越GPT3.5,部分标准化测试表现超过人类水平微软全面拥抱OpenAI大模型技术,基于GPT4的Copilot在办公产品中全面应用OUTLOOKPPTWordExcelNotebook视频会议Teams 直接根据需求写文稿 提供微调功能,灵活选择文字风格、文本长度 根据需求一键生成PPT 可以微调PPT风格 插入Note、PPT等附件多模态交互生成相关文本 支持多种本文结构,可以将Word文本直接生成PPT
3、通过Copilot获取数据,分析结果、分析图表和数据、做未来预测 自动生成任务流程等功能性文本 Copilot理解会议内容,用户问Copilot(小组成员对某问题看法、某产品在会中的信息),会后直接生成纪要观点:时代在高速地进行,速度越来越快。它是结构上决定的,势不可挡。-陆奇观点:人类语言是模型理解世界的桥梁,与人类对齐成就更好的模型效果和体验数据语料预训练LLMInstruct GPTRLHFSafetyChat-GPT 认知对齐 智能的工具 指令对齐 推理能力 习惯对齐 更自然的输出 安全对齐 避免道德和法律风险 体验对齐 好的产品物理世界数字世界(大型语言模型)人的认知世界基于语言对世
4、界进行数字化建模基于自身的语言来驱动大模型意图理解的不一致,导致模型输出不符合人类需求试图解决这个不一致,实现人类对齐。各种Prompt技术Prompt learning:预设问题Prompt帮助模型理解人的意图和需要Prompt Application:帮助人更好用提示词生成人想要的内容(文本、图片和语音)注:仅代表一种理解和可能大语言模型+Prompt的架构模型from:https:/lifearchitect.ai/chatgpt/5个对齐成就更好的LLM产品DataFunSummit#202302自然语言在ICT领域的发展万物皆可译(解码)原文密文密码本加密解密 翻译:加密解密的过程沃
5、伦韦弗(Warren Weaver,1894年7月17日至1978年11月24日)是美国科学家,数学家和科学管理人员。1他被公认为机器翻译的先驱者之一,并且是在美国为科学提供支持的重要人物。来源:https:/en.wikipedia.org/wiki/Warren_Weaver Transformer的出现进一步验证了这个理论的正确自然语言文本图片语音 基于人类自然语言的交互注:部分示意图片来自互联网公开数据ICT运维场景及目标:基于数据、算法和场景驱动的智能运维 场景及目标:围绕运维对象,发现其与预期不一致的状态,通过事先定义的Action,驱动运维对象状态的恢复。数据:日志、KPI、告警
6、等。1.KPI是统计数据,对于服务的本身状态是一种成本开销上的折中。2.告警本质是把机器状态数据通过可接受的成本转化成自然语言,方便人理解。3.日志某种程度上可以看做是机器语言,更加全面。在大模型时代更适合作为模型的语料。运维对象StatusAction决策Event DrivenService invocation故障恢复自动化ActionActionActionActionAction设计数据:MO类型关系规划数据:组网、配置运行数据:日志、性能、告警大语言模型为什么可以应用到ICT运维领域表:一些网络基础设施中的日志消息,日志中的详细信息和自然语言有一定的相似性类自然语言半类自然语言半结