王昊奋-ALM关键技术与应用范式.pdf-三个皮匠报告

王昊奋-ALM关键技术与应用范式.pdf

当前位置：首页 > 报告详情

王昊奋-ALM关键技术与应用范式.pdf

上传人： 2*** 编号：142173 2023-09-10 PDF PDF 104页 29.53MB

该报告所属合集： 2023AIDD AI+软件研发数字峰会·北京站嘉宾PPT合集

打包下载报告合集

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载报告到电脑，查找使用更方便

VIP专享文档

书签

已收藏

版权投诉

/104

立即下载

word格式文档无特别注明外均可编辑修改，预览文件经过压缩，下载原文更清晰！

三个皮匠报告文库所有资源均是客户上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作商用。

《王昊奋-ALM关键技术与应用范式.pdf》由会员分享，可在线阅读，更多相关《王昊奋-ALM关键技术与应用范式.pdf（104页珍藏版）》请在三个皮匠报告上搜索。

1、ALM关键技术与应用范式王昊奋同济大学演讲嘉宾王昊奋OpenKG发起人/CCF知识图谱SIG主席同济大学百人计划特聘研究员、OpenKG发起人之一，业界知名知识图谱与自然语言处理专家，腾讯云最具价值专家TVP，CCF术语工委副主任、知识图谱SIG主席、上海秘书长，中国中文信息学会理事，畅销书知识图谱方法、实践与应用的作者，曾作为2家AI独角兽企业的CTO；具有超过16年的知识图谱研发和技术管理经验。受邀在世界人工智能大会等诸多国际与国内智能峰会上担任讲者，并在自然语言处理国内顶级会议NLPCC多次担任知识图谱方向主席，长期作为ISWC,WWW,AAAI等人工智能国际顶级会议程序委员会委员。目

2、录CONTENTS1.LLM的崛起2.ALM关键技术3.应用落地范式4.未来展望LLM的崛起PART 01大语言模型掀起迈向AGI的浪潮ChatGPT是由美国人工智能公司OpenAI在2022年11月推出的生成式对话预训练大语言模型。它以对话的方式进行交互。对话形式使得其能够回答后续问题，承认错误，质疑不正确的前提，并拒绝不适当的请求2016年的Chatbot VS ChatGPT下的Chatbot大语言模型掀起迈向AGI的浪潮NLP任务：文本分类信息抽取文本摘要智能问答阅读理解机器翻译文本生成语法纠正.应用场景：信息分类文本结构化摘要说明对话问答复杂文本理解多种语言翻译内容创作信息纠错.大

3、语言模型掀起迈向AGI的浪潮A Survey of Large Language Models,2023开源基础模型+精调促进生态繁荣大语言模型掀起迈向AGI的浪潮预训练语言模型的跃进式发展AE语言模型：能够AR语言模型：只能获取单向信息，不能同时获取双向信息，代表为 GPT系列获取双向信息进行预测，代表为 BERT系列混合模型：Encoder-Decoder架构，Encoder采取自编码语言模型，Decoder采取自回归语言模型，代表为T5和BART等BERT 和 GPT 都是文字的模型，都在”猜概率”大语言模型作为基础提供接口用提示表达基础模型/大模型:指通过在大规模的数据上训练后能适应

4、一系列下游任务的的模型Zero Shot PromptingFew Shot Prompting In Context LearningInstruction来源：Finetuned Language Models Are Zero-Shot Learners来源：Language Models are General-Purpose Interfaces提示工程什么是提示提示工程师年薪达到$300K大语言模型的“特征工程”围绕提示展开：提示工程大语言模型的“特征工程”围绕提示展开：提示工程示例大语言模型的“特征工程”围绕提示展开：提示工程示例大语言模型的“特征工程”围绕提示展开：提示工程

5、示例大语言模型的“特征工程”围绕提示展开：提示工程示例Zero-Shot Chain-of-ThoughtSelf-Consistency经常被问到的问题：ChatGPT 为什么不能查询天气？GPT=Giant Parrot Talking?（统计学习）大语言模型存在的不足存在“幻觉”，容易一本正经胡说八道提示直接决定回复质量，经常容易“说正确的废话”无法理解与更新个性化知识，如无法针对个性需求提供信息无法处理动态、实时问题，如股票价格、天气变化等知识无法更新，不能提供最新信息不擅长数学计算和逻辑推理等正确答案：555458块实时问题大语言模型落地的限制增强语言大模型ALM的必要性和可能方向来

6、源:Augmented Language Models:a Survey（Yann Lecun et al.）针对当前LLM的不足，研究者们提出了一些改进措施，例如使LM利用外部工具，用LM的权重中不包含的重要缺失信息来增强上下文理解，形成更强大的智能体；这些模型统称为增强语言模型（ALMs）。推理（Reasoning）：将复杂任务分解成更简单的子任务，LM可以自己或使用工具更容易地解决。工具（Tool）：收集外部信息，或者对ALM感知的虚拟或物理世界产生影响。行为（Act）：调用一个对虚拟或物理世界有影响的工具并观察其结果，将其纳入ALM的当前上下文。结合使用：推理和工具可以放在同一个模块

报告速读

本文主要内容概括如下： 1. 介绍了大语言模型（LLM）的崛起，包括其技术发展历程、应用场景和局限性。 2. 详细阐述了增强语言模型（ALM）的关键技术，包括高级提示工程、检索/知识增强、智能中控和多模态延伸等。 3. 分析了LLM在智慧城市、汽车智能座舱等领域的应用落地范式，以及未来发展趋势。 4. 展望了LLM与知识图谱结合、自主智能体的崛起、多智能体协同等未来发展方向。文章中提到的核心数据包括： - 2022年11月，OpenAI推出生成式对话预训练大语言模型ChatGPT。 - 2023年，DeepMind发布RETRO模型，利用检索到的文档块增强自回归语言模型。 - 2023年，微软发布基于GPT-4与微软安全模型结合的安全领域大模型。 - 2023年，斯坦福发布Alpaca-7B模型，智谱AI发布ChatGLM-6B模型，链家Tech发布BELLE-7B中文对话大模型。以上内容概括了文章的主要观点和核心数据。

大型语言模型如何解决推理问题？提示工程如何提升大模型推理能力？知识图谱如何与大模型结合实现应用落地？

王昊奋-ALM关键技术与应用范式.pdf

相关报告