当前位置:首页 > 报告详情

teleai-姚易彤-fc-v2.pdf

上传人: sec****ies 编号:734716 2025-07-26 27页 2.48MB

1、演讲人:姚易彤 中国电信人工智能研究院-语义算法工程师LLM基础Function Call能力强化:从数据构建到RLHF的优化闭环引言:为什么Function Call是LLM落地的关键?什么是什么是Function Function CallCall:LLM通过结构化指令结构化指令调用外部函数外部函数/API/API,将自然语言意图转为可可执行指令执行指令的能力突破文本生成局限,从“对话工具对话工具”升级为“任务执任务执行引擎行引擎”定义与价值定义与价值核心价值核心价值:突破模型知识边界,解决LLM“知识时效性知识时效性低,专业低,专业领域能力领域能力弱弱”重构人机交互体验,通过任务自动化执

2、行自动化执行实现动态动态交交互互与实时实时响应响应1 Kim,S.,Moon,S.,Tabrizi,R.,Lee,N.,Mahoney,M.W.,Keutzer,K.,&Gholami,A.(2023).An LLM Compiler for Parallel Function Calling.ArXiv,abs/2312.04511.引言:为什么Function Call是LLM落地的关键?Function Call Function Call 主流主流应用场景应用场景Function Function Call Call 常见问题常见问题错误错误调用参数、幻觉生成调用参数、幻觉生成APIA

3、PI、依赖关系混乱、依赖关系混乱场景与痛点场景与痛点Function Call常见的幻觉问题1 Xu,H.,Zhu,S.,Wang,Z.,Zheng,H.,Ma,D.,Cao,R.,Fan,S.,Chen,L.,&Yu,K.(2024).Reducing Tool Hallucination via Reliability Alignment.ArXiv,abs/2412.04141.核心算法优化方案数据01核心算法优化方案训练优化02Agent应用方案03目 录CONTENTS01.核心算法优化方案数据一、核心算法优化方案数据调用调用模型模型用户输入用户输入 提供给LLM的工具信息模型调用时

4、增加tools字段注册工具信息将输出解析为将输出解析为contentcontent和和tool_callstool_calls两个两个字段字段模型输出模型输出模型输出调用工具信息及参数用户输入的问题1.1.拆解当前场景大模型拆解当前场景大模型Function CallFunction Call数据通用形式数据通用形式一、核心算法优化方案数据调用调用模型模型用户输入用户输入将输出解析为将输出解析为contentcontent和和tool_callstool_calls两个两个字段字段模型输出模型输出1.1.拆解当前场景大模型拆解当前场景大模型Function CallFunction Call数

5、据通用形式数据通用形式你是TeleChat,中文名是中国电信星辰语义大模型,你是由中国电信人工智能研究院研发的人工智能助手。#可用工具你可以调用标签中包含的一个或多个工具来辅助你回答问题,以下是可用工具详情:type:function,function:name:get_current_temperature,description:Get current temperature at a location.,parameters:type:object,properties:location:type:string,description:The location to get the te

6、mperature for,in the format City,State,Country.,required:location#调用方法你需要遵循工具的要求,使用json格式返回工具名称及参数,并用包含。下方是一个调用模板:name:,arguments:现在北京的天气怎么样?为了获取当前天气,我需要调用get_current_temperature这个工具name:get_current_temperature,arguments:location:北京Tool call格式要求进一步解析一、核心算法优化方案数据再次再次调用模型调用模型1.1.拆解当前场景大模型拆解当前场景大模型Func

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
全文主要内容概括如下: 1. **Function Call是LLM落地的关键**:强调了大模型通过Function Call实现外部函数/API调用的能力,突破了文本生成的局限,使LLM从“对话工具”升级为“任务执行引擎”。 2. **Function Call的应用场景与问题**:分析了Function Call在现实应用中遇到的问题,如错误调用参数、虚构API等,并提出了优化方案。 3. **数据构建流程**:介绍了从任务构建、工具构建、答案构建到校验的详细数据构建流程,包括真实工具与LLM虚构工具的比较。 4. **训练优化方案**:讨论了SFT和RL优化方案,提出了多轮对话能力缺失的解决思路,并介绍了代码工具交互优化和搜索工具交互优化。 - **核心数据**:例如,使用了{“name”: “xxx”, “arguments”:“xxx”}的格式要求。 5. **效果评估与迭代优化**:提到了BFCL和τ-bench等评估工具,强调了自动化评估和pass^k指标的重要性。 6. **Multi-Agent应用方案**:提出了Multi-Agent作为Agent落地应用的新范式,强调了专业Agent执行子任务、规划能力、工具选择和长文理解等关键能力。 关键点分条列出: - Function Call能力强化是LLM落地的关键。 - 优化方案包括数据构建、训练优化和效果评估。 - 多轮对话能力和环境交互是训练优化的重点。 - BFCL和τ-bench提供了评估大型语言模型能力的基准测试。 - Multi-Agent方案为Agent落地应用提供了新思路。
"如何强化LLM的Function Call能力?" "落地实践中,Function Call面临哪些挑战?" "多智能体Agent应用方案是什么?"
客服
商务合作
小程序
服务号
折叠