1、分享人:吕艳通 算法工程师大模型语义理解DataFunSummit 2025通过信息传播的动态对话主题分割大模型应用现状01对话主题分割02金融场景实践案例03总结与未来展望04目 录CONTENTSDataFunSummit 2025大模型应用现状01对话主题分割02金融场景实践案例03总结与未来展望04大模型应用现状-RAG什么是RAG?检索增强生成(Retrieval Augmented Generation,RAG)是一种结合外部知识检索和文本生成的混合架构,旨在提高大语言模型的回答准确性、时效性和可靠性。知识扩展通过检索外部知识库,突破模型参数中固有知识的限制,获取最新和专业领域信息
2、。事实准确性基于检索到的事实生成回答,减少幻觉,提高回答的可靠性和可验证性。灵活适应无需频繁重训练模型,只需更新知识库即可适应新信息和变化的需求。图1:检索增强生成(RAG)工作流程图2:RAG与传统LLM在不同任务上的性能对比RAG面临的挑战如何进行高效信息分块以保持语义完整性?如何确保检索内容与用户当前关注的主题相关?大模型应用现状-智能体系统什么是智能体?智能体(Agent)是基于大语言模型的自主系统,能够理解用户意图、制定计划、使用工具、执行任务并进行反思,实现更复杂的自动化和决策过程。自主决策能够根据目标和环境状态,自主规划行动路径并做出决策。工具使用可以调用外部API、访问数据库、
3、执行代码等,扩展其能力范围。多智能体协作多个专业智能体协同工作,分工合作解决复杂任务。图3:典型LLM智能体结构智能体系统面临的挑战如何在复杂对话中准确理解用户意图?如何处理多轮对话中的上下文和主题切换?如何在多智能体协作中高效分配任务?大模型应用现状-对话上下文理解对话主题分割的关键作用对话主题分割(DTS)技术可以帮助智能体和RAG系统准确识别对话中的主题边界,提高对话理解能力,实现更精准的信息检索和任务分配。RAG面临的挑战如何进行高效信息分块以保持语义完整性?如何确保检索内容与用户当前关注的主题相关?智能体系统面临的挑战如何在复杂对话中准确理解用户意图?如何处理多轮对话中的上下文和主题
4、切换?如何在多智能体协作中高效分配任务?图4:LLM智能体结构大模型应用现状01对话主题分割02金融场景实践案例03总结与未来展望04对话主题分割什么是对话主题分割(DTS)?定义对话主题分割(DTS)是一项在多轮对话中检测主题之间转换的基础任务,帮助揭示对话的底层主题结构。图5:对话主题分割示例 对话主题分割大模型主题分割方法 直接提示法 通过精心设计的提示词,直接要求大模型识别对话中的主题边界。主题变化点打分让模型对每一句话后是否发生“主题变换”进行评分或标注。存在的问题 结果不稳定 由于模型的随机性可能产生不一致的分割结果,缺乏可靠性。计算效率低 直接使用大模型计算成本高,处理长对话时效
5、率低下,难以应用于实时场景。缺乏细粒度控制 难以根据不同应用场景需求调整分割粒度,无法平衡过分割和欠分割问题。缺乏结构感知 多轮对话中,主题变化可能跨越数十句甚至上百句,而大模型对长文本的全局结构理解能力有限。对话主题分割传统方法-DialSTART主要步骤 现有方法的挑战 未能充分利用位置线索和主题间关联缺乏灵活性,通常依赖一次性全局语义比较易受噪声影响,特别是在多主题对话中图6:对话主题分割-传统方法架构 对话主题分割DyDTS框架概述核心思想DyDTS(Dynamic Dialogue Topic Segmentation)框架通过迭代改进主题边界精度 结合语句位置亲和性和主题间关联,实
6、现更准确的对话主题分割框架组件1.Topic-Aware Propagation Matching(TAPM)生成初始语句表示并构建对话相似度矩阵,识别初步主题边界,通过对比学习优化语句表示。2.Dynamic Topic Boundary Refinement(DTBR)迭代调整局部区域内边界位置,重新计算局部语句相似度,识别最低相似度点,细化为新的主题边界。图7:DyDTS框架结构-展示了TAPM和DTBR两大核心组件的工作流程对话主题分割Topic-Aware Propagation Matching(TAPM)工作流程1初始语句编码器:使用SimCSE框架初始化语句表示hi=SimCS