《基于DeepSeek先进架构的数据分析智能体升级.pdf》由会员分享,可在线阅读,更多相关《基于DeepSeek先进架构的数据分析智能体升级.pdf(33页珍藏版)》请在三个皮匠报告上搜索。
1、 基于DeepSeek先进架构的数据分析智能体升级演讲人:数势科技-李飞博士公司和个人介绍公司概况部分代表客户投资机构数势科技为企业提供基于大模型增强的数据分析 AI Agent,提升企业的数字化决策能力,推动企业数字化升级。2020年,由原京东技术副总裁黎科峰博士创立 行业首个商业化落地的数据分析智能体SwiftAgent 在金融、零售、先进制造领域有深度技术和业务know-how企业数据分析与洞察的难点和挑战数据分析为什么要结合AgentData Agent技术路线的选择和升级某城商行落地实践介绍Data Agent的相关思考未来展望01企业数据分析与洞察的难点和挑战企业过去十年数字化系统
2、建设现状企业数字化建设进度不一,大致分为以下三类数据仓库BI系统指标平台现状:现状:1.少部分企业仍处在数仓建设阶段,主要原因是数据之殇。2.BI和看板已在大部分的企业落地,ROI仍有待估算。3.部分企业基于业务场景搭建企业级指标平台。疑问:疑问:企业应该基于哪一层建立大模型数据分析?企业业务分析人员日常都在干什么?Python/R/SPSSPython/R/SPSS数据可视化工具数据可视化工具异常检测算法异常检测算法了解可执行落地的策略建议了解可执行落地的策略建议学会绘制折线图学会绘制折线图高阶预测模型高阶预测模型相关性分析相关性分析归因算法归因算法复杂复杂SQLSQL撰写撰写了解数据清洗机
3、制了解数据清洗机制归纳总结能力归纳总结能力原始数据(Raw Data)分析结论现状:现状:1.每个技能都分布在不同的角色或平台系统上;2.分析结论需要经过很多环节。疑问:疑问:如何做分析能力的整合,以及沉睡技能的唤醒?02数据分析为什么要结合数据分析为什么要结合AGENTAGENTAgent的“检索连接”本质搜索搜索推荐推荐LLM内容的偏好推荐内容的检索过滤打破信息茧房人工过滤信息信息茧房推动物理环境变化的手段TOOL决策和思考的信息来源内容内容0102Agent的“效率提升”本质通过SQL或python代码编写进行数据分析和洞察,但是需要研发角色和需求响应时长。代码分析到低代码的BI演进是因
4、为“10”倍门槛的降低和“10”倍效率的提升,如果BI到LLM分析没有“10”倍的差距,就毫无意义通过图形化设计和拖拉拽操作满足业务需求,但是为了满足灵活的需求,设计及其复杂。通过自然语言快速满足业务需求,但是仅仅有可描述性的数据查询提效不明显。Agent的“快与慢”本质通过调动注意力来分析和解决问题,并作出决定,它比较慢,不容易出错依赖情感、记忆和经验迅速作出判断,它见闻广博,使我们能够迅速对眼前的情况作出反应思考的思考的”快快”思考的思考的”慢慢”Agent替代传统的冗余数据分析流程数据Agent提出任务数据查询数据报表异动分析数据报告给出行动数据源利用大模型利用大模型Agent能力,显著
5、降本增效能力,显著降本增效(大模型)(秒级响应)门槛低简单交互,人人都是数据分析师效率高数据查询,报告分析任务秒级响应能力厚归因分析、异动分析、报告总结传统数据分析路径长,存在明显人力瓶颈传统数据分析路径长,存在明显人力瓶颈老板任务数据+BI工程开发数据查询运营任务数据+BI人工绘制数据报表产品任务数据+BI人工梳理异动分析临时需求数据+BI人工总结数据报告(人力瓶颈)(产出缓慢)门槛高商业分析,需借助研发与BI协助效率低需求响应数小时,决策不及时能力薄只能查数,分析需要人工交互性弱以数据查询与看板展示为主交互性强多轮追问、歧义反问,有理有据系统执行数据分析Agent的通用流程1.编排和固定工
6、作流的划分,让稳的更稳,创新的更创新;2.工具的多样性是核心;3.针对数据分析结果的反思需要建立一套专属评估标准。03Data AgentData Agent技术路线的选择技术路线的选择和升级和升级Data InquiryNL2Semantics用户请求数据对象逻辑对象预处理对象召回对象编排检索生成多步思考解码策略DSL生成LLM投票策略错误修改一致性检查后处理重排序描述口径关系1.数据模型和业务场景相关,降低大模型关联的错误性。2.字段冗余存储,降低选择的错误性3.减少文本生成长度,降低时间复杂度和错误传递。4.查询语句提前优化,减少慢SQL生成的概率语义层包含哪些在企业实际落地中,我们认为