《9.21李剑楠 ChatDBA数据库根因分析智能助手的实践与应用.pdf》由会员分享,可在线阅读,更多相关《9.21李剑楠 ChatDBA数据库根因分析智能助手的实践与应用.pdf(34页珍藏版)》请在三个皮匠报告上搜索。
1、DataFunSummitDataFunSummit#20242024ChatDBA:ChatDBA:数据库根因分析数据库根因分析智能助手的实践与应用智能助手的实践与应用李剑楠 研发工程师背景介绍ChatDBA架构挑战与解决思路未来展望01背景介绍T Te ex xt t-t to o-S Sp pe ee ec ch hS Sp pe ee ec ch h-T To o-T Te ex xt t T TR RA AN NS SL LA AT TI IO ON N D DO OC C P PA AR RS SI IN NG G T TE EX XT T /N NL LP PG Ge en ne
2、 er ra al l O OC CR RR Re es su umme eI In nv vo oi ic ce e/R Re ec ce ei ip pt t/I ID DA Ar rt ti if fi ic ci ia aI I I In nt te el ll li ig ge en nc ce e A AP PI Is s L La an nd ds sc ca ap pe e -J Ja an nu ua ar ry y 2 20 02 23 3 G GE EN NE ER RA AT TI IV VE E A AI I S SP PE EE EC CH H V VI IS SI
3、 IO ON N可以完成基本问答,但对DBA的日常工作实际价值不大答案很泛泛,逻辑不够强。虽然没错误,但对实际工作指导性不大故障诊断场景中一个故障现象可能对应多个故障原因,不同的原因又有不同的排查手法和解决方案大模型倾向基于已有的信息推测所有的可能结果,和DBA的工作习惯并不相同ChatDBA 是一款基于大模型的智能数据库助手。通过对话交互的方式进行数据库故障诊断、数据库专业知识学习、SQL 生成与SQL优化等功能,大幅提升数据库从业者工作效率。无论中小企业还是大型组织,ChatDBA 都能提供强大的数据库支持,确保业务平稳高效运行。02技术架构03挑战与解决思路ChatDBAChatDBA
4、技术挑战:多轮交互技术挑战:多轮交互中的排查逻辑中的排查逻辑ChatDBAChatDBA 技术挑战:故障诊断树的准确技术挑战:故障诊断树的准确性性xx故障工单一、故障现象描述数据库报错Error2002:xxxxxx二、故障排查、解决方法1.可能原因:数据库server处于宕机状态2.排查xxxxx3.修改xxx解决三、复盘总结Error2002表示xxxx,本单通过排查xxx解决问题根据参考资料生成Error 2002的故障排查树ChatDBAChatDBA 技术挑战:信息检索技术挑战:信息检索查询重写查询扩充ChatDBAChatDBA 技术挑战:信息检索技术挑战:信息检索关键字和向量检索
5、各从不同角度处理搜索,二者功能互补。向量检索通过语义匹配,对拼写错误、同义词和措辞差异具有较强的鲁棒性,且能适用于跨语言搜索。关键字搜索凭借直接匹配,能够有效识别并优先处理文本中的特定重要单词。ChatDBAChatDBA 技术挑战:信息检索技术挑战:信息检索ChatDBAChatDBA 技术挑战:信息检索技术挑战:信息检索ChatDBAChatDBA 技术挑战:信息检索技术挑战:信息检索ChatDBAChatDBA 技术挑战:文档处理技术挑战:文档处理Q&A 拆分摘要拆分ChatDBAChatDBA 技术挑战:文档处理技术挑战:文档处理Q&A 拆分ChatDBAChatDBA 技术挑战:文档
6、处理技术挑战:文档处理ChatDBAChatDBA 技术挑战:多轮交互技术挑战:多轮交互ChatDBAChatDBA 技术挑战:长短时记忆技术挑战:长短时记忆自信息压缩:自信息是信息论中的一个概念,用于量化某个特定事件发生的信息量。自信息的大小与事件发生的概率成反比,即一个事件发生的概率越小,该事件的自信息就越大。这意味着,如果一个事件总是发生,那么它并不提供任何新的信息。因此,我们可以利用自信息来识别prompt中的关键信息,将其保留下来,而忽略那些不提供新信息的部分。Question-Aware Coarse-Grained Compression 问题感知的粗粒度压缩。不再单独查看每个文
7、档,而是检查每个文档与问题的关联性。Question-Aware Fine-Grained Compression问题感度的细粒度压缩Subsequencerecovery子序列恢复ChatDBAChatDBA 技术挑战:意图识别技术挑战:意图识别https:/ 技术挑战:问题延伸技术挑战:问题延伸ChatDBAChatDBA 技术挑战:长流水线的技术挑战:长流水线的弊端弊端ChatDBAChatDBA 技术挑战:时间成本技术挑战:时间成本ChatDBAChatDBA 技术挑战:系统评估技术挑战:系统评估ChatDBAChatDBA 技术挑战:系统评估技术挑战:系统评估ChatDBAChatDBA 的核心特性的核心特性ChatDBAChatDBA 的核心特性的核心特性监控图识别图表信息识别长日志识别ChatDBAChatDBA 的核心特性的核心特性SQL生成能力SQL优化能力ChatDBAChatDBA 的核心特性的核心特性专业知识快速掌握数据库概念在线学习04未来展望ChatDBAChatDBA 的未来方向的未来方向the text catpicture of cat多模态模型DataFunSummitDataFunSummit#20242024THANKSTHANKS