当前位置:首页 > 报告详情

Database Copilot 在数据库领域的落地-李粒.pdf

上传人: 张** 编号:164015 2024-05-31 63页 35.59MB

1、Database Copilot 在数据库领域的应用李粒,PingCAP AI LabAgenda数据库运维领域的挑战LLM 带来的机遇PingCAP 的实践Database Copilot 的未来挑战数据库运维领域的挑战来自业务的挑战故障恢复数据规模增长更低的延迟在线分析来自业务的挑战数据规模增长更低的延迟来自业务的挑战数据规模增长更低的延迟最佳实践选用更合适的数据库设计库表结构索引优化并发控制内存管理HintBinding来自业务的挑战TiDB Cloud 文档:582TiDB 文档:1095数据规模增长更低的延迟来自业务的挑战在线分析来自业务的挑战在线分析HTAPPMFinanceOpe

2、rationMarketing不熟悉 SQL来自业务的挑战故障恢复来自业务的挑战故障恢复MetricsLogsQueriesProfilingTiDB1000+1000+/sSlow QueriesSQL StatementTopSQL1min来自业务的挑战故障恢复数据规模增长更低的延迟在线分析数据库是一个复杂系统,难以被用户完全掌握LLM 带来的机遇过去的方法(传统 AIOPS)Rule-Based/ML/DLhttps:/ 带来的新能力In-context Learning ReasoningCoding/SQLFunction CallRule-Based/DL/RL任务复杂度任务泛化能

3、力LLM Capability(Corpus+API+Code+Loop)一些概念概念-LLM 应用类型https:/ 作为路由器,参与到流程判断中,判断需要使用的工具、召回、逻辑路径等。人类的业务代码人类提供Agent(Loop)多次调用产出LLM 可以重复进行某些循环步骤,以确保流程能够持续进行,或确保结果满足人类最初的目标。人类提供基本逻辑和提示,LLM 根据人类逻辑进行优化和调整,自主完成流程。人类提供Autonomous Agent多次调用产出LLM 可以重复进行某些循环步骤,以确保流程能够持续进行,或确保结果满足人类最初的目标。LLM 自主完成所有行动流程的初始化、工具接入、流程执

4、行。人类提供Silicon-based Life多次调用产出LLM 可以重复进行某些循环步骤,以确保流程能够持续进行,或确保结果满足人类最初的目标。LLM 自主完成所有行动流程的初始化、工具接入、流程执行。基于反馈,LLM 自主发起和确认每一次行动的目标概念-什么是 Copilot?https:/ 的实践应用场景/已有工作/数据飞轮数据库常见的 LLM 应用场景ChatBotNL2SQL数据库诊断面向用户PingCAP AI Lab-LLM 技术逻辑框架PingCAP LLM 应用的业务架构Chatbot-来自业务的挑战数据规模增长更低的延迟TiDB Cloud 文档:582TiDB 文档:1

5、095Chatbot App-FlowChatbot App 的毒性检测毒性检测对齐使人工通用智能(AGI)与人类价值观保持一致,并遵循人类意图。引自 OpenAI,2022,Our approach to alignment research有害内容当代文本生成模型能够生成有害语言,包括仇恨言论、侮辱、亵渎和威胁。这些危害通常被归类为“有害内容”这一总称。引自 Deepmind,2021,Challenges in Detoxifying Language Models即插即用语言模型(PPLM)Chatbot App 的毒性检测Chatbot 的毒性检测Chatbot App 的毒性检测C

6、hatbot App 的语料增强 分类数量百分占比超出应答范围98.74%错误检索结果6058.25%没有相关文档2322.33%LLM 幻觉1110.68%总共103100%最初 300 个问题的反馈Chatbot App 的语料增强RAGHuman:Whats TiDB Cloud?RankChunkScore1TiKV is.0.912TiDB is.0.873TiFlash is.0.834PD is.0.815TiUP is.0.796TiDB Cloud is.0.77RetrieveChatbot App 的语料增强ReRankDocumentation CorporaAdjus

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了Database Copilot在数据库领域的应用,由PingCAP AI Lab提出。文章首先提出了数据库运维领域的挑战,包括业务挑战如数据规模增长、更低的延迟、在线分析,以及故障恢复等。然后介绍了LLM(大型语言模型)带来的机遇,如In-context Learning、Reasoning、Coding等能力。PingCAP的实践表明,LLM在数据库诊断、SQL生成、故障恢复等方面具有显著效果。例如,Chatbot App可以自动回答TiDB和TiDB Cloud相关问题,NL2SQL App可以自动生成SQL语句,Diagnosis App可以提供故障恢复的计划和执行。文章还提出了Database Copilot的未来挑战,包括自主探索根因并修复、知识积累超出人类效率、评价和优化等。
"数据库Copilot如何改变运维领域?" "LLM技术在数据库诊断中的实际应用" "PingCAP的AI实践如何提升数据库体验?"
客服
商务合作
小程序
服务号
折叠