《关于 GraphRAG 的思考、展望与进展 - 余毅航.pdf》由会员分享,可在线阅读,更多相关《关于 GraphRAG 的思考、展望与进展 - 余毅航.pdf(20页珍藏版)》请在三个皮匠报告上搜索。
1、https:/nebula-关于 GraphRAG 的思考、展望与进展余毅航ppt请跳转 https:/nebulagraph-slide.yanli.onehttps:/nebula-ChatDBA:智能数据库助手苏鹏https:/nebula-根据 Uptime Institute 在数据中心调查中,超过一半(55%)的受访者表示,在过去三年中曾发生过停机。与此同时,2023 年有十分之一的故障被归类为严重或者很严重。同时超过一半的受访者表示他们最近的一次重大、严重或极端的停机事件成本超过十万美元,而 16%的受访者表示成本超过一百万美元。数据库运维现状数据库作为核心基础设施,其稳定性直接
2、影响着数据中心的整体稳定性。然而,企业在数据库运维方面正面临以下挑战:1.故障问题难以快速定位:数据库故障的定位往往需要综合多个系统的情况进行分析,排查耗时且复杂,带来了较高的运维成本。2.高昂的人力成本:根据行业经验,DBA 与研发人员的配比不应低于 1:200,然而扩大 DBA 团队的人力成本非常高。数据来源:Uptime Institutehttps:/nebula-企业中数据存在多样性:多种类型数据库并存随着企业数字化转型的深化,企业数据特征的复杂性不断提升,单个数据库产品已无法满足企业全方位的需求。甲方企业普遍缺乏多元混合数据库管理的人才和技术IT行业人才紧张,近9成IT服务行业的毕
3、业生进入了信息通信技术行业,流入其他行业甲方企业的人才显著不足。数据库原厂商无法提供多数据库统一管理和服务数据库原厂将主要力量投入到自身数据库产品的研发中,但受到技术壁垒、行业分工及其他市场因素限制,数据库原厂无法提供自身产品以外的跨数据库统一管理和配套服务。https:/nebula-业务增长太快,数据库该如何扩展,读写分离、分库分表该怎么选?多大的表该做拆分,怎么拆呢?数据咋迁移呢?网上流传的双主架构,数据经常不一致,复制老中断,该咋整?业务要用的数据库种类太多了,MySQL、Redis、MongoDB、PostgreSQL、TiDB、OB,能不能统一维护起来?Oracle是去掉了,用了一
4、堆开源库,运维太麻烦了。业务抱怨数据库运行缓慢,没有足够信息采集,该如何诊断?开源数据库占比越来越大,怎么样才能快速掌握它们的最佳实践呢?前期没有做标准化,现在数据量增长太快,运维效率下降,问题越来越多。开发drop库了,恢复起来太费劲,有没有快速恢复的方案?安全扫描又来,数据库又要升级,有没有批量自动化的升级方案?https:/nebula-可以完成基本问答,但对DBA的日常工作实际价值不大答案很泛泛,逻辑不够强。虽然没错误,但对实际工作指导性不大故障诊断场景中一个故障现象可能对应多个故障原因,不同的原因又有不同的排查手法和解决方案大模型倾向基于已有的信息推测所有的可能结果,和DBA的工作习
5、惯并不相同https:/nebula-高效的故障诊断需要具备复杂隐性推理能力Retrieval Augmented Generation(RAG)and Beyond:A Comprehensive Survey on How to Make your LLMs use External Data More Wiselyhttps:/nebula-查询重写查询扩充Level 1 Level 2 面临的挑战检索准确性https:/nebula-Level 1 Level 2 面临的挑战检索准确性https:/nebula- Level 1 Level 2 面临的挑战检索准确性https:/neb
6、ula-Level 1 Level 2 面临的挑战可观测性问题https:/nebula-Level 3 Level 4 面临的挑战数据处理https:/nebula-Level 3 Level 4 面临的挑战多轮交互https:/nebula-Level 3 Level 4 面临的挑战长短时记忆自信息压缩:自信息是信息论中的一个概念,用于量化某个特定事件发生的信息量。自信息的大小与事件发生的概率成反比,即一个事件发生的概率越小,该事件的自信息就越大。这意味着,如果一个事件总