《徐铖晋-“智能不够知识来凑”——知识驱动的金融智能体.pdf》由会员分享,可在线阅读,更多相关《徐铖晋-“智能不够知识来凑”——知识驱动的金融智能体.pdf(40页珍藏版)》请在三个皮匠报告上搜索。
1、演讲人:徐铖晋 粤港澳大湾区数字经济研究院 AI研究科学家数创弧光(深圳)科技有限公司 CTO“智能不够,知识来凑”知识驱动的金融智能体背景与挑战Work Summary And Review01解决思路Work Completion02金融场景应用Problem Solving Progress03未来方向Work Plan For Next Quarter04目 录CONTENTS背景与挑战W o r k S u m m a r y A n d R e v i e w金融场景要求深度全面的检索和推理,传统的RAG不足以支撑知识图谱支持多跳推理,但构建成本高,与大模型交互不够友好大模型在金融
2、场景的核心矛盾全球金融 AI 市场规模在2024年已经达到数百亿美元,显示出巨大的增长潜力。然而,这一增长背后隐藏着高风险决策与黑箱模型之间的矛盾,尤其是在信用评分和风险管理等关键领域。大模型目前在金融场景的落地更多见于智能客服、智能营销、智能投顾等非决策类场景;在金融风控、欺诈检测、审计及投研等严肃场景的应用仍未成熟金融 AI 模型在事实性错误和推理不可追溯方面存在显著瓶颈,尤其是在处理复杂金融数据时,模型的决策过程往往难以追踪和验证。数据:全球金融 AI 市场规模(2024 年)场景:非决策业务 vs 决策业务痛点:高风险决策 vs 黑箱模型(欧盟 AI 法案要求)技术瓶颈:事实性错误、推
3、理不可追溯欧盟 AI 法案对高风险决策的透明性和可解释性提出了严格要求,金融机构必须确保其 AI 模型能够提供清晰的决策依据,以避免潜在的法律和声誉风险。中国生成式AI服务管理暂行办法强调内容真实性,加剧事实性错误合规风险。传统RAG技术在金融场景的局限性传统 RAG 依赖于关键字匹配和向量相似性,这通常会导致不完整或肤浅的搜索结果。例如:例如客户询问近期政策对科技股的影响,传统RAG可能混杂宏观经济政策与行业监管文件缺乏语境理解传统RAG仅检索孤立片段,缺乏全局关联,难以处理金融数据的复杂关系。例如:在企业信用评估时,仅能检索财务报表片段,忽视关联企业担保关系推理深度不足1.准确理解用户查询
4、意图2.支持复杂关系的深度检索3.精确识别领域专业术语金融场景中的检索需求传统RAG依赖通用检索模型,可能缺乏金融领域的特定知识。例如,金融术语如“净资产收益率”和“总资产收益率”在检索过程中可能被混淆。领域知识不足金融知识图谱企业关系支持基于企业关系链路的深度分析,用于金融风控、行业分析等各种场景02企业画像从多源信息中提炼企业实时特征,构建精准的企业画像01知识图谱在金融场景中的应用优势知识图谱大语言模型+RAG结构化与精确性高,减少错误风险,提供精确数据一般,依赖检索准确性,可能产生幻觉复杂关系处理强,支持多跳推理,揭示动态关联弱,RAG依赖文本相似性,难以多跳推理数据整合与一致性强,整
5、合多源数据,提供统一视图一般,不同的文本统一的标签生成和向量化处理可解释性高,推理过程透明,易可视化一般,仅能显示参考文献来源可扩展性高,数据不断扩展情况下检索精确度仍有保障一般,随着数据不断扩展,检索效率和精确度不断下降解决思路W o r k S u m m a r y A n d R e v i e w将图谱作为大语言模型的外部知识源之一,与RAG相结合知识图谱与大语言模型的结合大语言模型通用性:模型具有指令遵循能力,能处理多种任务,并支持多语言、多模态、多领域的应用。可生成性:模型能生成各种形式和风格的文本,也能生成多模态的内容,如图像、音频等。创作能力:能生成新颖、连贯和通顺的文本,也
6、能生成多模态作品,如图片、歌曲等。常识能力:基于海量通用训练数据中的知识,具有常识理解能力。语义理解能力:能根据文本、多模态数据中出现的内容,理解其含义和关系。知识图谱可解释性:知识图谱可基于基于明确的语义结构进行查询和分析,具有较好的可解释性。、可信赖性:知识图谱通常是由专家创建和维护,因此其可信赖性较高。可溯源性:知识图谱中的每个实体和关系都可以追溯到其来源。可校验性:知识图谱中的信息可以通过专家进行校验。可评价性:知识图谱的质量可通过查询的准确性和完整性来评价。领域能力:具有较强的领域知识支持,支撑了其领域服务能力。推理能力:可根据图谱中的精确知识内容和关联结构,进行高可信度的推理Enh