《黄泓-金融风控领域的大模型落地实践.pdf》由会员分享,可在线阅读,更多相关《黄泓-金融风控领域的大模型落地实践.pdf(20页珍藏版)》请在三个皮匠报告上搜索。
1、演讲嘉宾:黄泓1背景2整体思路3案例4总结展望Akulaku的业务Akulaku是一家主打海外市场的互联网金融服务提供者,服务内容包括网上购物和分期付款,现金贷,保险等等。主要的应用场景包括金融风控,电商智能客服以及电商推荐等等。无论是在用户审核,信用评估和反欺诈识别等环节,单纯手工操作和业务规则判断无法高效准确地处理大量的用户请求,拦截各种黑产攻击总体目标:构建基于各种技术手段的敏捷高效的智能风控系统,应对各种威胁,不断提升用户体验具体应用场景1图像:KYC人脸核身2文本:智能客服3语音:客服质检4设备:设备环境校验涉及授信申请,登录校验,下单校验,催收,售后客服回访等多个业务环节总体思路利
2、用大模型,我们期望进一步提高智能风控系统在前面说的各个业务环节和各种数据形态上的效能。具体会通过构建一个智能体系统实现智能体系统构成11规划模块(Planning)2存储模块(Memory)3工具模块(Tools)包括各种业务决策的知识,通常固定在智能体的链的定义中业务数据和各种元数据,存储在一种或者几种外部数据库中各种专用的业务模型和业务逻辑。包括各种图像模型,NLP模型等等引用:1 https:/lilianweng.github.io/posts/2023-06-23-agent/落地角度1针对Tools的强化2针对Planning和Memory的强化利用大模型理解指令的能力和在对应语言
3、承载的通识和泛化能力,增强特定环节的专用模型逐步将业务知识和决策是写死在固定的智能体链(chain)中,构造对应的智能体角色,如“数据分析师”,“欺诈调查员”等针对Tools的强化:NLP模型优化1场景2步骤客服对话历史(文本)-用户是否需要特殊干预?3效果 LLM Agent1基于标注数据,生成若干候选Prompt输入:(1)人工的少量种子标注数据 (2)大量未标注数据输出:NLP模型 LLM Agent2对生成的候选prompt进行打分排序基于选定prompt生成数据 Agent3基于生成的数据训练判别模型人工标注量:减少90%模型交付时间:减少80%模型效果:提升20%步骤1:Promp
4、t生成步骤2:Prompt筛选与数据生成步骤3:模型生成Sample1:xxxxxxxxxxSample2:xxxxxxxxxxxxPrompt1:You are a helpful assistant,and you are an expert in customer servicePrompt1:xxxxxxxxxxPrompt2:xxxxxxxxxxxxPrompt1 is more appropriate for the requirements.样例数据线上推理模型针对Tools的强化:图像反欺诈模型优化1场景2步骤33效果 多模态大模型(如mini-GPT4)基于标注数据,生成描述
5、Prompt输入:(1)人工的少量种子标注图片 (2)大量未标注数据输出:图像欺诈判别模型 基于选定prompt筛选数据会人工迭代校验多轮 基于生成的数据训练判别模型人工标注量:减少95%模型交付时间:减少90%模型效果:提升5%步骤1:Prompt生成步骤2:数据筛选步骤3:模型生成判断人脸核身的图片是否包含恶意攻击2难点:攻击者会不断变换攻击手段,基于历史数据训练的模型难以适应类级别:“This is a spoof face”样例级别:“xxxxxxx”VITCLIP判别模型训练数据线上推理模型针对Tools的强化:1针对的矛盾人工2利用的大模型能力大模型承载的通识:用于生成训练数据大模
6、型的指令理解能力:领域专家可以通过自然语言引导大模型,注入领域理解引用:2 Zhang Y,Yin Z F,Li Y,et al.Celeba-spoof:Large-scale face anti-spoofing dataset with rich annotationsC/Computer VisionECCV 2020:16th European Conference,Glasgow,UK,August 2328,2020,Proceedings,Part XII 16.Springer Internati