《李雨柯-金融AIGC安全攻防构建大模型时代的数字内容风控体系.pdf》由会员分享,可在线阅读,更多相关《李雨柯-金融AIGC安全攻防构建大模型时代的数字内容风控体系.pdf(47页珍藏版)》请在三个皮匠报告上搜索。
1、金融AIGC安全攻防构建大模型时代的数字内容风控体系李雨珂|网易易盾AI算法负责人李雨珂网易易盾AI算法负责人网易智企算法专家,信通院专家委员会成员,目前负责数字内容风控领域的人工智能算法研究,曾获得浙江省科学技术进步奖一等奖、中国人工智能产业发展联盟年度创新人物等奖项,所带团队多次在音视频伪造检测、大模型安全等领域的人工智能算法竞赛中获得最高荣誉,拥有多项数字安全领域的发明专利并发表多篇国际期刊和会议论文。目 录CONTENTSI.AIGC安全防御的技术困局II.弹性纵深防御技术架构III.工程化实践关键突破IV.金融场景应用与前沿展望AIGC安全防御的技术困局PART 01生成式AI技术演
2、进图谱传统逻辑:规则驱动 以明确的规则和算法为核心,生成内容可预测性强,但缺乏灵活性和创造力。AIGC逻辑:数据驱动+模型推理 模型通过大规模数据训练,理解上下文语义,生成高质量的、拟人化的内容。核心跃迁:从规则到智能Zhang,Xinjie,et al.Unified Multimodal Understanding and Generation Models:Advances,Challenges,and Opportunities.arXiv preprint arXiv:2505.02567(2025).生成式AI技术演进图谱基于显式规则缺乏上下文关联依赖人工干预语义理解的差异基于深度
3、学习的隐式语义建模。多层次语义关联自适应能力强传统语义理解:AIGC语义理解:Zhang,Xinjie,et al.Unified Multimodal Understanding and Generation Models:Advances,Challenges,and Opportunities.arXiv preprint arXiv:2505.02567(2025).生成式AI技术演进图谱剪刀差效应生成质量提升速度检测技术迭代速度Huge Gap技术更新情况时间 t金融行业大模型常见应用场景中的风险对抗场景痛点监管法规/要求智能客服/投顾(咨询对话)咨询对话过程中存在虚假宣传、过度承诺
4、、暗示收益、诱导的内容对话内容不礼貌用语,用词不当,有损企业形象模型生成内容不合规、不可控AIGC生成内容变异快,对抗难中华人民共和国广告法中华人民共和国消费者权益保护法互联网信息服务深度合成管理规定生成式人工智能服务管理暂行办法业务过程内控征信报告审核:针对客户征信报告的不良信息检测通信内容监控:对内监控高管负面、薪资待遇等短信:营销获客、催收、关怀短信合规营销/催收外呼:过度承诺风控,服务质检视频银行:利用视频银行从事违法违规事项(如诈骗、违法交易等)金融科技发展规划(2022-2025年)金融客户资料昵称、头像、个签违规互联网用户账号名称管理规定金融信息流资讯/论坛模块:涉黄政暴引流,内
5、部待遇等话题、高管负面金融产品/购物商城:虚假营销、广告法违规、捆绑销售金融直播间:主播言行不当、粉丝言论不当、背景图片/音乐违规中华人民共和国消费者权益保护法金融信息服务管理规定网络信息内容生态治理规定中华人民共和国广告法网络直播营销管理办法行业内特性 和 行业间共性金融行业大模型常见应用场景中的风险对抗AIGC生成内容不可控:歧视偏见,科技伦理我们的产品不适合像您这样的老年人。这个问题这么简单,怎么连你这样的年轻人都不懂?我们不服务像您这样的低收入群体。您的性别可能不适合投资这类产品。我们不接待像您这样有特殊需求的客户。我们不会记录您的对话内容,但会使用它来改进服务。您的个人信息是保密的,
6、除了我们用于营销分析。我们不会泄露您的数据,但合作伙伴可能会看到。女性投资者可能更适合保守型投资。这个投资策略只适合白人客户。我们不向少数族裔提供贷款服务。您的宗教信仰可能与我们的投资理念不符。我们不建议像您这样的外国人投资本地市场。根据您的个人背景和教育经历,推荐您购买xx理财产品。我们的服务经过优化,能够针对高净值客户优先提供投资建议。智能客服智能投顾金融行业大模型常见应用场景中的风险对抗对营销人员的暗示收益、虚假宣传、过度承诺等进行质检,提升营销过程合规性,发现并解决营销中存 在 的问题。通过语音质检对客服团队的行业话术规范和合规性、服务态度、业务流程及标准等进行检测,发现客服问题提升服