当前位置:首页 > 报告详情

9-2 预训练技术助力风控对抗能力升级.pdf

上传人: 云闲 编号:102285 2021-01-01 27页 18.74MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了京东零售风控算法团队在预训练技术方面的研究和应用。背景介绍部分阐述了京东零售风控的需求和面临的挑战,包括识别刷单、恶意刷券等恶意行为,以及数据形式和内容风控的特点。NLP预训练部分介绍了京东零售风控在NLP预训练方面的探索,包括数据采集、模型预训练和任务调度等。用户行为预训练部分阐述了行为是风控识别能力的基础,并介绍了用户行为预训练的模型和框架。最后,预训练平台化部分展示了预训练技术在内部的有效使用和工具包的介绍。 核心数据包括:1. 京东零售风控识别的基础,广泛应用于订单、营销、账号等主业务线条,识别量大,整体能贡献风控绝大部分识别量;2. 数据形式为统计特征、序列行为特征,如浏览、访问请求文本;3. 具有字体偏向生僻字,变换较快以绕过风控识别等特点;4. 失效快,模型效果有明显下降,例如引流、恶意订单模型;5. 新场景标签稀缺,人工标注成本高、效率低,负样本标注量级非常大;6. 建模效率低、效果差;7. 长期有效机制—强泛化能力、强覆盖;8. 小样本训练能力—基于无监督预训练的模型微调机制;9. 特征、模型平台化自动生成,快速反应;预训练、大模型带来更强效果。
"如何利用预训练技术提升风控能力?" "预训练技术在用户行为分析中的应用前景如何?" "如何通过预训练平台化实现风控模型的快速部署与迭代?"
客服
商务合作
小程序
服务号
折叠