当前位置:首页 > 报告详情

使用 Databricks 扩展实时欺诈检测:DraftKings 的经验教训.pdf

上传人: Fl****zo 编号:718740 2025-06-22 22页 1.46MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了DraftKings如何使用Databricks解决实时欺诈检测的挑战。关键点如下: 1. **统一管道**:DraftKings采用单一端到端管道处理批量和流数据,确保特征计算一致性,避免数据偏差。 2. **团队合作**:数据科学和后端工程团队共享相同的工作进度,协作开发。 3. **数据存储**:原始事件以Delta Lake形式存储,便于回放和历史数据填充。 4. **架构挑战**:面临数据偏移、实验周期加快、可解释性和审计准备等问题。 5. **技术选型**:从MS Orleans迁移到Apache Spark,以获得更好的流处理能力。 6. **性能与成本**:通过优化,DraftKings将Databricks DBUs成本降低78%,云基础设施成本降低70%,但P99延迟增加了三倍。 7. **成本优化**:通过合理调整实例大小、水平扩展集群、优化代码等措施,实现成本再降低50%以上,同时保持延迟在SLA范围内。 核心数据引用: - 平均每月独立玩家数:4.8百万 - 大型体育赛事时登录次数:每分钟数万次 - 存款次数:每分钟数千次 - 注册次数:每分钟数百次 总结:DraftKings利用Databricks构建了统一的实时欺诈检测平台,通过跨功能团队合作、数据存储优化和技术选型,实现了高性能与成本效益的平衡。
"如何统一实时欺诈检测? "欺诈检测中延迟与成本的平衡? "Databricks如何助力DraftKings?"
客服
商务合作
小程序
服务号
折叠