《Apache Doris 在知乎 AB 实验平台的使用实践 -张潇鹤 知乎.pdf》由会员分享,可在线阅读,更多相关《Apache Doris 在知乎 AB 实验平台的使用实践 -张潇鹤 知乎.pdf(25页珍藏版)》请在三个皮匠报告上搜索。
1、Apache Doris 在知乎 AB 实验平台的应用实践张潇鹤 数据平台开发工程师Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024目录知乎 AB 平台业务背景介绍01知乎 AB 实验平台架构演进历程0203知乎 AB 在 Apache Doris 上
2、的实践04未来展望Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 202401知乎 AB 实验平台业务背景介绍Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Sum
3、mit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024知乎-AB 实验平台介绍 知乎高质量的在线问答社区 AB 实验平台AB 实验的主要目的在于降低风险和分析策略结果。其基本思想是从大盘中取出一小部分流量,随机地将用户分给对照组和实验组,通过收集、分析不同分组用户行为指标数据,再结合统计学方法得出实验结论。大盘流量分流流量抽取实验运行实验组对照组策略A无策略Doris Summit Asia 2024Do
4、ris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024知乎-AB 平台的基本背景介绍知乎 AB 实验平台支撑知乎主站、盐言故事、知乎知学堂等多条业务线,每天平台运行上千个实验。实验进组用户表日均数据量百亿级。支持实验分析场景多样:支持基础计算类、留存类、LTN 类等 4000 多个指标分析,离群值剔除、多
5、维度下钻等。Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024知乎-AB平台进组用户生成逻辑介绍每天的实验进组用户数据量是 DAU 用户的数倍,一个用户携带的实验标签数量级介于数十 上百个不等。分流服务/SDKuser_idab_identer_time
6、用户 A实验1实验组用户A实验2对照组用户A实验进组用户表Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 2024Doris Summit Asia 202402 知乎 AB 实验平台 架构演进历程Doris Summit Asia 2024Doris Summit Asia 2024Doris Sum