《埋点治理驱动精准实验.pdf》由会员分享,可在线阅读,更多相关《埋点治理驱动精准实验.pdf(31页珍藏版)》请在三个皮匠报告上搜索。
1、 埋点治理驱动精准实验演讲人:张逸、查建强0101 业务背景0202 解决方案0303 埋点简介04 04 埋点治理目录CONTENTAB实验分流器随机分流,实验正交,收集数据实验配置灵活调配版本流量,精准圈选目标受众 选择实验位置、指标,预估最小样本量及实验周期效果分析检验方式:序贯检验、Z检验、贝叶斯统计口径:周期去重、按天累计分析手段:指标趋势、人群下钻、留存分析痛点无效样本混入考虑到性能问题,分流调用与实验样本统计存在差异无效用户混入与AA异常高度相关影响实验灵敏度,迭代效率慢指标统计开发效率低T+1的时效难以满足实验需要指标口径不清晰实验查找与复盘当前页面下有多少进行中的实验?实验间
2、是否存在相互影响?解决方案Hive、Iceberg、Clickhouse管理层行为分析数据看板显著性检验用户画像特征训练-元素定位-参数关联-上报时机埋点可视化配置-埋点注册-参数管理-埋点关联-可视化查找埋点元数据管理-实验指标-激活事件-实时分析-可视化查找AB实验管理数据层实时计算-埋点参数条件-统计口径指标管理应用层Kafka、Flink、Java离线计算Spark监控运维解决方案:精准分流选择合适的埋点埋点配置可视化,以找到合适的埋点上报时机配置化,以满足业务分析需求丰富埋点参数前端埋点:收集按钮曝光、点击等行为数据服务端埋点:收集产品信息、算法模型等接口数据前后端埋点关联:不受发版
3、周期影响,参数变更更灵活获取分流版本与是否实际触达用户解耦,通过埋点离线过滤出实际触达的用户精准分流案例实验:酒店满房时下增加用户引导查询酒店获取实验版本详情页曝光是否满房上报分流YY不参与统计N获取房型资源查询酒店获取实验版本详情页曝光上报前端埋点获取房型资源上报分流上报服务端埋点YBeforeAfter解决方案:指标配置化基于埋点参数条件生成实时/离线指标分流明细UBT明细指标组装激活事件分流topicUBT topic小时级趋势Iceberg波动性监控解决方案:限制同位置实验同一个位置下,可进行的实验数是有限的,过多的实验会导致实验间的正交性难以保证对照组实验组实验1对照实验2对照实验1
4、对照实验2实验实验1实验实验2实验实验1实验实验2对照实验1对照实验2对照实验3对照实验1对照实验2实验实验3对照实验1对照实验2对照实验3实验实验1对照实验2实验实验3实验实验1实验实验2实验实验3实验实验1实验实验2对照实验3实验实验1实验实验2实验实验3对照实验1实验实验2对照实验3对照单个实验:2组2个正交实验:4组3个正交实验:8组N个正交实验:2N组解决方案:可视化查找实验位置埋点关联关联关联如何获取服务端实验的实验位置?核心目标数据准确查找方便取数快捷配置灵活埋点:一种常用的数据采集方法用户客户端存储触发操作发送数据数据价值:更好的了解用户的需求数据资产埋点数据标签数据交易数据数
5、据分析数据应用AB实验智能推荐实时投放事件分析页面分析漏斗分析路径分析留存分析人群圈选归因分析数据规模1000亿+/天数据量10W+埋点数约20T/天存储量埋点管理的痛点开发流程不规范开发流程不规范埋点元信息缺失版本迭代管理难数据质量差同一位置重复埋点参数错埋、漏埋参数定义有歧义取数/看数难埋点元信息缺失人工清洗数据分析工具的缺失找埋点难开发效率低依赖于版本发布人工手动校验数据基础功能重复开发代码维护成本高埋点数据的综合治理策略提升埋点数据的准确性、完整性和一致性策略一统一埋点的设计规范策略二建设一站式的埋点管理平台策略三数据治理专项策略一:统一埋点设计的规范化命名规则:业务线_页面_模块_事
6、件类型,保证高可读性;全局唯一:避免数据混淆和冲突;埋点定义参数定义数据规范触发时机安全规范参数命名:避免使用模糊或容易引起歧义;参数格式:字符串、数值、数组、对象等;数据格式:JSON 格式(结构清晰、易读易写、方便传输以及存储);用户操作:点击、曝光、滑动等;系统事件:页面加载、前后台切换等;加密存储:姓名、身份证号、手机号码;脱敏处理:数据加密、掩码、数据模糊化;埋点管理规范参数管理:保障数据的一致性公共参数业务核心参数策略二:建立一站式的埋点管理平台全局视角了解视角指标定义方案设计事件定义参数定义时机定义可