1、 eBay数据平台化实践和思考演讲人:邵锋AboutWe connect people and build communities to create economic opportunity for all.At eBay,we create pathways to connect millions of sellers and buyers in more than 190 markets around the world.Our technology empowers our customers,providing everyone the opportunity to grow and
2、 thrive no matter who they are or where they are in the world.And the ripple effect of our work creates waves of change for our customers,our company,our communities and our planet.(As of Apr 06.2025 per https:/ 数据按规范治理、脱敏)账户类型、状态等注册地、注册时间等年龄组用户群体划分买家、卖家群体分类(通常基于历史行为数据,比如 Frequency&Monetary Buyer)eB
3、ay Plus计划行为数据-Behaviors客户端Tracking服务器端Tracking行为数据-Behaviors服务器端日志数据 ServedServer LoggingImpression(Page+Module)Service Calls.用户浏览行为 ViewedPage viewsModule views用户交互行为-Engaged站内:Click/Scroll/Mouse move/站外:邮件/广告/消息 的 send/open/click.转换数据-Conversions行为转换事件-Potential Conversions加购物车下单购买竞价出价报价etc.实际成交-P
4、aid Purchases商品价格(地方货币结算、美元汇率结算)税费运费折扣.eBay GMV 数据价值和使用场景基本 Metrics 计算 page count,user count,click trend,CTR,GMV metric,etc.Session 分析 page bounce rate,entry rate,session click count,etc.用户数据联合分析 cohort analysis,user retention,etc.产品维度分析 Heatmap,product analytics,EP analysis,etc.全链路全场景用户Journey/Funn
5、el/Conversion 分析数据架构设计的思考数据架构设计的思考行为数据捕获-客户端 vs 服务器端客户端Tracking会将代码加载在客户端,包括浏览器网页和手机app等等;而服务器端Tracking则会在服务器端使用中间件或添加代码等方式,记录用户与服务器的交互。所以,客户端与服务器端所能得到的结果会有许多不同。如下图所示,服务器端推荐N个商品,而用户在客户端实际上只看到了前3个。行为数据捕获-广度 vs 深度广度(平台)Tracking统一的Tracking方式,覆盖所有领域页面、模块,统一的数据抓取逻辑和数据结构。旨在解决各个业务领域的共有或者跨领域的问题。比如,Web自动化Tra
6、cking。深度(细分领域)Tracking各个细分领域针对各自业务独立设计实现,往往在垂直方向深入,不同业务线之间的数据不确保一致性。此外,数据处理方、消费方的逻辑也与实际业务逻辑紧密关联。不同的Tracking数据源会合并一起做Bot Detection,以及生成会话。分阶段、多维度的Bot DetectionRT+NRT+Daily Batch 的识别规则IAB List for Spiders and Bots某个Device在某一个时间范围内 生成过多的行为数据(device id/ip+agent/)一天内某个IP+agent组合生成过多的session 或者 cookie ids