当前位置:首页 > 报告详情

1、胡家煊-流批一体在字节特征平台的实践.pdf

上传人: 云闲 编号:101865 2021-01-01 33页 5.91MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了字节跳动推荐系统在特征平台架构方面的实践与探索。文章首先阐述了抖音推荐业务场景和推荐平台架构演进,从基于MapReduce、Storm搭建的各种profile服务,到引入Flink并拥抱大数据生态,再到基于Flink SQL构建以离线计算为核心的特征生产平台,最后探索流批一体的架构。接着,文章详细介绍了Darwin特征平台的存储服务、特征计算、在线查询、特征订阅和OLAP分析等核心服务计算引擎和数据源管理等方面的内容。然后,文章提出了流批一体实践中的核心问题,包括计算一体、存储一体、特征回溯等,并给出了一系列解决方案,如使用Flink SQL的流批一体能力、外置StateBackend、特征入湖等。最后,文章对未来的规划进行了展望,包括全面迁移Flink SQL、提高自动化运维程度等。
"字节跳动如何实践流批一体技术?" "如何解决推荐系统中的特征全局视图问题?" "字节跳动在特征平台架构上有哪些未来规划?"
客服
商务合作
小程序
服务号
折叠