当前位置:首页 > 报告详情

爱奇艺广告数据湖实践.pdf

上传人: s**** 编号:157217 2024-03-16 20页 2.10MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了爱奇艺在广告数据湖实践方面的经验。爱奇艺广告数据架构旨在最大化资源利用效率和投资回报,面临离线时效性差、实时通路容量低等问题。其广告数据湖选型结合了Kafka、Flink、HDFS等技术,实现了实时和离线计算的统一。关键数据点包括:离线数据量2000+,实时数据量300+,存储规模几十PB,kafka QPS 10w+,单表大小3PB,单表列数1000+。 实践中,爱奇艺遇到了小文件问题,导致报表查询时间长,实时入湖小文件暴涨,元数据信息耗时较长。为此,他们引入了write.watermark时间戳字段和双集群HA机制,提高了数据处理效率和系统稳定性。同时,通过实时样本生成、双流关联重试队列等技术,实现了精准的个性化广告推荐。 总结来说,爱奇艺通过构建广告数据湖,优化了广告数据架构,解决了离线时效性和实时容量问题,提高了数据处理效率和广告推荐精准度,实现了业务数据的实时化。
"爱奇艺广告数据湖实践有哪些亮点?" "如何解决广告数据架构中的实时通路容量低问题?" "数据湖在广告行业应用中存在哪些挑战和解决方案?"
客服
商务合作
小程序
服务号
折叠