当前位置:首页 > 报告详情

从 Impala 到 Apache Doris货拉拉用户画像优化实践 - 于敬晖 货拉拉.pdf

上传人: 表表 编号:599481 2025-01-24 26页 6.93MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了货拉拉公司从使用Impala迁移到Apache Doris的过程及实践,以及该迁移对货拉拉画像服务的影响。 主要内容概括如下: 1. 货拉拉画像服务现状:拥有1350万国内货运开城数量,月活司机数和月活用户数分别为百万级别。画像平台为业务方提供人群数量超过10000个。 2. 画像平台架构痛点:在使用Impala时,面临人群计算慢、数据链路导入慢、推送服务稳定性差等问题。 3. Impala > Apache Doris 迁移实践:货拉拉首先进行了组件选型,然后进行了双跑阶段,以Impala为主,Doris接入线上流量。在数据质量方面,Doris和神策查询结果存在差异,经过调整参数和关闭低基数优化功能后,解决了问题。 4. 后续规划:货拉拉计划通过实时业务标签,提升人货匹配效率和体验,并尝试数据湖解决方案,打通埋点AB等应用平台,实现超大规模数据的分析。 综上,货拉拉从Impala迁移到Apache Doris,解决了原有平台面临的计算慢、稳定性差等问题,提升了数据链路的稳定性和人群计算的速度,为后续的大数据分析和业务发展奠定了基础。
"Impala为何会导致画像数据延迟产出?" "Apache Doris在货拉拉画像优化中解决了哪些痛点?" "如何保障Apache Doris的数据质量及稳定性?"
客服
商务合作
小程序
服务号
折叠