当前位置:首页 > 报告详情

Hudi 数据湖在顺丰的应用实践.pdf

上传人: 2*** 编号:121859 2023-03-29 30页 5.64MB

报告标签

Hudi数据湖应用
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了顺丰科技在数据湖应用实践方面的分享,由数据湖技术负责人唐尚文主讲。顺丰集团业务涵盖了快递物流、供应链管理、数字化物流等多个领域。顺丰科技采用了数据中台、AI中台、大数据平台等技术,实现了数据湖在顺丰的应用。实践方面,顺丰通过实时数据直通车等手段,实现了亿级数据实时入湖,每天增量数据达到1亿。同时,顺丰也遇到了一些挑战,如数据一致性、时效性、稳定性等问题,并针对这些问题进行了优化。顺丰采用了Hudi作为数据湖的存储解决方案,通过优化数据采集、处理流程,提高了数据入湖的效率和稳定性。此外,顺丰还实现了千万级数据更新的提效,通过记录级别索引和Hudi metadata表上的优化,避免了维护第三方组件,做到了轻量级同时易维护。最后,顺丰对数据湖的未来展望进行了阐述,包括查询优化、统一元数据构建、支持更多业务场景等方面。
"顺丰如何利用Hudi数据湖提升业务效率?" "Hudi数据湖在顺丰的应用中遇到的最大挑战是什么?" "顺丰如何通过技术创新实现数据湖的实时数据入湖?"
客服
商务合作
小程序
服务号
折叠