当前位置:首页 > 报告详情

通过高效的数据管道解锁 Lakehouse.pdf

上传人: 张** 编号:167621 2024-06-15 18页 472.70KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Capital One公司和Databricks合作,在数据湖屋(Lakehouse)架构方面取得的进展和经验。Capital One从2014年开始用RESTful API现代化其架构,到2024年完成了向公共云的迁移,并进化其数据湖屋到v2,使用了开放数据格式。面临查询体验差、性能与成本效率低、支持用例有限等挑战,他们通过构建简单、可扩展的数据管道,实现了查询体验的改进、性能的提升和成本的降低。关键点包括:1. 优化计算利用率;2. 利用Databricks工作流和作业集群;3. 确保与开放表格式兼容;4. 构建单一、统一的数据视图。未来,他们计划进一步优化数据加载过程,并实现自我服务能力。
"如何优化数据湖的计算资源?" "如何通过高效的数据管道实现数据湖的解锁?" "如何在数据湖中实现统一的数据视图和消费?"
客服
商务合作
小程序
服务号
折叠