当前位置:首页 > 报告详情

肖杰宝-数据多云论坛终.pdf

上传人: 张** 编号:168913 2024-07-06 43页 3.34MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了小米在数据/AI一体化的湖仓多云实践方面的探索。主要内容包括: 1. 湖仓多云架构探索实践:小米早期引入Iceberg,探索构建数据湖平台,实现湖仓元数据统一管理,存算分离+多云架构。近几年,小米进一步探索Data/AI非表格数据管理,引入Paimon,实现非表格数据多云一体化实践。 2. 湖仓表格数据多云实践:基于Iceberg的多云存储探索,小米实现湖仓表格数据的存储降本,存储成本降低50%,作业提效20%。 3. Data/AI非表格数据多云一体化实践:非表格数据痛点分析,小米自研解决方案,引入Apache Gravitino,实现非表格数据统一管理,降低存储成本。 4. 未来规划:小米计划在AI场景持续打磨Gravitino Fileset相关能力,支持更多存储类型,并探索通过CSI Driver / FUSE挂载Fileset的能力。同时,基于Gravitino统一数据湖管理,迁移Iceberg Catalog管理能力,管理Paimon,并完成Metacat体系向Gravitino的迁移。 综上,小米通过湖仓多云实践和非表格数据多云一体化实践,实现存储降本和业务提效,并将继续优化技术方案,推动数据湖管理向更高效、更开放的Gravitino迁移。
"小米如何实现数据湖与多云存储的融合?" "小米在非表格数据管理方面的创新实践有哪些?" "未来,小米数据管理战略将如何演进?"
客服
商务合作
小程序
服务号
折叠