当前位置:首页 > 报告详情

1肖杰宝_20250722.pdf

上传人: 拾亿 编号:751803 2025-07-29 39页 6.53MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了小米在数据管理和处理方面的实践与规划。关键点如下: 1. 数据体系痛点:数据源类型多,管理分散,存在数据孤岛、数据不流通等问题。 2. 元数据中心建设:基于Metacat构建统一元数据中心,支持多引擎和多数据源,实现统一权限管理。 3. AI时代新挑战:海量非表格数据管理和处理需求,资源管理体系割裂,Metacat生态不完善。 4. Data/AI统一元数据中心:采用Apache Gravitino,实现统一元数据管理和治理,支持表格和非表格数据资产管理。 5. 非表格数据管理和处理实践:通过Gravitino Fileset实现HDFS、S3等存储的非表格数据管理,支持数据无感上云,降低存储成本。 6. 未来规划:完成Metacat向Gravitino迁移,探索AI数据湖,利用Gravitino管理更多AI资源。 核心数据:非表格数据管理和处理需求突出,存储降本超70%,涉及5~6个平台的数据处理和训练链路收敛至1~2个平台。
"Gravitino如何助力AI数据管理?" "多模态数据处理,Gravitino有哪些妙招?" "统一元数据中心,小米实践揭秘!"
客服
商务合作
小程序
服务号
折叠