当前位置:首页 > 报告详情

杨生杰-基于Gravitino的AI元数据管理设计与实践.pdf

上传人: Fl****zo 编号:624547 2025-03-31 23页 2.45MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了知乎数据平台工程师杨生杰基于Gravitino的AI元数据管理系统设计与实践业务。面临业务增长带来的数据规模爆发增长,知乎推出了自研的中文大语言模型“知海图”和在线AI产品“知乎直达”。文章指出,数据来源多样、半结构化非结构化数据缺少元信息、缺乏中心化的统一元数据服务等问题成为平台元数据管理现状和痛点。随后,文章对比了开源元数据管理工具,并阐述了Gravitino的优势,如插件化设计支持多种数据源、提供统一视图进行管理、支持多种计算引擎等。最后,文章分享了生产实践和总结规划,包括HDFS存储治理、GVFS使用场景、BasicAuth方式web访问等,并提出了后续工作计划和元数据管理愿景。
"Gravitino如何助力AI元数据管理?" "如何在知乎实现数据治理与存储优化?" "AI元数据管理系统有哪些创新特性?"
客服
商务合作
小程序
服务号
折叠