当前位置:首页 > 报告详情

琚克俭-AICon深圳2025-Daft-面向AI的多模数据湖计算引擎.pdf

上传人: b**** 编号:890156 2025-08-24 32页 6.04MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据《AI带来的数据湖变革》演讲内容,全文主要围绕Daft多模计算框架及其在数据湖中的应用展开。以下是关键点: 1. 数据湖变革:从Database到Dataset,从Table/View到Volume/Model/Function,处理从纯文本扩展到多模态数据。 2. Daft多模计算定位:统一多模与结构化数据,支持CPU与GPU异构计算,统一DaftFrame与SQL,实现预处理、推理和训练的统一。 3. Daft核心场景:支持CPU+GPU异构计算,基于Ray的流式计算,实现数据预处理、推理和训练。 4. Daft+Lance数据湖新范式:统一大小列存储,实现Zero-Cost Data Evolution,透明编码,高性能随机点查。 5. Daft大规模数据处理实践:通过火山引擎新方案架构,实现数据预处理、推理标注、模型训练等。 6. 未来展望:支持更丰富的多模类型,Lance生态对接,基于Rust性能提升,可观测性增强。
"Daft多模计算,未来数据处理新篇章?" "数据湖变革,Daft+Lance如何引领?" "AI时代,多模数据处理挑战与Daft解决方案!"
客服
商务合作
小程序
服务号
折叠