2025年Apache Hudi沙龙嘉宾演讲PPT合集(共5套打包)

2025年Apache Hudi沙龙嘉宾演讲PPT合集(共5套打包)

更新时间:2025-04-14 报告数量:5份

报告合集目录

报告预览

  • 全部
    • 2025年Apache Hudi沙龙嘉宾演讲PPT合集
      • 《EB级数据湖与智能推荐:抖音集团基于Apache Hudi的Sample Center架构与实践》.pdf
      • 《美团增量湖仓Beluga的架构设计与业务实践》.pdf
      • 《数据与计算新范式:京东数据湖架革新之路》.pdf
      • 《Apache Hudi 在快手AI、BI场景的数据湖实践》.pdf
      • 《Hudi在华为云的大规模应用实践与深度优化》.pdf
请点击导航文件预览
资源包简介:

1、抖集团基于Apache Hudi 的SampleCenter架构与实践2025.03.29 北京快元中耿筱喻|抖集团数据湖存储技术专家、Apache Hudi Committer 姚翔抖集团推荐架构程师EB级训练样本数据流批湖2.LLM序列特征调研能落地实践3.BackFill 特征回溯过程优化4.超数据规模流式湖解决案1.5.数据湖读写加速策略6.数据湖异步服务管理与运维EB级训练样本数据流批。

2、美团增量湖仓Beluga的架构设计与业务实践2025.03.29 北京快元中王萌萌美团数据湖架构团队负责人典型场景2.Beluga的架构与设计3.业务实践4.未来计划1.典型场景-ODS数据入湖 ODS数据语义:全量表、快照表、增量表占存储 可同时存在,物理上相互独立 workload特征:增量数据:存量数据=1:几百keyvaluectimek1v120250322 12:00:00k2v22。

3、数据与计算新范式:京东数据湖架构新之旅2025.03.29 北京快元中张越京东零售资深技术专家数据湖核定位与特性2.京东Hudi核研特性3.业务落地与实践1.背景介绍数 仓 视 角站在数据平台及数仓发展的视角,上述挑战已成为该领域技术架构演进的核心驱动力,即如何以较低成本获取强实时性、高质量的数据,进而推动数据平台及数仓架构不断向流批融合、湖仓一体方向发展,这种技术收敛的架构逐渐成为大数据技术发。

4、Apache Hudi 在快AI、BI场景的数据湖实践2025.03.29 北京快元中钟靓快数据架构研发专家喻兆靖快数据架构研发专家当前快数据湖的态AIBI应背景应场景架构演进应用场景技术演进社区贡献1.BI 场景2.AI 场景3.未来展望BI 应场景ODS Hudi 的应场景 ODS 层更新流湖&志流湖 中间层宽表拼接&增量更新BI 应场景:更新流湖 更新流湖单份存储,成本下降。

5、Apache Hudi在华为云的规模应实践与深度优化2025.03.29 北京快元中孟涛华为云 EI Lakehouse负责、Apache Hudi Committer华为LakeHouse平台介绍2.基于Apache Hudi的湖仓体架构设计3.Apache Hudi在华为内部规模推和深度优化4.统表格式管理服务1.开放生态演进趋势:基于数据湖LakeHouse架构的实时方案真正实现了流批一体。

展开阅读全文
客服
商务合作
小程序
服务号