DataFunSummit 2025 数据湖·存储、计算与AI融合创新峰会嘉宾演讲PPT合集(共26套打包)

DataFunSummit 2025 数据湖·存储、计算与AI融合创新峰会嘉宾演讲PPT合集(共26套打包)

更新时间:2025-04-14 报告数量:26份

陈琦-Apache Doris 湖仓一体技术解析v2.pdf   陈琦-Apache Doris 湖仓一体技术解析v2.pdf
胡争-下一代多模数据湖Lance的设计和实践0327.pdf   胡争-下一代多模数据湖Lance的设计和实践0327.pdf
韩旭-流数据直接入湖.pdf   韩旭-流数据直接入湖.pdf
蔚来李宇彬-基于 Paimon 的实时湖仓实践.pdf   蔚来李宇彬-基于 Paimon 的实时湖仓实践.pdf
谯从彬-大规模实时GraphRAG湖仓技术和实践.pdf   谯从彬-大规模实时GraphRAG湖仓技术和实践.pdf
江进-阿里云Hologres+Paimon湖仓一体解决方案.pdf   江进-阿里云Hologres+Paimon湖仓一体解决方案.pdf
陈世云+B站模型训练存储加速实践(1).pdf   陈世云+B站模型训练存储加速实践(1).pdf
陈韦廷-Apache Gluten的现在与未来.pdf   陈韦廷-Apache Gluten的现在与未来.pdf
王萌萌-美团增量湖仓Beluga的架构设计与业务实践.pdf   王萌萌-美团增量湖仓Beluga的架构设计与业务实践.pdf
胡嘉琪:数据湖迈向Data+AI 一体化平台的演进之路.pdf   胡嘉琪:数据湖迈向Data+AI 一体化平台的演进之路.pdf
李劲松-流批一体数据湖的云原生挑战.pdf   李劲松-流批一体数据湖的云原生挑战.pdf
杨关锁-StarRocks x Iceberg 云原生湖仓分析技术揭秘与最佳实.pdf   杨关锁-StarRocks x Iceberg 云原生湖仓分析技术揭秘与最佳实.pdf
孙建强-多源湖仓数据集成在小米的应用与实践.pdf   孙建强-多源湖仓数据集成在小米的应用与实践.pdf
张明磊-Iceberg行级更新在B站的创新与实践 .pdf   张明磊-Iceberg行级更新在B站的创新与实践 .pdf
刘一鸣_Data Warebase:实时湖仓·多模检索.pdf   刘一鸣_Data Warebase:实时湖仓·多模检索.pdf
李灿-腾讯云TBDS在iceberg数据湖上的治理实践.pdf   李灿-腾讯云TBDS在iceberg数据湖上的治理实践.pdf
宋辛童-Flink 2.0助力数据湖AI实时化.pdf   宋辛童-Flink 2.0助力数据湖AI实时化.pdf
包锴楠+DataLake Governance 小米数据湖一体化智能治理实践.pdf   包锴楠+DataLake Governance 小米数据湖一体化智能治理实践.pdf
杨生杰-基于Gravitino的AI元数据管理设计与实践.pdf   杨生杰-基于Gravitino的AI元数据管理设计与实践.pdf
徐榜江-Fluss湖流一体架构:详解Fluss Lakehouse Storage.pdf   徐榜江-Fluss湖流一体架构:详解Fluss Lakehouse Storage.pdf
徐国政-淘天-客运基于Alake(paimon+spark+StarRocks)的湖仓建设实践(2).pdf   徐国政-淘天-客运基于Alake(paimon+spark+StarRocks)的湖仓建设实践(2).pdf
周鸿-Apache Paimon数据湖在抖音集团短视频场景运用.pdf   周鸿-Apache Paimon数据湖在抖音集团短视频场景运用.pdf
吴文超-基于Paimon的数据湖技术在Shopee的应用.pdf   吴文超-基于Paimon的数据湖技术在Shopee的应用.pdf
关涛-AI时代数据湖的“拐点”与展望 20250328_v0.6.pdf   关涛-AI时代数据湖的“拐点”与展望 20250328_v0.6.pdf
于汝国-京东流量资产基于湖仓架构的落地实践(1).pdf   于汝国-京东流量资产基于湖仓架构的落地实践(1).pdf
史少峰-Gravitino数据治理新范式.pdf   史少峰-Gravitino数据治理新范式.pdf

报告合集目录

报告预览

  • 全部
    • DataFunSummit 2025 数据湖·存储、计算与AI融合创新峰会嘉宾演讲PPT合集
      • 陈琦-Apache Doris 湖仓一体技术解析v2.pdf
      • 胡争-下一代多模数据湖Lance的设计和实践0327.pdf
      • 韩旭-流数据直接入湖.pdf
      • 蔚来李宇彬-基于 Paimon 的实时湖仓实践.pdf
      • 谯从彬-大规模实时GraphRAG湖仓技术和实践.pdf
      • 江进-阿里云Hologres+Paimon湖仓一体解决方案.pdf
      • 陈世云+B站模型训练存储加速实践(1).pdf
      • 陈韦廷-Apache Gluten的现在与未来.pdf
      • 王萌萌-美团增量湖仓Beluga的架构设计与业务实践.pdf
      • 胡嘉琪:数据湖迈向Data+AI 一体化平台的演进之路.pdf
      • 李劲松-流批一体数据湖的云原生挑战.pdf
      • 杨关锁-StarRocks x Iceberg 云原生湖仓分析技术揭秘与最佳实.pdf
      • 孙建强-多源湖仓数据集成在小米的应用与实践.pdf
      • 张明磊-Iceberg行级更新在B站的创新与实践 .pdf
      • 刘一鸣_Data Warebase:实时湖仓·多模检索.pdf
      • 李灿-腾讯云TBDS在iceberg数据湖上的治理实践.pdf
      • 宋辛童-Flink 2.0助力数据湖AI实时化.pdf
      • 包锴楠+DataLake Governance 小米数据湖一体化智能治理实践.pdf
      • 杨生杰-基于Gravitino的AI元数据管理设计与实践.pdf
      • 徐榜江-Fluss湖流一体架构:详解Fluss Lakehouse Storage.pdf
      • 徐国政-淘天-客运基于Alake(paimon+spark+StarRocks)的湖仓建设实践(2).pdf
      • 周鸿-Apache Paimon数据湖在抖音集团短视频场景运用.pdf
      • 吴文超-基于Paimon的数据湖技术在Shopee的应用.pdf
      • 关涛-AI时代数据湖的“拐点”与展望 20250328_v0.6.pdf
      • 于汝国-京东流量资产基于湖仓架构的落地实践(1).pdf
      • 史少峰-Gravitino数据治理新范式.pdf
请点击导航文件预览
资源包简介:

1、Apache Doris 湖仓一体技术解析陈琦 飞轮科技 内核开发工程师Apache Doris Committer目录02 Apache Doris 企业级湖仓构建03 Apache Doris 湖仓一体技术解析04 Apache Doris 湖仓一体未来规划01 Lakehouse 核心价值与范式1Lakehouse 核心价值与范式湖仓分离 VS 湖仓一体无法兼顾湖和仓的优势。湖仓分离数据割。

2、Lance的设计和实践演讲人:黄昭伟 火山引擎 EMR Lance 引擎研发(Lance Committer)下一代多模数据湖演讲人:杨华华 火山引擎 EMR Lance 引擎研发(Lance Committer)多模数据处理挑战01Lance数据湖介绍02Lance核心技术特点03Lance数据湖演示04目 录CONTENTSLance数据湖优化05多模数据处理挑战The changeswit。

3、流数据直接入湖演讲人:韩旭 AutoMQ 内核负责人AutoMQ Table TopicAutoMQ Table Topic流与数据湖Streaming and LakeHouse01Table Topic 架构介绍Introduction of Table Topic02Table Topic 架构优势Differences of Table Topic03产品演示Demo04目 录CONTE。

4、基于 Paimon 的实时湖仓实践演讲人:李宇彬 资深工程师蔚来实时湖仓架构的演进Evolution of Real-Time Lakehouse Architecture01引擎底座实践及增强Engine Practice&Enhancement02平台化体系建设Platform Construction03未来规划Work Plan04目 录CONTENTS实时湖仓架构的演进Evol。

5、大规模实时GraphRAG湖仓技术和实践演讲人:谯从彬 实时GrpahRAG挑战01实时大规模知识图谱构建02湖仓一体技术实践03未来展望04目 录CONTENTS实时GrpahRAG挑战GraphRAG链路L LL LM M用用户户检检索索器器任务描述查询样本提提示示词词工工程程知知识识库库预训练微调搜索相关文档提示词+提示词查询结果索引训训练练数数据据领领域域数数据据智智能能体体Vector。

6、阿里云阿里云Hologres+Paimon湖仓一体解决方案湖仓一体解决方案阿里云计算平台事业部资深技术专家2025/03从分析服务一体到一体化实时湖仓,持续演进的湖仓一体能力江 进构建一体化实时平台的挑战系统架构演进高成本、高TCO数据管理和优化依然困难存储层:湖和仓没有统一,全仓、全湖、湖仓一体?计算层:离线计算实时性太差,流计算太贵多个数据存储系统,多个元数据管理系统Lambda架构、存储两。

7、演讲人:陈世云 B站资深开发工程师B B站模型训练存储站模型训练存储加速实践加速实践背景Background01方案选型Design Selection02挑战及应对方案Challenges and Solutions03未来规划Future Plans04目 录CONTENTSB站模型训练存储加速实践背景B站模型训练存储架构B站模型训练存储加速实践数据归集和预处理阶段模型训练阶段 高吞吐、大容。

8、A middle layer responsible for offloading JVM-based SQL engines execution to native engines.演讲人:Weiting Chen Intel Software ManagerApache Gluten Intro.DataFunSummit 2025Apache Gluten IntroductionIntr。

9、演讲人:王萌萌 美团数据湖架构团队负责人美美团增量湖仓团增量湖仓Beluga的架构的架构设计与业务实践设计与业务实践DataFunSummit 2025典型场景Typical Scenarios01Beluga的架构与设计The Architecture and Design of Beluga02业务实践Business Practice03未来计划Work Plan For Future04。

10、数据湖迈向Data+AI体化平台的演进之路演讲:胡嘉琪?腾讯云数据产品经理AI 时代 IT 架构以数据为核Data Intelligence智能驾驶 Data?Centric 架构数据分析StreamStream实时流式数据服务,作为AL训练&推理数据输5在线推理在线推理9模型训练模型训练6模型评估模型评估7模型部署模型部署8训练样本实时路况、车载雷达等数据驶数据上报驶数据上报0数据版本。

11、演讲人:李劲松 阿里云数据湖平台负责人流批一体数据湖的云原生挑战数据湖落地实践01云上数据湖挑战02云原生湖产品化03目 录CONTENTS数据湖落地实践存储的弹性、计算的弹性云上数据湖半结构化支持、元数据管理非结构化数据湖赋能 AI流批一体、湖仓一体实时数据湖针对湖格式的设计数据湖元数据数据湖快速发展的 2025您公司的LOGO1Paimon无主键表,支持流写流读自动小文件合并流式日志入湖2P。

12、StarRocks x Iceberg:云原生湖仓分析技术揭秘与最佳实践演讲人:杨关锁 镜舟科技研发工程师StarRocks Lakehouse架构介绍01StarRocks x Iceberg 极致性能揭秘02StarRocks x Iceberg最佳实践03近期规划04目 录CONTENTSStarRocks Lakehouse架构介绍什么是LakehouseLakehouse兼具数据湖、数。

13、多源湖仓数据集成在小米的应用与实践分享人:孙建强现状介绍01多源湖仓架构02应用实践03未来计划04目 录CONTENTS现状介绍现状介绍数据开发平台整体架构现状介绍核心问题多源异构安全合规数据质量线上业务数据库选型多用户需求多样跨团队、跨业务、跨区域数据安全隐私时效性、准确性、完整性现状介绍数据集成服务现状介绍集成服务应用规模当前支持系统17种托管任务数5万+日均实时入湖100亿+托管数据源5。

14、DataFunSummitDataFunSummit#20252025Iceberg行级更新在B站的创新与实践 张明磊哔哩哔哩资深开发工程师Contents从交互式分析到多场景探索的技术演进行级更新的业务背景新技术的设计与思考业务落地与实践效果未来规划从交互式分析到多场景探索的技术演进2021年Q2Z-order 支持2021年Q2观远报表2021年Q3取数服务2021年Q4索引支持2021年Q。

15、刘一鸣 ProtonBase 产品&解决方案负责人Data WarebaseData Warebase:实时湖仓:实时湖仓多模检索多模检索刘一鸣,小质科技产品与解决方案负责人曾任阿里云自研大数据(MaxCompute&Hologres)产品组负责人,花名合一,推动湖仓一体、离线实时一体、大数据 AI 一体等多个产品创新方案落地,推动实时数仓行业标准成熟。在大数据、数据仓库、开源软。

16、演讲人:李灿 腾讯云TBDS后台开发腾讯云TBDS在iceberg数据湖上的治理实践DataFunSummit 2025TBDS大数据平台01Iceberg数据湖治理的痛点02TBDS在Iceberg湖治理上的实践和优化方案03未来展望04目 录CONTENTSDataFunSummit 2025TBDS大数据平台TBDS(Tencent Big Data Suite)是基于腾讯多年大数据实践,。

17、演讲人:宋辛童阿里云 Flink Java 引擎负责人,Flink PMC&2.0 Release ManagerApache Flink 2.0:助力数据湖 AI 实时化DataFunSummit 2025Flink 2.0 概述01存算分离状态管理02Streaming Lakehouse03AI 实时化探索04目 录CONTENTSDataFunSummit 2025Flink 2。

18、小米数据湖一体化智能治理实践演讲人:包锴楠 小米-软件研发工程师DataLake Governance多湖表格式治理挑战01一体化智能治理实践02总结与展望03目 录CONTENTS多湖表格式治理挑战现状 小米数据湖平台集成了Iceberg、Paimon、Fileset等多种数据湖格式,以满足多样化的用数需求。目前已管理10万+表格、百PB 数据,日均产生40万+优化任务离线场景实时场景AI 场。

19、演讲人:杨生杰 基于基于GravitinoGravitino的的AIAI元数据管理元数据管理系统系统设计与实践设计与实践业务背景Bussiness Background01Work Challenge02生产实践Problem Solving Progress03总结和规划Summart&Planning04目 录CONTENTS系统设计业务背景B u s i n e s s B a c。

20、演讲人:徐榜江(雪尽)阿里云-开源大数据平台-Flink 数据通道负责人 Apache Flink PMC Member&Flink CDC LeadFluss 湖流一体架构:详解 Fluss Lakehouse StorageFluss 简介01Fluss 湖流一体架构设计02Fluss 湖流一体最佳实践03未来规划04目 录CONTENTSFluss 简介聊聊 AI 对 Data I。

21、演讲人:徐国政 数据技术专家淘天集团-客运基于Alake(Paimon+Spark+StarRocks)的湖仓建设实践客运业务01客运数据架构演进02客运湖仓架构03未来展望06目 录CONTENTS应用场景04阶段成果05客运业务承接大淘系服务与体验业务客运业务-业务核心流程数万客服数亿咨询千万智能客运业务-业务特点复杂的处理过程丰富的数据源丰富的数据应用 DBMS 日志、订单等 半结构化/非。

22、2025.03.28周鸿 抖集团 实时数据专家Apache Paimon数据湖在抖集团短视频场景运 实时架构在业务场景运&挑战 数据湖元数据建设治理 x AI融合 当前探索及未来规划录实时架构在业务场景运&挑战流+批流批体湖仓体存储ETL:流(Kafka)、批各套(Hive)在线分析:新存储(clickhouse/doris)ETL:流(Kafka)、批(Hive)基本各套 在线。

23、演讲:吴超 数据程师基于Paimon的数据湖技术在Shopee的应DataFunSummit 2025Paimon使场景概览Summary of Paimon Usage01准实时数仓搭建Near Real-Time Data Warehouse Construction02ODS层升级加速ODS Layer Upgrade Acceleration03 录CONTENTSDataFunSumm。

24、演讲人:关涛-云器科技联合创始人CTO2025.3.28 AI时代,数据湖的“拐点”与展望DataFunSummit 2025自我介绍2006年,微软亚洲研究院,构建微软第一代分布式KV系统SearchRepository(7000台物理服务器规模)和 Bing搜索的分布式存储后台Kirin Store(4万台规模)。之后加入微软美国云计算和企业事业部,主持和参与开发了包括 Cosmos/Sco。

25、京东零售-集团数据计算平台于汝国/技术专家京东流量资产基于湖仓架构的落地实京东流量资产基于湖仓架构的落地实践践背景与痛点01挑战与优化02收益与表现03总结与展望04目 录01 背景与痛点Lambda架构湖仓一体架构离线与实时异构 链路冗余,成本较高 数据口径不一致数据重复问题离线T+1数据时效,SLA压力较大统一数据口径,减少存储成本基于Hudi事务能力,实现EOS(Exactly-Once 。

26、2025 数据湖峰会Apache Gravitino(incubating):数据湖治理新范式史少锋/Datastrato2025 数据湖峰会新时代下数据湖管理的新挑战Apache Gravitino 整体架构设计为什么需要 Rest Catalog(以Iceberg 为例)使用Gravitino实现对多种数据湖的统一管理2025 数据湖峰会01新时代下数据湖管理的挑战2025 数据湖峰会多云导。

展开阅读全文
客服
商务合作
小程序
服务号