您的当前位置: 首页 > 精彩报告合集 > 会议峰会 > IT互联网 > DataFunSummit 2024数据湖架构峰会嘉宾演讲PPT合集(共23套打包)
DataFunSummit 2024数据湖架构峰会嘉宾演讲PPT合集(共23套打包)

DataFunSummit 2024数据湖架构峰会嘉宾演讲PPT合集(共23套打包)

DataFunSummit 2024数据湖架构峰会嘉宾演讲PPT合集。

更新时间:2024-03-25 报告数量:23份 浏览次数:144

报告合集目录

报告预览

  • 全部
    • DataFunSummit 2024数据湖架构峰会嘉宾演讲PPT合集
      • 蚂蚁基于Paimon数据湖实践.pdf
      • 京东统一存储实践.pdf
      • 2024-科技实时数仓-陈伟强-V2.pdf
      • 2024峰会-京东零售数据湖应用与实践.pdf
      • 爱奇艺广告数据湖实践.pdf
      • 2024数据湖峰会PPT-梁溪-终稿.pdf
      • 实时数据湖Hudi应用解决方案.pdf
      • 数据湖在快手的应用实践_034157.pdf
      • 元数据驱动的数据治理_lrh_20140309.pdf
      • 大模型时代下基于湖仓一体的数据智能新范式 .pdf
      • 陈卓宇-Paimon架构下的数据湖探索PPT.pdf
      • 面向Data+AI时代的数据湖优化与实践.pdf
      • 祝佳俊_网易严选_datafun_20240309.pdf
      • 基于RisingWave构建流式湖仓.pdf
      • Paimon 0.7.pdf
      • Datafun-SmartNews-戢清雨.pdf
      • 开源 Delta Lake 3.0 优势和发展.pdf
      • DataFunSummit 2024-刘嘉承alluxio.pdf
      • datafun2024-数据湖.pdf
      • 京东零售基于主动元数据治理实践与探索.pdf
      • 哔哩哔哩基于Iceberg的智能数据组织优化实践-杨金德-初稿.pdf
      • vivo湖仓一体-徐昱-datafun.pdf
      • Apache Hudi 1.0 新功能预览.final.pdf
请点击导航文件预览
资源包简介:

1、DataFunSummitDataFunSummit#20242024蚂蚁基于蚂蚁基于PaimonPaimon数据湖实践数据湖实践闵文俊-蚂蚁集团-技术专家自我介绍毕业于南京理工大学,毕业后一直从事大数据方向的工作.目前在蚂蚁负责Flink实时计算和数据湖相关的开发工作.应用场景应用场景未来规划未来规划目录目录 CONTENTCONTENT功能改进功能改进PaimonPaimon介绍介绍Data。

2、DataFunSummitDataFunSummit#20242024京东统一存储实践京东统一存储实践王腾蛟-京东零售-数据开发工程师岗0101 概况简介概况简介0202 跨域存储跨域存储目录目录 CONTENTCONTENT0303 分层存储分层存储1 概况-京东数据平台整体架构可视化分析(BIEngine)数据服务(Easy Data)统一元数据服务实时开发平台(Easy Real Time。

3、DataFunSummitDataFunSummit#20242024结合数据湖的结合数据湖的实时数仓架构演进实时数仓架构演进陈伟强 京东 京东科技实时数仓负责人数据湖之前的实时数仓方案数据湖之前的实时数仓方案实时数仓的定义以及常见的实时数仓设计 老版本架构在应用中的问题老版本架构在应用中的问题老版本方案的设计背景及问题 结合数据湖的实时数仓方案结合数据湖的实时数仓方案新方案的演进过程及其收益新。

4、DataFunSummitDataFunSummit#20242024京东零售数据湖应用与实践京东零售数据湖应用与实践陈洪健-京东-大数据架构师背景和痛点背景和痛点迭代和优化迭代和优化效果和收益效果和收益未来展望和规划未来展望和规划目录目录 CONTENTCONTENTDataFunSummitDataFunSummit#202420240101背景和痛点背景和痛点数据实时性和完整性矛盾在线分析。

5、DataFunSummitDataFunSummit#20242024爱奇艺广告数据湖实践爱奇艺广告数据湖实践董丽婷-爱奇艺-高级研发工程师爱奇艺广告爱奇艺广告广告数据架构如何广告数据架构如何数据湖如何对症下药数据湖如何对症下药踩坑踩坑目录目录 CONTENTCONTENTDataFunSummitDataFunSummit#202420240101爱奇艺广告爱奇艺广告爱奇艺广告爱奇艺合约&am。

6、DataFunSummitDataFunSummit#20242024实时湖仓在视频号场景的应用实践实时湖仓在视频号场景的应用实践演讲人:梁溪微信视频号高级数据工程师 梁溪实时湖仓Oteam成员目前负责视频号湖仓架构设计和开发迭代应用实践应用实践未来展望未来展望目录目录 CONTENTCONTENT背景介绍背景介绍项目总结项目总结DataFunSummitDataFunSummit#202420。

7、DataFunSummitDataFunSummit#20242024实时入湖实时入湖HudiHudi应用解决方案应用解决方案杨宣-华为-大数据开发工程师数据集成整体方案数据集成整体方案数据入湖通用方案数据入湖通用方案数据入湖进阶方案数据入湖进阶方案目录目录 CONTENTCONTENTDataFunSummitDataFunSummit#202420240101数据集成整体方案数据集成整体方案。

8、DataFunSummitDataFunSummit#20242024数据湖数据湖在快手的应用实践在快手的应用实践靳国卫 快手姓名:靳国卫目前负责生产社交数据团队10年+数据相关工作经验,主导快手、滴滴、美团核心业务数据体系建设及公司级BI产品的规划及落地擅长OLAP技术和数据湖技术并多场景实践落地数据湖在快手的应用历程数据湖在快手的应用历程问题与挑战、技术选型、应用过程、推广策略、生态建设数据。

9、DataFunSummitDataFunSummit#20242024元数据驱动的数据治理元数据驱动的数据治理李然辉-京东科技-数据资产管理负责人我们面临的时代背景我们面临的时代背景元数据驱动的数据治理元数据驱动的数据治理未来展望未来展望目录目录 CONTENTCONTENTDataFunSummitDataFunSummit#202420240101我们面临的时代背景我们面临的时代背景数字经济。

10、DataFunDataFun#20242024大模型时代下,基于湖仓一体的数据智能新范式陈茏久-阿里云-高级产品专家目录1.大模型爆发带来的数据行业变革3.阿里云AnalyticDB:在AIGC时代下,驱动企业架构升级2.对于企业数据平台的能力变革要求大模型时代来临2023.3.142023.3.162023.3.172022.112023.4.112023.2.25ChatGPT 3.5发布大。

11、DataFunSummitDataFunSummit#20242024PaimonPaimon架构下的数据湖探索架构下的数据湖探索陈卓宇-Paimon社区挑战挑战PaimonPaimon存储实现存储实现CDC IngestionCDC Ingestion数仓业务对存储的期望数仓业务对存储的期望目录目录 CONTENTCONTENTLookUp JoinLookUp JoinDataFunSumm。

12、DataFunSummit#2024面向Data+AI时代的数据湖优化与实践演讲人:李志方 腾讯 高级工程师01AI时代下数据湖面临的挑战02基于PyIceberg的AI训练/推理链路03Apache Iceberg 简介04Iceberg向量表与向量查询目录 CONTENTDataFunSummit#202401AI时代下数据湖面临的挑战数据湖的发展趋势 第一代数据湖(03)只支持分区粒度重写。

13、易严选湖仓体建设实践祝佳俊易严选01现状&问题02实践&效果03未来规划录 CONTENT01现状与问题1 数据架构现状2022:Aapche Iceberg在易严选批流体的实践存在的问题T+1d ODS原始数据准实时湖时调度准实时 ODST+1d DWD每天调度T+h DWD每天调度311T+1DWD产出链路3不同时效不同任务需要等待T+1 ODS数据制作任务完成后才能开始运任。

14、陈梓麟 RisngWave Labs基于RisingWave构建流式湖仓我介绍 陈梓麟(Dylan)RisingWave流数据库内核研发(2022-now)阿云分布式数据库PolarDB-X内核研发(2018-2022)主要作向:SQL查询优化,分布式计算 RisingWave介绍和使场景 使RisingWave的基础概念 RisingWave与流式湖仓 核技术内幕 未来与展望 Agenda什么。

15、实时数据湖 Paimon 0.7 的研发进展李劲松(花名之信)阿里云Apache Paimon is a lake format that enables building a Realtime Lakehouse Architecture with Flink and Spark for both streaming and batch operations.Paimon innovative。

16、DataFunSummitDataFunSummit#20242024SmartNews SmartNews 基于基于FlinkFlink的的IcebergIceberg实时数据湖实践实时数据湖实践戢清雨-SmartNews-数据平台架构师SmartNewsSmartNews数据湖介绍数据湖介绍基于基于Iceberg v1Iceberg v1格式的数据湖实践格式的数据湖实践基于基于FlinkFl。

17、DataFunSummit#2024Delta Lake 3.1 最新最新特征特征刘兆磊(Fred Liu)-Databricks-软件工程师目录目录 CONTENT 2023 回顾 Delta Lake 3.1 最新特性 Update and Merge with Deletion Vector 删除向量 Metadata only optimize on count/min/max 元数据查。

18、Alluxio 3.0分布式数据湖/AI缓存架构的探索和实践Alluxio Staff Engineer,Alluxio PMC Member刘嘉承数据湖/AI世界现状:纷繁复杂的数据平台带来的新挑战Alluxio开源项目、公司历史及开源社区过去十年的演进Alluxio架构、主要功能及核心技术革新Alluxio 2.x-3.x 的演进过程及效果内容概览现状:纷繁复杂的数据平台ALLUXIO 4数。

19、DataFunDataFun#20242024OPPOOPPO数据湖加速大数据湖加速大模型训练模型训练分享人:陈哲嘉 OPPO-高级大数据平台工程师OPPOOPPO数据湖平台介绍数据湖平台介绍Glacier 自研湖仓引擎流批一体大模型任务加速大模型任务加速大模型任务接入数据平台Rust加速大模型任务技术规划技术规划目录目录 CONTENTCONTENTDataFunDataFun#2024202。

20、DataFunSummitDataFunSummit#20242024京东零售基于主动元数据治理实践与探索京东零售基于主动元数据治理实践与探索吕代军-京东-数据架构师数据管理挑战数据管理挑战数据治理体系建设数据治理体系建设主动元数据治理实践主动元数据治理实践总结与未来展望总结与未来展望目录目录 CONTENTCONTENTDataFunSummitDataFunSummit#2024202401。

21、DataFunSummitDataFunSummit#20242024哔哩哔哩基于哔哩哔哩基于IcebergIceberg的智能数的智能数据组织优化实践据组织优化实践杨金德-哔哩哔哩-高级开发工程师智能优化背景智能优化背景智能优化实践方案智能优化实践方案智能优化成果及规划智能优化成果及规划目录目录 CONTENTCONTENTDataFunSummitDataFunSummit#20242024。

22、vivovivo湖仓一体构建历程湖仓一体构建历程背景传统数仓的痛点组件选型及业务接入组件能力增强未来展望背景在增效降本的大背景下,vivo大数据基础团队引入数据湖技术为公司业务部门湖仓加速的场景进行赋能。主要应用在流批同源、实时链路优化及宽表拼接等业务场景。传统数仓的技术痛点链路冗余基于Lambda架构的数仓存在计算、存储冗余,输出口径不一致等缺陷传统数仓的痛点 不支持流批同源升级后的Kappa。

23、许世彦Apache Hudi PMC,Onehouse 开源项目负责人Apache Hudi 1.0 新功能预览提纲Apache Hudi 简介Hudi 1.0 的重新思考Hudi 1.0-beta 的重点新功能 Apache Hudi 简介Apache Hudi 简介开开发发格式格式CDC 增量支持增量支持事事务务+并并发发内置性能内置性能调优调优+更多更多自自动动数据目数据目录录同步同步MO。

展开阅读全文
张5G
张**

该用户很懒,什么也没介绍

会员购买
小程序

小程序

客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部