DataFunSummit:2022现代数据栈在线峰会嘉宾演讲PPT合集(共35套打包)

DataFunSummit:2022现代数据栈在线峰会嘉宾演讲PPT合集(共35套打包)

更新时间:2022-10-09 报告数量:35份

8-4 字节跳动 BI 平台实践分享.pdf   8-4 字节跳动 BI 平台实践分享.pdf
9-3 云原生 AI 开发生产平台 IDP 的设计与实现.pdf   9-3 云原生 AI 开发生产平台 IDP 的设计与实现.pdf
7-3 快手智能数据管理2.0.pdf   7-3 快手智能数据管理2.0.pdf
8-2 中原银行敏捷 BI 平台建设实践.pdf   8-2 中原银行敏捷 BI 平台建设实践.pdf
6-1 基于 StarRocks 现代数据栈的典型应用.pdf   6-1 基于 StarRocks 现代数据栈的典型应用.pdf
6-4 字节跳动流式数仓和实时服务分析的思考和实践.pdf   6-4 字节跳动流式数仓和实时服务分析的思考和实践.pdf
4-4 大数据开发 Studio:DolphinScheduler + Notebook.pdf   4-4 大数据开发 Studio:DolphinScheduler + Notebook.pdf
5-3 Byzer一门面向 Data+AI 的云原生语言.pdf   5-3 Byzer一门面向 Data+AI 的云原生语言.pdf
3-2 用智能驾驭数据-QuickTable 智能化路线图.pdf   3-2 用智能驾驭数据-QuickTable 智能化路线图.pdf
4-1 数据集成平台 - SeaTunnel V2 架构演进.pdf   4-1 数据集成平台 - SeaTunnel V2 架构演进.pdf
2-2 字节跳动 LAS 数据湖存储内核揭秘.pdf   2-2 字节跳动 LAS 数据湖存储内核揭秘.pdf
2-5 Presto+Alluxio 加速 Iceberg 数据湖访问.pdf   2-5 Presto+Alluxio 加速 Iceberg 数据湖访问.pdf
1-2 基于 Apache Doris 构建实时统一的现代数据分析平台.pdf   1-2 基于 Apache Doris 构建实时统一的现代数据分析平台.pdf
1-5 T3出行在现代数据栈上的探索和实践.pdf   1-5 T3出行在现代数据栈上的探索和实践.pdf
9-2 阿里云云原生深度学习平台 PAI-DLC 实践与落地.pdf   9-2 阿里云云原生深度学习平台 PAI-DLC 实践与落地.pdf
8-1 Presto on Alluxio 在翼支付 BI 平台的应用实践.pdf   8-1 Presto on Alluxio 在翼支付 BI 平台的应用实践.pdf
6-3 MatrixOne 内核在实时性方面的设计与思考.pdf   6-3 MatrixOne 内核在实时性方面的设计与思考.pdf
5-2 让数据成为工具让分析成为能力.pdf   5-2 让数据成为工具让分析成为能力.pdf
3-4 Kyligence Zen 智能指标中台和指标自动化.pdf   3-4 Kyligence Zen 智能指标中台和指标自动化.pdf
2-4 Lakehouse技术是数据仓库的未来.pdf   2-4 Lakehouse技术是数据仓库的未来.pdf
1-4 从探索式数据分析到现代 BI 仪表盘:Superset 2.0.pdf   1-4 从探索式数据分析到现代 BI 仪表盘:Superset 2.0.pdf
9-1 浅谈以数据为中心的人工智能.pdf   9-1 浅谈以数据为中心的人工智能.pdf
8-3 数据分析与工具.pdf   8-3 数据分析与工具.pdf
7-4 数据驱动业务发展——业务指标数据体系建设及集市治理实践.pdf   7-4 数据驱动业务发展——业务指标数据体系建设及集市治理实践.pdf
7-2 腾讯数据治理技术实践.pdf   7-2 腾讯数据治理技术实践.pdf
6-2 StarRocks 的实时数仓之路.pdf   6-2 StarRocks 的实时数仓之路.pdf
5-4 Apache Spark 在自助分析系统的应用实践与优化.pdf   5-4 Apache Spark 在自助分析系统的应用实践与优化.pdf
5-1 现代数据栈中的消费层 - BI+AI 产品的演进.pdf   5-1 现代数据栈中的消费层 - BI+AI 产品的演进.pdf
4-2 网易数帆在 DataOps 上的实践.pdf   4-2 网易数帆在 DataOps 上的实践.pdf
3-3 联想基于Apache DolphinScheduler构建统一调度中心的应用实践.pdf   3-3 联想基于Apache DolphinScheduler构建统一调度中心的应用实践.pdf
3-1 通过 dbt 把软件开发的最佳实践带到数据领域.pdf   3-1 通过 dbt 把软件开发的最佳实践带到数据领域.pdf
2-3 Iceberg 在华为终端云的探索.pdf   2-3 Iceberg 在华为终端云的探索.pdf
2-1 从 Apache Doris 存算分离到 PALO 的湖仓一体.pdf   2-1 从 Apache Doris 存算分离到 PALO 的湖仓一体.pdf
1-3 基于阿里云实时计算 Flink 构建现代化数据流.pdf   1-3 基于阿里云实时计算 Flink 构建现代化数据流.pdf
1-1 从数据集成到现代数据栈.pdf   1-1 从数据集成到现代数据栈.pdf

报告合集目录

报告预览

  • 全部
    • 2022年DataFunSummit现代数据栈在线峰会嘉宾演讲PPT合集
      • 8-4 字节跳动 BI 平台实践分享.pdf
      • 9-3 云原生 AI 开发生产平台 IDP 的设计与实现.pdf
      • 7-3 快手智能数据管理2.0.pdf
      • 8-2 中原银行敏捷 BI 平台建设实践.pdf
      • 6-1 基于 StarRocks 现代数据栈的典型应用.pdf
      • 6-4 字节跳动流式数仓和实时服务分析的思考和实践.pdf
      • 4-4 大数据开发 Studio:DolphinScheduler + Notebook.pdf
      • 5-3 Byzer一门面向 Data+AI 的云原生语言.pdf
      • 3-2 用智能驾驭数据-QuickTable 智能化路线图.pdf
      • 4-1 数据集成平台 - SeaTunnel V2 架构演进.pdf
      • 2-2 字节跳动 LAS 数据湖存储内核揭秘.pdf
      • 2-5 Presto+Alluxio 加速 Iceberg 数据湖访问.pdf
      • 1-2 基于 Apache Doris 构建实时统一的现代数据分析平台.pdf
      • 1-5 T3出行在现代数据栈上的探索和实践.pdf
      • 9-2 阿里云云原生深度学习平台 PAI-DLC 实践与落地.pdf
      • 8-1 Presto on Alluxio 在翼支付 BI 平台的应用实践.pdf
      • 6-3 MatrixOne 内核在实时性方面的设计与思考.pdf
      • 5-2 让数据成为工具让分析成为能力.pdf
      • 3-4 Kyligence Zen 智能指标中台和指标自动化.pdf
      • 2-4 Lakehouse技术是数据仓库的未来.pdf
      • 1-4 从探索式数据分析到现代 BI 仪表盘:Superset 2.0.pdf
      • 9-1 浅谈以数据为中心的人工智能.pdf
      • 8-3 数据分析与工具.pdf
      • 7-4 数据驱动业务发展——业务指标数据体系建设及集市治理实践.pdf
      • 7-2 腾讯数据治理技术实践.pdf
      • 6-2 StarRocks 的实时数仓之路.pdf
      • 5-4 Apache Spark 在自助分析系统的应用实践与优化.pdf
      • 5-1 现代数据栈中的消费层 - BI+AI 产品的演进.pdf
      • 4-2 网易数帆在 DataOps 上的实践.pdf
      • 3-3 联想基于Apache DolphinScheduler构建统一调度中心的应用实践.pdf
      • 3-1 通过 dbt 把软件开发的最佳实践带到数据领域.pdf
      • 2-3 Iceberg 在华为终端云的探索.pdf
      • 2-1 从 Apache Doris 存算分离到 PALO 的湖仓一体.pdf
      • 1-3 基于阿里云实时计算 Flink 构建现代化数据流.pdf
      • 1-1 从数据集成到现代数据栈.pdf
请点击导航文件预览
资源包简介:

1、字节跳动BI平台实践徐冰泉 火山引擎DataWind技术负责人|DataWind 在字节跳动的使用场景数据探索与分析协作与集成AI能力融合DataWind:字节内部最具影响力的数据产品|130K+月活用户月活用户覆盖75%以上员工,是使用人数最多的数据产品200K+仪表盘超3,000,000张图表,每日查询量超500万次230K+数据模型管理数据量超200PB,超130,000例行任务900+集。

2、 2022 白海科技 版权所有云原生 AI 开发生产平台 IDP 的设计与实现2022-09-17蒋善文,IDP平台负责人 2022 白海科技 版权所有2了解白海白海科技是一家云原生AI基础软件平台服务商,致力于新一代云原生AI开发生产平台的开发和建设,助力企业大规模算法模型生产、降本增效,加速企业智能化转型与创新。团队在AI开发生产平台的建设方面具有丰富经验,自2015年起先后采用Zeppel。

3、快手智能元数据管理倪顺 快手 大数据管理平台负责人|我介绍|倪顺快数据管理平台负责主要关注元数据、数据地图、数据资产治理、数据服务等技术领域主要负责数据管理平台研发01背景介绍元数据管理建设背景元数据管理建设面临问题和挑战03元数据驱动应用数据地图、资产管理数据治理、成本管控02系统架构和关键技术元数据管理的系统化落地实践元数据质量保障、类型系统、血缘分析建设04成果和展望主动元数据平台、智能元。

4、中原银行敏捷BI建设实践许耀辉 中原银行 BI平台负责人|01平台建设业务目标满足不同人群对数据查询、分析和探索的需求,为管理和业务提供数据依赖和决策支撑02敏捷BI平台建设数据分析全流程覆盖,提供一站式、全链路数据分析解决方案03业务场景支撑数据分析场景全场景覆盖04未来展望线上化、智能化以及开放化目录 CONTENT|01平台建设业务目标满足不同人群对数据查询、分析和探索的需求,为管理和业务。

5、基于StarRocks的典型应用StarRocks 谢寅|MPP DATABASESTARROCKS2022STARROCKS|StarRocksMPP Gradual Technical Advance固定分析自助分析离线数据实时数据专用设备通用设备分析型数据库MPP数据库实时MPP数据库分析型智能湖仓应用场景固定报表基于离线数仓的报表、BI和可视化面向实时、探索式自助分析湖仓一体联合分析、智。

6、Copyright 2022 北京火山引擎科技有限公司 All rights reserved.WWW.VOLCENGINE.COM2022/09/17字节跳动流式数仓和实时字节跳动流式数仓和实时分析分析服务的思考和实践服务的思考和实践云原生计算产品团队汪建锋火山引擎云原生实时数仓技术专家字节内部的场景分析字节内部的场景分析字节跳动旗下拥有今日头条、抖音等多款产品,每天服务着数亿用户,由此产生了。

7、大数据开发Studio:DS+Notebook高楚枫 阿里云 EMR团队-开发工程师Active Contributor of Apache DolphinSchedulerEricGao888GitHub|01020405目录CONTENT|大数据开发中的痛点0306DS+Zeppelin DS+JupyterStudio的监控Studio的云上部署方案DS社区参与体验|01大数据开发中的痛点。

8、DBT的下一站:Byzer,一门面向Data+AI的云原生语言祝海林2022.09.17hailin.zhukyligence.io 2022 Kyligence Inc.Confidential.我是谁我是谁祝海林hailin.zhukyligence.io2021+资深数据工程师 Byzer PMC,Kyligence 技术合伙人2017-2020 资深数据工程师 丁香园2015-2016 。

9、张夏天 QuickTable 联合创始人|用智能驾驭数据-QuickTable智能化路线图0101QuickTableQuickTable简介简介0202为什么要用智能驾驭数据为什么要用智能驾驭数据0303QuickTableQuickTable的路线图的路线图0404目前的进展目前的进展-智能文本抽取智能文本抽取目录目录 CONTENTCONTENT|0101QuickTableQuickTa。

10、|新一代数据集成平台Apache Seatunnel(incubator)高俊 白鲸开源 架构师|2关于我开源爱好者开源爱好者10年大数据相关工作,主要从事大数据平台建设、OLAP引擎设计研发工作。开源爱好者,参与多个开源项目的贡献。Apache DolphinScheduler PMCApache SeaTunnel(incubator)ContributorTrino Contributor。

11、火山引擎 LAS 数据湖存储内核揭秘耿筱喻 火山引擎 LAS 研发工程师01LAS 介绍02问题与挑战03LAS 数据湖服务化设计与实践04未来规划目录 CONTENTLAS 介绍01LAS(Lakehouse Analysis Service)湖仓分析引擎湖仓开发工具SparkPrestoFlink批流一体SQL统一元数据统一目录权限管控元数据发现湖仓存储内置存储其他数据源TOSRDSEMRM。

12、Presto+Alluxio加速加速Iceberg数据湖数据湖访问访问BeinanSep 11,2022AgendaPresto&Alluxio01Presto overview and Presto+Alluxio overviewAlluxio&Iceberg02Alluxio and Iceberg ArchitectureBest Practices03Data Cons。

13、SelectDB CTO&Apache Doris Committer衣国垒|基于 Apache Doris 构建实时统一的现代数据分析平台01当前数据分析栈的现状与挑战03Apache Doris 最新特性解读02基于 Apache Doris构建实时统一的数据底座目录 CONTENT04关于我们|01当前数据分析栈的现状与挑战当前数据栈|数据湖应用系统/ERPOracle/sales。

14、李心恺 T3出行 算法平台负责人|什么是Modern Data Stack T3出行的业务场景T3出行MDS的初步打造特征平台 On MDS目 录 CONTENT|什么是Modern Data Stack|Modern Data Stack 特点 Modern:更简单和通用 Data:数据处理领域 Stack:技术栈、技术组件的组合|为什么要有Modern Data Stack u 过去:技术组。

15、阿里云云原生深度学习平台PAI-DLC实践与落地穆冰森2022/09/17主要内容机器学习平台介绍01深度学习平台DLC架构设计02未来展望03机器学习平台需要具备的能力数据处理模型开发模型训练模型部署数据预处理特征处理数据加强等传统机器学习算法深度学习算法模型开发工具多种算法框架自定义算法框架多种数据存储异构硬件多种推理框架自定义推理框架异构硬件机器学习平台PAI产品架构深度学习平台的特性用户。

16、闻一波翼支付大数据研发工程师|Presto on Alluxio 在翼支付Bi平台的应用实践01Presto+Alluxio应用场景02翼支付Bi平台实践03未来规划目录CONTENT|01Presto+Alluxio应用场景|Presto+Alluxio应用场景|加速Bi平台数据查询加速人工智能场景下模型的训练速度统一的数据访问入口Presto+Alluxio 基本架构02翼支付Bi平台实践|。

17、MATRIXONE的系统架构与实时性方面的思考金海 矩阵起源|扫码关注服务号,回复0917,获取PPT有趣、专业、有料,深耕前沿的数据库技术|Speaker|Challenge|Challenge|Challenge|Challenge来源:“十四五”数据库发展趋势与挑战|Challenge|Architecture Overview|File service|Log service|Data 。

18、让数据成为工具让分析成为能力熊星 斗鱼直播 PMO负责人|01数据应用难点 数据团队愿景 难点痛点 问题梳理02数字化之路 数据工具升级 目前成果03未来展望目录CONTENT|近期目标01数据应用难点|斗鱼数据中台愿景TEAM VISION|离线计算平台ODSDWDDWADS数据采集平台埋点KafkaODPSHDOOP知识现状趋势感知信息为什么怎么办规律业务指标迭代智慧预测未来调整策略数据基建。

19、KYLIGENCE ZEN站式云端指标中台宗正 Kyligence 资深技术布道师|01指标建设的挑战02Kyligence Zen03指标动化的核价值04从数据驱动到指标驱动录CONTENT|站式指标中台到 2025 年绝多数将会使数据来优化他们作的乎各个|01指标建设的挑战数字化转型陷阱之“指标孤岛”指标也存在“孤岛”传统的数据分析链路上,指标通常落在 BI 报表或 ETL 宽表|指标散落并。

20、Lakehouse Technology as theFuture of Data WarehousingWenchen FanAboutCloud-based data and AI platform for over 7000 customersOver 10 million VMs processing exabytes of data per dayExabytes of data un。

21、从探索式数据分析到从探索式数据分析到现现代代 BI 仪仪表表盘盘Apache Superset 2.0 介介绍绍2022-09-17yongjiezhaoapache.orgApache Superset 历历史史Apache Superset 最初源于Airbnb 内部项目,多年孵化,现在是GitHub上 Star 最多的数据可视化项目.-First Commit:2015-Version 1。

22、浅谈以数据为中心的人工智能全球领先的AI数据解决方案提供商Global Artificial Intelligence Data Solutions Provider张晴晴Magic Data 创始人兼CEO Data-Centric MLOps 引领者张晴晴曾任中国科学院声学研究所副研究员,从事大词汇连续语音识别的声学建模以及语言建模,巴黎法国国家实验室LIMSI-CNRS 语音交互处理博士后。

23、洞察力与分析工具洞察力与分析工具陈晓维 MagicBI 产品总监|0101业务业务现状现状0202什么是什么是洞察力洞察力0303分析分析工具工具0404分析分析案例案例目录目录 CONTENTCONTENT|0101业务业务现状现状企业数字化转型进展不顺利,洞察力不足企业数字化决策中遇到很多问题|企业数字化决策中遇到很多问题|0202什么洞察什么洞察力力都希望有1秒看透本质的洞察力|球员通过不。

24、数据驱动业务发展-业务指标数据体系建设及集市治理实践张婉绮 京东 数据挖掘工程师|01业务集市现状03未来展望02业务集市治理目录 CONTENT|01业务集市现状业务集市的现状和治理要点业务集市治理背景|数据挖掘及分析数据指导决策业务迭代实践“数据驱动力”通过数据体系系统化地获取及分析数据,为业务决策提供有效支撑,驱动业务发展使用中台能力,系统化构建业务指标体系通过指标及维度呈现波动分析逻辑,。

25、腾讯数据治理技术实践赵磊 腾讯 腾讯元数据系统负责人|01数据治理简介02数据治理管理体系03数据治理技术实践目录CONTENT|01背景介绍初步认识什么是数据治理,为什么要做数据治理,以及如何做数据治理什么是数据治理|DAMA数据管理知识体系指南l 数据治理是对数据资产管理数据资产管理行使权力和控制的活动集合活动集合(规划、监控和执行)。l 数据治理职能指导其他数据管理职能如何执行,数据治理是。

26、StarRocks的实时数仓之路StarRocks PMC 李超勇为什么做实时数仓2更好的适配Flink3后续计划401存储引擎的新进展StarRocks为什么要做实时数仓1.数据从产到消费的周期,从天下降到秒2.数仓使从公司管,下层到线运营员 QPS 从10-1000,响应时间从1min-1s3.实时数据的流量爆发式增。StarRocks单集群,均消费Kafka记录达到1000亿条/sStar。

27、APACHE SPARK APACHE SPARK 在在观远自助分析系统的应观远自助分析系统的应用实践用实践c che Sparkhe Spark 在观远在观远自助分析系统的应用实践自助分析系统的应用实践与优化与优化周翔 观远数据研发工程师|0101观远自助分析产品观远自助分析产品简介简介0202观远自助分析系统的观远自助分析系统的挑战挑战0303相关解决相关解决方案方案0404总结与未来总结与。

28、现代数据栈中的消费层BI+AI产品的演进周远 观远数据 首席科学家|个人简介|花名字节,15年行业经验,曾就职于微策略,阿里云。目前担任观远数据首席科学家,主要负责 BI+AI 产品研发工作。开源爱好者,Apache Arrow,delta-rs 等项目的贡献者。入选2022年度 36kr X36Under36 S级青年创业者名册。01什么是现代数据栈02现代数据栈中的自助分析03Analyti。

29、网易数帆在DATAOPS上的实践李卓豪|网易数帆 有数据研发产品技术负责人|01网易有数网易有数03实践效果实践效果目录目录CONTENT|02网易如何实践网易如何实践DataOps网易有数网易有数01|?2006分布式数据库、分布式文件系统、分布式搜索引擎,三驾马车支撑了网易互联网2.0时代的产品2009开始基于Hadoop做数据分析以及运维2014大数据平台猛犸、网易有数上线,加速了大数据规。

30、演讲人:李岗演讲人:李岗Apache DolphinScheduler PMC&CommitterApache Local Community Beijing Member联想联想-资深数据架构优化工程师资深数据架构优化工程师|联想基于联想基于Apache DolphinSchedulerApache DolphinScheduler构建统一调度中心的应用实践构建统一调度中心的应用实践|。

31、通通过过 dbt 把把软软件开件开发发的最佳的最佳实实践践带带到到数据数据领领域域Chenyu Li,Sr Software Engineer,dbt Labs因为dbt还是一个比较新的产品,社区也主要集中在美国欧洲,很多材料并没有中文翻译,我会尽量用中文讲解,做的不好的地方还请大家见谅。传统传统数据分析中的流程数据分析中的流程问题问题云原生数云原生数仓带仓带来的机会来的机会dbt 想要提供的解。

32、Huawei Proprietary-Restricted Distribution1Iceberg 在华为终端云的探索李立伟 华为 大数据高级工程师|2|整体概述目录特性应用未来规划整体概述Part4|Hadoop一体机一体机PC时代2000s-互联网时代2010s-移动互联网时代HadoopMPPDBAI分布式+Cloud分布式+通用服务器集群+一体机单机+小机湖仓一体Data Lakeho。

33、从DORIS存算分离到PALO的湖仓一体彭翔宇 百度 资深研发工程师|01DORIS历史回顾02DORIS数据结构03存算分离04PALO湖仓一体目录 CONTENT|01DORIS历史回顾Apache Doris历史回顾,诞生于百度,孵化于 Apache 软件基金会|诞生诞生于INF DT,解决凤巢报表问题2008推广百度全面推广,普及使用2012开源在 GitHub 开源2017捐赠进入 A。

34、基于阿里云实时计算Flink构建现代化数据流晟柏 阿里云计算 产品经理|01什么是数据流02现代数据流趋势03现代数据流特性总结04现代数据流最佳实践目录CONTENT|01什么是数据流数据流概述|数据流表面的含义指数据从输入到输出端的流动,在实践中也称为数据集成。是指一系列用来帮助企业使用、整合和利用各种数据的实践、工具和架构程序。除了整合不同系统的数据外,数据集成还可以确保数据干净、准确,优。

35、徐榜江(雪尽)Flink CDC Maintainer&Apache Flink Committer|从数据集成到现代数据栈01数据集成02数据集成工具03现代数据栈04现代数据栈实践目录|数据集成Data Integration01|n数据集成数据集成是将多个分散的数据源,在逻辑或物理上有机地集中,为企业解决数据孤岛问题,通过统一的数据视图为企业提供决策支持。n目的数据集成的目标是对数。

展开阅读全文
客服
商务合作
小程序
服务号
折叠