当前位置:首页 > 报告详情

专场17.5-网易湖仓一体系统Arctic设计与实践-周劲松.pdf

上传人: 2*** 编号:126945 2023-05-01 24页 1.83MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
网易的湖仓一体系统Arctic,基于Apache Iceberg数据湖格式,旨在解决数据孤岛、研发体系割裂等问题,提供面向流和实时数据处理优化的存储和管理服务。Arctic具备数据自优化机制,支持湖仓共存,提供事务冲突解决和秒级的Data pipeline。关键点如下: 1. 网易数据开发现状与痛点:存在数据孤岛,独立采购和部署存储,冗余存储浪费,研发体系割裂,研发人效低,研发规范不通用,应用层视图合并复杂,指标和语义二义性。 2. Arctic系统简介:Arctic是开放式架构下的湖仓管理系统,提供面向流和更新场景的优化,以及可插拔的数据自优化机制和管理服务。 3. Iceberg和Mixed streaming格式特性:支持schema evolution,hidden partitioning,time travel,serialization isolation,fast scan planning,以及事务冲突解决机制。 4. 案例与成果:在实时营销分析等场景中,Arctic能够优化报表响应时间,实现批量分析到实时生产的流程复用。 5. 未来规划:Arctic将增强管理能力,包括数据湖权限管理,更多监控项和热表慢查询支持,以及多数据中心多云管理。同时,提升OLAP性能,支持sort key,aggregate key和二级索引。 6. 获取信息:可通过GitHub(https://github.com/NetEase/arctic)和官方文档(https://arctic.netease.com/ch/)了解Arctic的更多信息。
根据您提供的数据,我可以为您生成三个问题,每个问题的长度都不会超过10个字,并且尽量吸引目标受众的兴趣。 "网易Arctic如何实现湖仓一体设计?" "Arctic系统在实时数据处理中有何优势?" "网易数据开发中的痛点与Arctic的解决方案是什么?"
客服
商务合作
小程序
服务号
折叠