当前位置:首页 > 报告详情

使用Apache Arrow助力构建数据系统.pdf

上传人: 2*** 编号:147880 2023-12-05 37页 4.45MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
全文主要内容是关于使用Apache Arrow构建数据系统的讨论。文章强调了Apache Arrow的高性能列式内存格式标准,支持跨语言跨系统互操作,以及与现代硬件的兼容性。它还提到了 Arrow Record Batch 数据存储和 Arrow Flight,一个使用 gRPC 或 REST 接口的高性能数据交换框架。文章还讨论了数据系统的构建分解,包括内存数据格式、数据模型、类型系统、元数据管理、查询语言、运算表达式、持久化、索引、并发控制、存储压缩、优化及查询执行API等。此外,还提到了一些在构建数据系统时遇到的坑,如更新频繁、复杂类型处理不完备等。最后,文章感谢了观众的观看。
"Arrow Record Batch如何优化内存使用?" "如何使用Apache Parquet进行列式存储?" "如何通过Arrow Flight实现高效数据传输?"
客服
商务合作
小程序
服务号
折叠