当前位置:首页 > 报告详情

2020年终大会-大数据应用:9-4.pdf

上传人: li 编号:29887 2020-12-01 35页 3.89MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Impala 3.4在网易的优化实践。Impala是一个开源的OLAP引擎,具有高并发和低延迟的交互式SQL查询能力,能够对接HDFS/HBase/Kudu中的数据。文章首先阐述了Impala的定位、优势以及架构,然后详细介绍了Impala对接Iceberg的实践,包括创建Iceberg表、查询Iceberg表以及支持的分区类型等。同时,文章还介绍了Impala管理系统的增强功能,如Profile解析模块、Compute stats模块和资源队列配置模块。最后,文章讨论了Impala在网易内部业务的应用,包括自助分析和有数报表,并展望了未来的工作方向,如支持Impala on K8s、集群分组功能以及基于Alluxio的HDFS文件缓存和优化等。
"Impala如何优化大数据查询性能?" "Iceberg如何提升离线任务效率?" "Impala管理系统有哪些亮点功能?"
客服
商务合作
小程序
服务号
折叠