当前位置:首页 > 报告详情

6-5 Spark SQL 在平安产险的应用.pdf

上传人: 云闲 编号:102492 2021-01-01 25页 751.38KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了Spark SQL在平安产险的应用,由大数据开发工程师李伟轩撰写。文章首先介绍了业务背景,指出离线集群在任务高峰期出现CPU资源不足,而内存利用率不高的情况,提出了业务需求与特点,即节省集群资源,提高资源利用率,提升任务运行时效。接着,文章对比了Hive、Spark和Presto三种引擎的优劣,指出Hive适用于SQL复杂、稳定性要求高、数据量巨大的离线任务,而Spark和Presto适用于不同场景的数据处理。 在部署方式的选择上,文章详细比较了ThriftServer、Spark-SQL和Kyuubi三种模式的优缺点,并提出了相应的应用场景。迁移流程部分,文章阐述了语法兼容性校验、验证阶段、部署模式的选择和迁移效果。最后,文章总结了典型问题和经验,包括ThriftServer的稳定性建设、运维与治理,Spark-SQL的资源预估,以及部分兼容问题的解决方案。 核心数据显示,通过迁移至Spark SQL,队列资源降低了30%-60%,业务时效提升了65%-90%。在ThriftServer模式下,业务时效也提升了70%-90%。这些数据表明,Spark SQL在平安产险的应用取得了显著的成效。
"Spark SQL如何提高资源利用率?" "迁移至Spark SQL遇到哪些典型问题?" "Spark SQL如何实现高并发处理?"
客服
商务合作
小程序
服务号
折叠