当前位置:首页 > 报告详情

阿里巴巴Spark实践与探索(21页).pdf

上传人: 云闲 编号:91451 2021-01-01 21页 4.30MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了阿里云技术专家曹龙在大数据领域,特别是内存计算方面的实践与探索。曹龙拥有7年分布式引擎研发经验,曾负责阿里YARN、Spark及自主研发内存计算引擎。文章概述了数据处理技术的发展,从硬件、机房到分布式调度、分布式存储和分布式计算,以及大数据产品的演进。 文章重点介绍了Spark,包括Spark的介绍、阿里Spark的发展历程、Spark在云上的应用以及Spark的未来发展趋势。Spark是一个开源的分布式计算系统,具有批处理、流计算和内存计算等功能。曹龙详细介绍了Spark的执行引擎优化,如Tungsten和Catalyst,以及Spark在阿里云的应用,如E-MapReduce。 此外,文章还提到了Spark的应用场景,包括机器学习、流式计算和即时查询等。最后,曹龙展望了Spark的未来,包括支持ANSI SQL、性能接近MPP数据仓库、新硬件的支持和更加友好的云支持等。
"阿里云专家如何玩转Spark?" "Spark未来有哪些惊喜等着我们?" "大数据时代,如何玩转内存计算?"
客服
商务合作
小程序
服务号
折叠