当前位置:首页 > 报告详情

Ray on Apache Spark™ Apache Spark™上的Ray.pdf

上传人: 2*** 编号:139139 2023-06-04 22页 1.34MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了Ray这一开源统一分布式框架,以及Ray-on-Spark库。Ray能够简化AI和Python应用的分布式计算,支持在笔记本、公共云、Kubernetes和本地环境中运行。Ray的核心是一个通用的分布式计算库,结合了应用程序生态系统。文章中提到的关键数据包括:1000多家组织使用Ray,25000多个GitHub星标,5000多个依赖Ray的仓库,以及820多个社区贡献者。Ray-on-Spark是一个库,可以在Spark集群上部署Ray集群并运行Ray应用程序。Ray-on-Spark的优势在于,用户可以在同一物理集群上共享成本,同时运行Ray和Spark应用程序,无需管理两个独立的物理集群。使用Ray-on-Spark的步骤包括安装Ray、启动Ray集群、运行Ray应用程序,以及停止Ray集群。最后,文章提到了Ray-on-Spark的未来工作,包括支持自动扩展和Delta数据源在Ray Data中的支持,并呼吁读者在Databricks集群或Spark独立集群上尝试Ray-on-Spark。
"Ray-on-Spark是什么?" "如何使用Ray-on-Spark?" "Ray-on-Spark的未来发展计划是什么?"
客服
商务合作
小程序
服务号
折叠