当前位置:首页 > 报告详情

使用 GPU 加速 XGBOOST 在 SPARK 集群上的分布式训练.pdf

上传人: li 编号:29490 2021-02-07 40页 24.95MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了如何在Spark集群上使用GPU加速XGBoost的分布式训练。XGBoost是一种高效的梯度提升树模型,广泛应用于回归、分类、排名和生存分析等领域。文章指出,为了降低模型的bias和variance,我们需要更多的树和较小的学习率,以及增加数据量。然而,这需要强大的计算能力,而NVIDIA GPU提供了XGBoost所需的计算能力。文章还介绍了XGBoost的高性能实现和Spark 3.0+集群上利用GPU对XGBoost进行加速的方法。此外,文章还讨论了XGBoost4j-Spark项目,该项目将XGBoost与Spark MLLIB无缝集成,利用Spark强大的数据处理引擎和XGBoost的高性能算法。最后,文章展望了未来在Spark 3.1中为XGBoost4j-Spark加入GPU Stage-Level scheduling的计划。
"GPU如何加速XGBoost在Spark集群上的分布式训练?" "XGBoost与Spark结合的GPU加速技术有哪些优势和挑战?" "如何在Spark集群上利用RAPIDS插件实现XGBoost的高性能训练?"
客服
商务合作
小程序
服务号
折叠