当前位置:首页 > 报告详情

2018年支持大数据分析的分布式机器学习系统设计.pdf

上传人: 云闲 编号:95648 2021-01-01 34页 2.16MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了北京大学和腾讯联合开发的分布式机器学习系统Angel,该系统采用参数服务器架构,支持数据并行及模型并行的计算模式,对多种算法进行深度优化。关键点如下: 1. Angel系统具备扩展性、易用性、可靠性、高效性和平台性等特性,已在一个千亿级特征、百亿级样本的数据集上取得了优异的性能表现。 2. 系统设计考虑了数据流、图计算和深度学习等不同计算模型,提供了PS-Service能力,支持超大规模模型训练。 3. Angel通过优化同步协议、网络传输和系统调度等方面,实现了比传统系统更快的训练速度和更高的资源利用率。 4. 系统已开源,并在多个场景下与现有技术进行了性能对比,展示了其在不同算法和集群环境下的优势。 5. 未来研究方向包括寻找不同需求(如工作任务与硬件资源)之间的最佳折中方案,以及自动化机器学习等方面,以提高研究人员效率和降低机器学习门槛。
"Angel系统如何优化机器学习算法?" "如何通过Angel实现分布式深度学习?" Angel如何简化编程流程?"
客服
商务合作
小程序
服务号
折叠