当前位置:首页 > 报告详情

基于 Apache Spark的大规模分布式机器学习实践(26页).pdf

上传人: 云闲 编号:91296 2021-01-01 26页 3.09MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了英特尔公司基于Apache Spark的大规模分布式机器学习实践。主要内容包括: 1. 英特尔公司作为Apache Spark的早期采用者,与AMPLab和社区紧密合作,为Spark开源项目做出许多关键贡献。 2. 英特尔与多家“网络规模”公司合作,提供免费的大规模分布式机器学习工具,如在线LDA、Word2Vec等。 3. 英特尔在欺诈检测方面为顶级支付公司提供端到端的解决方案,使用大规模稀疏逻辑回归模型进行点击率和购买率预测,并使用深度(卷积)神经网络进行欺诈检测。 4. 英特尔在Spark上实现了稀疏逻辑回归,通过使用稀疏格式缓存数据、使用float16代替double值、只计算和同步非零数据的梯度等方式,提高了通信效率。 5. 英特尔正在开发支持参数服务器的分布式机器学习基础设施,以支持大规模稀疏模型和图的训练。 6. 英特尔正在开发支持多层感知机(MLP)、卷积神经网络(CNN)等深度学习模型的分布式神经网络,以实现对大规模稀疏模型的训练。
英特尔如何利用Apache Spark进行大规模分布式机器学习? 英特尔在欺诈检测中如何使用深度神经网络? 英特尔如何通过参数服务器支持分布式机器学习?
客服
商务合作
小程序
服务号
折叠