当前位置:首页 > 报告详情

将 HugeCTR Embedding 集成于 TensorFlow.pdf

上传人: li 编号:29564 2021-02-07 23页 1.26MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了NVIDIA推出的用于点击通过率(CTR)估算的高效GPU框架HugeCTR,以及其与TensorFlow的集成。HugeCTR支持大规模训练,例如单一节点上的千兆模型,并优化了流式训练中的动态插入。它还支持各种变种推荐模型,如WDL、DCN、DeepFM和DLRM等。HugeCTR的接口简单易用,具有Python/C++接口和基于JSON的网络配置。其GPU哈希表基于cudf,支持动态插入并解决了冲突,还实现了统一的嵌入表和多热支持。在TensorFlow中,HugeCTR嵌入式框架支持模型并行,优化器用于参数更新,并减少了内存占用。性能方面,在MLPerf v0.7中,HugeCTR相对于TensorFlow在单V100 GPU上实现了8.3倍的加速,在40核GPU节点上达到了114倍的加速。在Kaggle的criteo数据集上,HugeCTR展示了相对于TensorFlow的4.7倍速度提升和3.4倍端到端加速。最后,提供了GTC中国相关会议的链接,以了解更多关于NVIDIA Merlin和其他相关主题的信息。
"HugeCTR如何提高CTR预测的训练速度?" "如何使用HugeCTR Embedding进行统一嵌入层定义?" "HugeCTR在TensorFlow中的嵌入表如何实现多GPU分布式训练?"
客服
商务合作
小程序
服务号
折叠