《ODCC:数据中心智能无损网络白皮书(43页).pdf》由会员分享,可在线阅读,更多相关《ODCC:数据中心智能无损网络白皮书(43页).pdf(43页珍藏版)》请在三个皮匠报告上搜索。
1、 数据中心智能无损网络 白皮书 编号 ODCC-2021-05001 开放数据中心委员会 2021-09-15 发布 ODCC-2021-05001 数据中心智能无损网络白皮书 i 目目 录录 前 言 . iii 版权说明 . iv 数据中心智能无损网络白皮书 . 1 1. 介绍 . 1 1.1. 范围 . 1 1.2. 目的 . 1 2. 让数据中心焕发生机 . 1 2.1. 一个到处都是数据的新世界 . 1 3. 数据中心需求和技术不断提升 . 3 3.1. 原有数据中心桥接标准 . 3 3.2. 需求演化 . 4 3.3. AI 计算的特点 . 5 3.3.1. 模型并行计算 . 6 3
2、.3.2. 数据并行计算 . 6 3.4. 技术演进 . 8 3.4.1. SSDs 和 NVMeoF:高吞吐量低时延网络 . 8 3.4.2. GPU:用于并行计算的超低时延网络 . 11 3.4.3. SmartNICs . 12 3.4.4. 远程直接内存访问(RDMA) . 14 ODCC-2021-05001 数据中心智能无损网络白皮书 ii 3.4.5. GPU DirectRDMA . 16 4. 当今数据中心网络面临的挑战 . 19 4.1. 平衡高吞吐量和低时延 . 19 4.2. 无死锁无损网络 . 21 4.3. 大规模数据中心网络的拥塞控制问题 . 23 4.4. 拥塞
3、控制算法的配置复杂性 . 26 4.4.1. 自适应 PFC Headroom 计算 . 26 4.4.2. 动态 ECN 阈值设置 . 27 5. 解决新数据中心问题的新技术 . 28 5.1. 低时延和高吞吐量的混合传输 . 28 5.2. 基于拓扑识别的 PFC 死锁预防 . 30 5.3. 改善拥塞的通知 . 32 5.3.1. 反应点(RP) . 33 5.3.2. 阻塞点(CP) . 33 5.3.3. 通知点(NP) . 33 5.4. 解决拥塞控制算法的配置复杂性 . 35 5.4.1. 优化缓存区以降低 PFC headroom 配置的复杂性 . 35 5.4.2. 智能 E
4、CN 阈值优化 . 35 6. 结论 . 37 ODCC-2021-05001 数据中心智能无损网络白皮书 iii 前前 言言 由中国信通院云大所、百度、腾讯、美团、京东、移动、电信、华为、思科、博通、英伟达等 ODCC(开放数据中心委员会)成员单位联合编制的智能无损数据中心网络白皮书 正式发布。 该白皮书内容翔实, 分别从数据中心的重要性、应用发展需求、网络面临的挑战、相应的解决方案和标准化工作进展等方面开展了介绍。 2017 年起,ODCC 牵头制定无损网络技术标准以及测试规范等,相继发布行业标准、 技术报告等 10 多项成果, 得到了产业界的广泛参与, 搭建起一个 DCN技术热点讨论平台
5、,相关技术的标准化推动工作也在紧锣密鼓进行当中。在国家高度重视新基建的环境下,白皮书发布为我国数据中心技术、产品和服务走出去打下了良好的基础。 起草单位:中国信息通信研究院(云计算与大数据研究所)、百度在线网络技术(北京)有限公司、中国移动通信集团有限公司、中国电信集团有限公司、深圳市腾讯计算机系统有限公司、 华为技术有限公司、 NVIDIA(英伟达)中国有限公司、思科(中国)有限公司、博通公司、北京三快在线科技有限公司、北京京东世纪贸易有限公司 起草者:郭亮、李洁、高峰、顾戎、赵继壮、程传胜、殷悦、宋庆春、刘军、何宗应、孙黎阳、唐广明、权皓、陶春雷、王少鹏、赵精华 ODCC-2021-050
6、01 数据中心智能无损网络白皮书 iv 版权说明版权说明 ODCC(开放数据中心委员会)发布的各项成果,受著作权法保护,编制单位共同享有著作权。 转载、摘编或利用其它方式使用 ODCC 成果中的文字或者观点的,应注明来源:“开放数据中心委员会”。 对于未经著作权人书面同意而实施的剽窃、复制、修改、销售、改编、汇编和翻译出版等侵权行为,ODCC 及有关单位将追究其法律责任,感谢各单位的配合与支持。 ODCC-2021-05001 数据中心智能无损网络白皮书 1 数据中心智能无损网络白皮书 1. 介绍介绍 1.1. 范围范围 白皮书研究了支持现代数据中心网络需求的网络技术, 包括高性能计算和人工智