1、知识和理性知识和理性软件定义全光交换软件定义全光交换在高性能计算和数据中心应用在高性能计算和数据中心应用凌云光技术股份有限公司张华2023年6月目目 录录1.HPC1.HPC和和数据中心互联挑战数据中心互联挑战2.OCS2.OCS全光交换应用方案全光交换应用方案3.OCS3.OCS技术和产品技术和产品4.4.总结和展望总结和展望LUSTER ConfidentialGoogle TPUGoogle TPU集群规模演变集群规模演变AIAI模型模型规模的演进规模的演进 ChatGPTChatGPT引爆了人工智能引爆了人工智能(AI)/(AI)/机器学习机器学习(ML)(ML)新的需求高潮,当前新的
2、需求高潮,当前GPUGPU互联端口已采用互联端口已采用800G(2x400G)800G(2x400G),下一代会演进到,下一代会演进到1.6T(2x800G)1.6T(2x800G),数据中心对光互联的带宽需求越来越高。数据中心对光互联的带宽需求越来越高。伴随着带宽增长,伴随着带宽增长,AI/MLAI/ML集群规模从几百张加速卡到上万张扩展,集群互联距离从数十米到上百米延伸,集群规模从几百张加速卡到上万张扩展,集群互联距离从数十米到上百米延伸,Al/MLAl/ML集群互联对低功耗和低集群互联对低功耗和低延迟需求迫切,现有电交换面临瓶颈。延迟需求迫切,现有电交换面临瓶颈。1.1 1.1 HPCH
3、PC发展趋势发展趋势和挑战和挑战LUSTER Confidential1.2 1.2 大规模大规模数据中心数据中心互联互联挑战挑战挑战挑战1 1:SpineSpine交换机成为性能瓶颈交换机成为性能瓶颈 Spine交换机一般会提前预部署,但随着速率不断升级,低速Spine交换机成为新技术应用的性能瓶颈。Spine交换机成本和功耗在整个数据中心占比40%,升级Spine交换机,将会带来一系列问题,如耗时,费钱,增加功耗。挑战挑战2 2:能效提升进入平台期:能效提升进入平台期 随着速率提升,200G及以上速率单纯依赖硬件升级能效提升不明显,需要通过架构重构等方式进一步提升能效,降低运营成本。目目
4、录录1.HPC1.HPC和和数据中心互联挑战数据中心互联挑战3.OCS3.OCS技术和产品技术和产品4.4.总结和展望总结和展望LUSTER Confidential2.12.1 OCSOCS全光交换简介全光交换简介入射到光纤中的任意光信号均可被交换入射到光纤中的任意光信号均可被交换是是全光全光交换交换 不是光电转换交换不是光电转换交换 全光域切换全光域切换:纯光信号输入,纯光信号交换,纯光信号输出。光纤级切换光纤级切换:光信号从一根光纤切换到另一根光纤。无时钟抖动,无延迟,不读取数据,无泄漏风险。无时钟抖动,无延迟,不读取数据,无泄漏风险。是是线路线路交换交换 -不是分组交换不是分组交换 不
5、选择路由不选择路由IPIP数据包。数据包。交换光纤上传输的全部数据。交换光纤上传输的全部数据。光信号光信号完全透明完全透明传输,支持光纤中传输,支持光纤中任意速率任意速率/任意调制格式任意调制格式/任意通信波长任意通信波长光信号交换光信号交换 任意速率/任意调制格式的数字信号:如数据中心400 Gbps+,CPRI,Ethernet等 任意速率/任意调制格式的模拟信号:如RoF,视频,传感数据(即油井传感器数据)任意通信波长850nm,1260nm-LUSTER Confidential2.2 2.2 OCSOCS全光交换在全光交换在HPCHPC实施方案实施方案-Google TPUv4-Go
6、ogle TPUv4可靠性提升可靠性提升 如果使用常规的固定互联架构,有一小部分的芯片出故障,可能会影响整个系统工作。采用可重配置的OCS,只需要把出故障的芯片旁路切换到备用节点,不会影响整个系统的工作。不同不同TPUTPU切片下,切片下,TPUTPU主机可靠性和系统平均性能的曲线主机可靠性和系统平均性能的曲线(如图如图)。不使用OCS时,主机可靠性必须做到99.9%99.9%,才能保证TPU切片有较好的性能;而使用使用OCSOCS之后,99.0%99.0%和99.5%99.5%的主机可靠性仍能保证TPU切片有较好的性能。当主机可靠率在99%和1000片TPU切片的情况下,使用OCS可使系统的