《中国移动:2020年以太无损网络测试方法学(26页).pdf》由会员分享,可在线阅读,更多相关《中国移动:2020年以太无损网络测试方法学(26页).pdf(26页珍藏版)》请在三个皮匠报告上搜索。
1、Action:本文中特指有状态 RDMA 数据传输中所使用的某种单一数据操作方法,对特定两节点间的单次传输操作动作,包括连接类型。典型操作如 write,read,send,receive 等,单次传输操作所使用的 message size,QueuePair 数量,传输数据块大小等内容。 JOB:本文中特指多节点间一系列 RDMA Action 的组合。通过定义不同 action 的组合,以及每组 action 的间隔,重复次数,能够通过仪表来仿真模拟真实业务(比如高性能计算以及存储等)。Throughput:无状态 RoCE 流量下的网络吞吐量。 Goodput:有状态 RoCE 流量下的
2、业务吞吐量。静态时延: 无拥塞时单个数据包处理时延,包括数据串行时延、设备转发时延和链路传输时延。动态时延:拥塞情况下,无状态流量时延或有状态流量单一 RDMA Action 完成时延,除静态时延部分还包括内部排队和丢包重传导致的时延。尾部时延:定义为所有动态时延中最差的 1%时延的最小值。微突发: 连续短时间(微秒级)高流量带宽的数据帧组合。抖动:时延的变化程度。快速 ECN:指转发设备在出现流量拥塞时,在出队列进行 ECN-CE 的标记,而且非在入队列(普通 ECN)。这通常会加快 ECN-CE 报文的转发时间。 快速 CNP:指转发设备在出现流量拥塞时,进行 ECN-CE 标记,转发给下
3、游设备,同时向发送端直接发送 CNP 报文(而非传统行为的期望接收端发送 CNP 报文)。这通常会加快发送端接收到 CNP 报文的时间。动态 ECN: 指转发设备能够实时感知网络流量模型,自动调节优化 ECN 水线,实现网络拥塞控制,提升网络性能指标。基本测试拓扑,用于基准测试,定义基准带宽、时延等,可对交换机基本性能或小规模单层网络架构的典型组网场景性能及可靠性进行测试和仿真。需要考虑实际应用时服务器端是否应用捆绑,以此决定测试仪端口和被测设备间是否使能端口捆绑。典型组网下 RoCE 性能测试拓扑,包括 1 打 1、M 打 1、M 打 N 等场景。通常采用两级架构典型拓扑,可对两级架构下的典
4、型组网场景进行测试和仿真。考虑实际组网需求,leaf 交换机需要按照实际需求确定收敛比(leaf-spine 间的上行总带宽与 leaf-server 间的下行总带宽的比值),典型收敛比为 1:1(即无阻塞网络)、2:3、1:2 及 1:3。并考虑实际应用时服务器端是否应用捆绑,以此决定测试仪端口和被测设备间是否使能端口捆绑。如使能捆绑,则通常需在一对 leaf 节点间应使能 mlag,测试仪表端一对捆绑口双上行到一对 leaf 节点。在以太无损网络中,典型的接口类型通常为 25G、40G、50G、100G、200G 和 400G。 包括端口 IP、路由、vlan 等保证网络基本连通性的相关配置。为 RoCE 流量,有损业务流量,CNP、PFC 协议流量或其他业务流量设置不同的 QOS 优先级,以便进行区分和调度。典型地,CNP、PFC 等协议信令报文的优先级为CS6,RoCE业务流量的优先级为EF,有损业务及其他业务流量的优先级为BE。