100元上门4个小时服务电
您当前位置:网站首页 >> 新闻资讯
数据中心“流量风暴”来袭?揭秘RoCEv2的隐形守护者:PFC
文章来源:信而泰  上传时间:2025-7-25  浏览量:44

 

想象一下,在AI训练、高性能计算、分布式存储的“心脏”——数据中心网络里,RoCEv2(RDMA over Converged Ethernet v2)正以惊人的速度传输着海量数据。它绕过了操作系统内核,让应用直通网卡,速度飙升!但高速也伴随着风险:网络一旦拥塞,数据包丢失,整个高性能应用就可能“翻车”。这时,一个低调却至关重要的守护者站了出来:PFCPriority-based Flow Control,基于优先级的流量控制)。它就像网络流量的“精密刹车系统”,确保关键数据永不丢失。今天,就让我们一起揭开PFC的神秘面纱!

PFC是一种以Ethernet为基础的流控机制,它允许以优先级(Priority)为单位,控制特定优先级类别的网络流量。简单来说,当某个优先级的流量出现拥堵或包溢出时,PFC可以暂停对应优先级的流量,避免数据丢失,确保关键数据的稳定传输。

PFC的交互本质是接收方(Rx)向发送方(Tx)发送“暂停(Pause)” 或“恢复(Resume)” 指令。让我们分解这个过程:

1. 场景:接收端交换机端口(或网卡)的特定优先级队列的缓冲区即将被填满(达到预设阈值)。

2. 发出警报(Pause):

• 接收端检测到拥塞的优先级队列;

• 立即构造一个PFC Pause Frame;

• 在报文中明确指定需要暂停的优先级(如优先级3)以及需要暂停的时间长度(Pause Time);

• 将这个Pause Frame发送给直接相连的上游设备(发送端交换机或服务器网卡)。

3. 执行刹车(Hold):

• 上游设备(Tx)收到PFC Pause Frame;

• 解析报文,得知需要暂停哪个优先级(如优先级3)的流量发送;

• 立即停止发送该优先级的数据帧;

• 暂停的持续时间由报文中的Pause Time字段指定(单位是512 bit time,可换算成时间)。

4. 缓解与恢复(Resume):

• 接收端缓冲区被排空,拥塞解除;

• 接收端可以发送一个新的PFC Pause Frame,将对应优先级的Pause Time设置为0。这就是“恢复(Resume)”信号;

• 上游设备(Tx)收到Pause Time = 0的报文后,立即恢复发送该优先级的数据帧。

理解了交互,我们再来看看这个关键的“刹车指令”——PFC Pause Frame的报文结构(基于IEEE 802.1Qbb标准):

关键字段解析:

• Priority Enable Vector (2字节):这是控制开关。例如,它的值是 0x04 (二进制 0000 0100),表示只对优先级2 (因为Bit2=1)进行流量控制。其他优先级不受影响。

• Pause Time (每个优先级2字节): 这是刹车时长。对于Priority Enable Vector中启用的优先级,其对应的Time字段值表示请求发送方暂停该优先级流量的时长。Time = 0 表示“立即恢复”发送该优先级流量。Time > 0表示暂停的时长(单位是512 bit time,在10Gbps链路上,1个512 bit time = 51.2 ns)。

• Opcode (01-01): 明确这是PFC帧,而不是普通的PAUSE帧(Opcode为00-01)。

PFC在实际数据中心环境中的应用场景极为广泛,主要包括:

• AI/ML训练集群:保障GPU间高速RDMA通信不丢包、低延迟;

• 超融合基础架构/HCI:保证虚拟化存储(vSAN, Ceph等)后端网络稳定高效;

• 高性能分布式存储:确保存储节点间数据同步的可靠性;

• 金融交易系统:满足微秒级交易延迟要求。

为了确保PFC功能的正确性和有效性,测试是非常重要的一环。以下使用信而泰测试仪表X5-400G设备对PFC功能进行测试:

测试拓扑和主要配置如下所示:

如上图所示,测试仪模拟两端口向一个端口发流的拥塞场景,从而来验证DUT的PFC功能,被测设备使用华三的s9825-8C-G;

1. 占用3个端口,port1和port2用于发送QP流量,port3用于接收,使用RoCEv2向导,使能PFC,以Priority 5 为例;

2. 配置RoCEv2 Server:配置DSCP值:40,配置ipv4地址与DUT对应,阻塞端口port3的QP Block数量设置为2;(需要保证源QP Block数量与目标QP Block数量一致)

3. 选择流端点:勾选上server1和server2打向server3的QP block,点击完成即可;

4. 在流模板处查看,使用向导完成配后后默认是生成双向流量,去使能port3发送的流量即可;

5. 先将Port 1和Port2打往Port3的线速流量运行起来,此时可以观察到port1和port2的发送速率为100%,然后将DUT使能PFC功能后,可以观察到两端口流量的发送速率降速至50%;

6. 测试仪PFC报文统计查看,可统计到DUT发送的第5优先级的PFC报文;

7. Port 1和Port 2上启动捕获,其中pause time包含0和65535的PFC报文。

信而泰现已推出X2-100G-12QSFP28、X5-400G高密度以及E2-100G-4QSFP28-Q测试模块,均支持测试RoCEv2协议,支持100G/200G/400G的多速率以太网测试,信而泰的RoCEv2深度测试,为网络设备商、云服务商及企业用户提供了不可或缺的工具,有效识别瓶颈、优化配置,极大提升RoCEv2部署信心,是推动高性能无损网络从架构设计走向大规模、高效率实际应用的关键环节。

04

2022-03

Cloudera报告:企业数据战略是打通后疫情时代经济发展的桥梁

Cloudera报告:企业数据战略是打通后疫情时代经济发展的桥梁

12

2023-09

TikTok在美正式推出电商服务

TikTok在美正式推出电商服务

02

2022-09

共享充电宝“涨价”背后:行业运营模式生变从直营转向代理

共享充电宝“涨价”背后:行业运营模式生变从直营转向代理

24

2023-03

VR一体机伤眼睛吗?

VR一体机伤眼睛吗?

24

2022-06

首发!中国移动发布6G总体架构设计助力6G愿景实现

首发!中国移动发布6G总体架构设计助力6G愿景实现

10

2022-06

广电能成为运营商“第四势力”么?

广电能成为运营商“第四势力”么?

25

2022-02

58同城,何以成为骗子“集中营”?

58同城,何以成为骗子“集中营”?

14

2023-09

薛之谦方起诉Soul侵权 9月14日将开庭审理

薛之谦方起诉Soul侵权 9月14日将开庭审理
返回顶部
客服电话
100元上门4个小时服务电
用微信扫一扫关注我们
请各公司推销人员注意:我单位拒绝任何方式、任何形式的电话推销,请勿拔打我单位客服热线进行电话推销,谢谢合作!
公司名称:100元上门4个小时服务电话-初中生100元3小时
100元上门4个小时服务电话-初中生100元3小时二维码联系方式是一家从事线下会所体验店约【点击进入网站查看约茶服务】,附近约100元3小时上门服务、200一次qq上门服务电话号码
关键词:新闻资讯:数据中心“流量风暴”来袭?揭秘RoCEv2的隐形守护者:PFC,100元不限次数上门电话,200元3小时上门不限次二维码,3小时一晚同城约茶,100元上门4个小时,200元3小时上门不限制服务,600快餐_600元3小时上门二维码_600元4个小时上门服务电话,200元3小时,3小时上门服务电话号码,100元3小时,100元上门服务电话,附近约100元3小时上门服务,附近约妹妹200元电话,附近初中生100,
云南网站建设,云南网页设计,昆明网站建设,昆明网页设计  网站管理
【版权声明】本站部分内容由互联网用户自行发布,著作权或版权归原作者所有。如果侵犯到您的权益请发邮件致info@ynjwz.com,我们会第一时间进行删除并表示歉意。