Real-time In-network Microburst Mitigation on Programmable Switch-温宏斌

簡介

若在5G Edge Datacenter中發生Microburst之狀況,僅僅數微秒的壅塞在高速網路下就有可能造成佇列的滿溢並導致封包遺失,將造成Packet Loss/Retransmission而導致延遲上升。因此,微秒脈衝逐漸變成不可忽視的問題,然而由於他的突發以及瞬時之特性,所以使用傳統的網路管理工具,並無法觀察到微秒脈衝,更不用討論如何進行紓解。目前雖已有許多關於Microburst Detection之研究被發表,但即時性大多皆無法保證在次微秒之等級內,而且缺少緩解機制。在緩解方面,目前的研究大多採用基於TCP Protocol搭配各種Congestion Control的方法來進行,其即時性及有效性皆難以應對持續時間極短的微秒脈衝。

方法

我們利用P4/INT的技術,提出Real-time In-network Microburst Mitigation之機制,藉由P4交換機搭配INT之技術,在奈秒等級之時間間隔下,取得交換機之狀態資訊(如:Queue Depth, Enqueue Timestamp, Enqueue TimeDelta…等),用來偵測Microburst,當Microburst發生時,便啟動封包繞道機制,以純Data Plane的型式,將封包繞送至鄰近的交換機上,以紓解瞬時的壅塞,對於被繞送的封包會利用P4交換機的能力在封包上帶入封包的序列號碼,以避免Packet-Reordering的問題。此方法除了可以即時且有效的減緩因Microburst造成的快速Queue Length堆積,並且能夠避免Packet Loss及封包亂序的問題。

成果

我們使用了2台實體P4交換機(Edgecore Wedge 100BF-32X),並將其切分成五台邏輯獨立的交換機,並配合7台VM servers組合成一個Two-tier的Leaf-Spine 拓樸,成功的產生持續時間在數個Microseconds的微秒脈衝,其機制效能如下:

  1. Packet Loss觀測:在60次的Microburst 事件中,使用基本的Basic IP Forwarding,平均每個事件會產生31個Packet Loss,採用我們的機制則不會產生任何Packet Loss。
  2. Packet Retransmission觀測:在60次的Microburst 事件中,採用Basic IP Forwarding,平均每個事件會產生25-150次的Packet Retransmission,而我們的機制只會產生1~3個。

Flow Completion Time(FCT)與Jitter之觀測:在60次的Microburst事件中,每次皆產生1秒之Background Flow以及一次短暫的Microburst,並統計Burst Flow的FCT時間,

在我們的實驗中,相較於採用Basic IP Forwarding,Burst Flow的平均FCT從423.05 ms降低到290.07 ms。

轉發的抖動時間從7.89 ms減少到2.15 ms,皆有明顯之緩解效果。

 

Publication: Y.-J. Lin, C.-H. Hung, and C. H.-P. Wen, “Real-Time In-Network Microburst Mitigation on Programmable Switch,” IEEE Access, vol. 10, pp. 2446–2456, 2022, doi: 10.1109/ACCESS.2021.3139642.

Video for Real-Time Microburst Burst Detection Demo: https://www.youtube.com/watch?v=8vtWaWCECM4