顯式擁塞通知
此條目翻譯自其他語言維基百科,需要相關領域的編者協助校對翻譯。 |
此條目需要精通或熟悉相關主題的編者參與及協助編輯。 |
顯式擁塞通知(英語:Explicit Congestion Notification,簡稱ECN)是一個對網際協定和傳輸控制協定(TCP)的擴充,定義於RFC 3168(2001)。ECN允許擁塞控制的端對端通知而避免丟包。ECN為一項可選功能,如果底層網路設施支援,則可能被啟用ECN的兩個端點使用。
通常來說,TCP/IP網路通過丟棄封包來表明信道阻塞。在ECN成功協商的情況下,ECN感知路由器可以在IP頭中設定一個標記來代替丟棄封包,以標明阻塞即將發生。封包的接收端回應傳送端的表示,降低其傳輸速率,就如同在往常中檢測到包遺失那樣。
相較於正確回應或者忽略位標記,一些過時或有故障的網路裝置會丟棄或篡改封包的ECN位。[1][2][3]截至2015年[update],測量顯示,公共網際網路上會因ECN設定阻斷網路連接的網頁伺服器減少到不足1%。[4]
操作
由於下列原因,ECN需要網際網路層和傳輸層提供特定支援:
- 在TCP/IP中,路由器在網際網路層操作,而傳輸速率由傳輸層處的端點處理。
- 擁塞可能僅由傳送端處理,但由於它是在封包傳送後發生,所以接收端必須向傳送端回傳擁塞指示。
在無ECN時,擁塞指示回傳是通過檢測分組遺失來間接實現。在有ECN時,擁塞通過設定IP分組內的ECN欄位為CE並由接收端通過在傳輸協定的報頭中設定適當的位來回傳給傳送端。例如,當使用TCP時,擁塞指示通過設定ECE位來回傳。
IP 中的 ECN 操作
ECN 使用 IPv4 首部或 IPv6 首部中 ToS (Type of Service,位於首部第 9 到 16 位元位) 欄位的兩個最低有效位(最右側的位編碼)來表示四個狀態碼:
00
– 不支援 ECN 的傳輸,非 ECT(Non ECN-Capable Transport)10
– 支援 ECN 的傳輸,ECT(0)01
– 支援 ECN 的傳輸,ECT(1)11
– 發生擁塞,CE(Congestion Experienced)。
當兩端支援 ECN 時,它將封包標為 ECT(0) 或 ECT(1)。如果分組穿過一個遇到阻塞並且相應路由器支援 ECN 的活動佇列管理(AQM)佇列(例如一個使用隨機早期檢測,即 RED 的佇列),它可以將代碼點更改為CE
而非丟包。這種行為就是「標記」,其目的是通知接收端即將發生擁塞。在接收端,該擁塞指示由上層協定(傳輸層協定)處理,並且需要將訊號回傳給傳送端,以通知其降低傳輸速率。
因為 CE 指示只能由支援它的上層協定有效處理,ECN 只能配合上層協定使用。例如 TCP 協定,它支援阻塞控制並且有方法將 CE 指示回傳給傳送端。
TCP中的ECN
TCP支援使用TCP頭中的三個標記(flag)來支援ECN。第一個標記是隨機和(Nonce Sum,簡稱NS),用於防止TCP傳送者的封包標記被意外或惡意改動。[6]另兩位用於回傳擁塞指示(即指示傳送者應減少資訊傳送量)和確認接收到了擁塞指示回應。這即是ECN-Echo(ECE)和Congestion Window Reduced(CWR)位。
在TCP連接上使用ECN是可選的;當ECN被使用時,它必須在連接建立時通過SYN和SYN-ACK段中包含適當選項來協商。
當在一個TCP連接上協商ECN後,傳送方指示連接上的TCP段攜帶IP分組傳輸流量,將支援ECN的傳輸用ECT碼點標記。這使支援ECN的中間路由器可以標記具有CE碼點的IP分組而不是丟棄它們,以指示即將發生的阻塞。
當接收到具有遇到阻塞碼點時,TCP接收者使用TCP頭中的ECE標記回傳這個阻塞指示。當一個端點收到TCP帶有ECE位的段時,它減少其擁塞窗口來代替丟包。然後,它設定段的CWR位來確認阻塞指示。
節點保持傳輸設定有ECE位的TCP段,直到它接收到設定有CWR的段。
要使用tcpdump檢視受影響的封包,使用過濾方法 (tcp[13] & 0xc0 != 0)
。
ECN與TCP控制包
由於傳輸控制協定(TCP)不對控制分組(純ACKs、SYN、FIN段)進行擁塞控制,控制分組通常不被標記為可進行ECN。
一份2009年的提議[7]建議將SYN-ACK標記為支援ECN。這種改進被稱為ECN+,已經顯示出對短壽命TCP連接的效能提供了顯著改善[8]。
ECN也在其他執行擁塞控制的傳輸層協定中被定義,尤其是資料擁塞控制協定(DCCP)和流控制傳輸協定(SCTP)。其一般原理類似於TCP,儘管編碼細節有所不同。
在原則上可以在使用者資料報協定(UDP)之上的協定層實行ECN。但是,UDP需要應用程式實行擁塞控制,並且當前的網路API未提供訪問ECN位的方法。
對效能的影響
由於ECN僅在配合活動佇列管理(AQM)策略時有效,因此ECN的益處依賴於所用的AQM的精確度。
如預期那樣,ECN減少TCP連接中被丟棄的封包數量,以避免重傳、減少等待時間,尤其是網路抖動。當TCP連接有單個未完成段時,這種效果最為明顯[9],它可以避免傳輸控制協定(RTO)逾時;這通常發生在互動式連接時,例如遠端登入,以及事務協定,例如HTTP請求、SMTP的對談階段、SQL請求。
ECN對批次吞吐的效果不太明確[10],因為現代的TCP實現在傳送方的窗口足夠大時對於及時處理段遺失相當友好。
ECN的使用已被發現在高度擁塞的網路上是有害的,AQM演算法使封包不會被丟棄。[8]現代的AQM實現在極高負載下會丟包而非標記包來避免這個陷阱。
實現
許多現代產品中的TCP/IP協定已部分支援ECN;但是,大多數產品預設禁用ECN。[來源請求]
主機支援的TCP中的ECN
Microsoft Windows
Windows自Windows Server 2008和Windows Vista開始支援TCP中的ECN。[11]因為資料中心傳輸控制協定(DCTCP)被使用,從Windows Server 2012開始在Windows Server版本中預設啟用。[12]在更早的Windows版本以及非Server版本中,它被預設禁用。
ECN支援可以用命令啟用,例如netsh interface tcp set global ecncapability=enabled。
類Unix
BSD
FreeBSD 8.0和NetBSD 4.0為TCP實現了ECN支援,可以通過sysctl介面將net.inet.tcp.ecn.enable參數設為1來啟用。與此相同,OpenBSD中可以設定sysctl net.inet.tcp.ecn。[13][14]
Linux
從發布於2002年11月的Linux核心2.4.20版本開始[15],Linux支援TCP中的ECN的三種工作模式,以及通過sysctl介面設定/proc/sys/net/ipv4/tcp_ecn參數為下列值:[16]
- 0 – 禁用ECN,不發起也不接受
- 1 – 啟用ECN,當傳入連接請求時,並也在傳出連接時嘗試請求ECN
- 2 – (預設)傳入連接請求時啟用ECN,但不在傳出連接上請求ECN
從2015年6月發布的Linux核心4.1開始,tcp_ecn_fallback機制按RFC 3168中的規定[17][18],在ECN被啟用(值為1)時預設啟用。該回退機制在傳出連接的初始設定時嘗試ECN連接,對沒有ECN能力的傳輸實行良好回退,緩解不支援ECN的主機或防火牆問題。
Mac OS X
Mac OS X 10.5和10.6為TCP實現了ECN支援。它採用sysctl的布林變數net.inet.tcp.ecn_negotiate_in和net.inet.tcp.ecn_initiate_out控制。[19]第一個變數在已經設定ECN標記的傳入連接上使用ECN;第二個則嘗試在傳出連接上啟用ECN。兩個變數均預設為0,但可以設定為1以實現相應的行為。
2015年6月,蘋果公司宣布將在年內發布的OS X 10.11將預設啟用ECN。[5]
iOS
2015年6月,蘋果公司宣布iOS的下一版本——iOS 9,將支援ECN並預設啟用。[5]
Solaris
Solaris核心支援對TCP支援ECN的三種狀態:[來源請求]
- never – 無ECN
- active – 使用ECN
- passive – 僅在被詢問時宣告ECN支援。
預設行為是passive。從Solaris 11開始,可以通過ipadm set-prop -p ecn=active tcp啟用完整的ECN功能。[來源請求]
路由器支援的IP中的ECN
由於在路由器中標記ECN依賴於某些形式的活動佇列管理,路由器必須組態合適的佇列規則才能實行ECN標記。
Cisco IOS路由器從12.2(8)T版本開始,如果已組態WRED排隊規則,則實行ECN標記。
Linux路由器實行ECN標記,如果RED或GRED佇列顯式組態了ecn參數,通過使用sfb規則,或使用CoDel公平排隊(fq_codel)規則。
現代的BSD實現,例如FreeBSD、NetBSD和OpenBSD支援ECN標記,在許多排隊規則的ALTQ佇列實現,尤其是RED和Blue。FreeBSD 11在具有ECN標記能力的ipfw/dummynet框架中包括CoDel、PIE、FQ-CoDel和FQ-PIE 排隊規則的實現。[20]
資料中心TCP
資料中心傳輸控制協定(也稱資料中心TCP或DCTCP)是利用ECN來增強傳輸控制協定的擁塞控制演算法,其用於資料中心網路。標準的TCP擁塞控制演算法只能檢測擁塞的存在,而使用ECN的DCTCP可以測量擁塞的程度。[21]
DCTCP修改了TCP的接收端以始終中繼傳入連接的精確ECN標記,代價是忽略一個保持信令可靠性的功能。這使DCTCP的傳送端易受到接受ACK遺失的影響,因為它沒有檢測或應對的機制。[22]截至2014年7月[update],以更可靠的方法提供等效或更好的接收器回饋的演算法是一個活躍的研究課題,並有一個被稱為「More accurate ECN feedback in TCP」(「TCP中更準確的ECN回饋」)(Accurate ECN,精準ECN)的實驗建議[23]。
參見
參考資料
- ^ Steven Bauer; Robert Beverly; Arthur Berger. Measuring the State of ECN Readiness in Servers, Clients, and Routers (PDF). Internet Measurement Conference 2011. 2011 [2016-12-17]. (原始內容存檔 (PDF)於2014-03-22).
- ^ Alberto Medina; Mark Allman; Sally Floyd. Measuring Interactions Between Transport Protocols and Middleboxes (PDF). Internet Measurement Conference 2004. [2016-12-17]. (原始內容存檔 (PDF)於2016-03-04).
- ^ TBIT, the TCP Behavior Inference Tool: ECN. Icir.org. [2014-03-22]. (原始內容存檔於2013-03-11).
- ^ Brian Trammell; Mirja Kühlewind; Damiano Boppart; Iain Learmonth; Gorry Fairhurst; Richard Scheffenegger. Enabling Internet-Wide Deployment of Explicit Congestion Notification (PDF). Proceedings of the Passive and Active Measurement Conference 2015. 2015 [14 June 2015]. (原始內容 (PDF)存檔於2015年6月15日).
- ^ 5.0 5.1 5.2 Your App and Next Generation Networks. Apple Inc. 2015 [2016-12-17]. (原始內容存檔於2015-06-15).
- ^ RFC 3540 - Robust Explicit Congestion Notification.
- ^ RFC 5562 - Adding Explicit Congestion Notification Capability to TCP's SYN/ACK Packets.
- ^ 8.0 8.1 Aleksandar Kuzmanovic.
- ^ Jamal Hadi Salim and Uvaiz Ahmed.
- ^ Marek Malowidzki, Simulation-based Study of ECN Performance in RED Networks, In Proc.
- ^ New Networking Features in Windows Server 2008 and Windows Vista. [2016-12-17]. (原始內容存檔於2012-04-15).
- ^ Data Center Transmission Control Protocol (DCTCP) (Windows Server 2012). [2016-12-17]. (原始內容存檔於2017-08-26).
- ^ Michael Lucas. Absolute OpenBSD: UNIX for the Practical Paranoid. Books.google.com. [2014-03-22].
- ^ Announcing NetBSD 4.0. 2007-12-19 [2014-10-13]. (原始內容存檔於2014-10-31).
- ^ A Map of the Networking Code in Linux Kernel 2.4.20, Technical Report DataTAG-2004-1, FP5/IST DataTAG Project (PDF). datatag.web.cern.ch. March 2004 [1 September 2015]. (原始內容存檔 (PDF)於2015-10-27).
- ^ Documentation/networking/ip-sysctl.txt: /proc/sys/net/ipv4/* Variables. kernel.org. [2016-02-15]. (原始內容存檔於2016-03-05).
- ^ RFC 3168 - The Addition of Explicit Congestion Notification (ECN) to IP. ietf.org. September 2001 [2016-02-15]. (原始內容存檔於2019-04-26).
- ^ Linux man pages. man7.org. 2015-12-05 [2016-02-15]. (原始內容存檔於2016-02-16).
- ^ ECN (Explicit Congestion Notification) in TCP/IP. [2016-12-17]. (原始內容存檔於2012-04-15).
- ^ Import Dummynet AQM version 0.2.1 (CoDel, FQ-CoDel, PIE and FQ-PIE) to FreeBSD 11. The FreeBSD Project, FreeBSD r300779. [5 August 2016]. (原始內容存檔於2021-02-25).
- ^ Data Center TCP. [2011-08-23]. (原始內容存檔於2016-12-05).
- ^ Requirements for a More Accurate ECN Feedback. tools.ietf.org. IETF. March 9, 2015 [May 2, 2015]. (原始內容存檔於2015-11-19).
- ^ RFC 7560: Problem Statement and Requirements for Increased Accuracy in Explicit Congestion Notification (ECN) Feedback. tools.ietf.org. IETF. August 26, 2015 [May 12, 2016]. (原始內容存檔於2016-04-29).
外部連結
- ECN web page by Sally Floyd(頁面存檔備份,存於網際網路檔案館)
- RFC 4774 (BCP), Specifying Alternate Semantics for the Explicit Congestion Notification (ECN) Field, S. Floyd, (November 2006)
- Linux kernel support for defining a per-route/destination congestion control algorithm (merged in Linux kernel 4.0)