天天透天天干,欧美福利在线,国产三级网站,色婷婷综合网,亚洲欧美成人一区二区,亚洲国产精品成人久久久麻豆,国产剧情久久久

您當前的位置是:  首頁 > 資訊 > 文章精選 >
 首頁 > 資訊 > 文章精選 >

DCN學院派丨智能時代的數據中心網絡發(fā)展趨勢推演

2020-04-28 09:29:54   作者:潘灝濤/華為數據中心網絡技術規(guī)劃師   來源:CTI論壇   評論:0  點擊:


  作為DCN演進的主引擎,計算的變化將直接驅動DCN的發(fā)展。數據中心計算領域近年來呈現(xiàn)出三大變化方向:
  計算接口高速化
  阿姆達爾定律(Amdahl's lesser known law)表明:并行計算中,每1MHz的CPU最大能產生1Mbit/s的IO。因此,一臺有32核2.5GHz的CPU的服務器,則需要配置100Gb/s的網卡,才能將計算性能充分發(fā)揮出來。服務器上行對接100GE接入,400GE核心轉發(fā)成為越來越清晰的主流網絡架構。
  計算能力并行化  
  并行化是解決應用性能擴展的成功實踐。隨著用戶數和數據規(guī)模增大,并行化程度越來越高。據Facebook統(tǒng)計【2】,用戶在朋友圈一個“點贊”動作,會發(fā)起到數據中心1KB的HTTP請求,在數據中心內部,則放大為930KB的并行操作,包括88次Cache查找(648KB),35次數據庫查找(25.6KB)和392次后端RPC調用(257KB)。計算并行化,使得DCN內部流量(東西向)千倍增大,加劇網絡擁塞,增加了通信時間,降低計算效率,智能無損網絡的出現(xiàn),是大勢所趨。
  計算資源虛擬化
  1998年,Greene(VMWARE創(chuàng)始人)等發(fā)明了服務器虛擬化技術,通過把一個物理服務器虛擬為多個虛擬機,將計算資源的平均利用率從10%提升到30%;而近幾年新興的容器技術(如Docker,Kata,Unikernel),通過更輕量化的虛擬層技術,進一步提升計算資源的利用率。計算虛擬化帶來的動態(tài)性,徹底改變了人管理網絡的方式,驅動網絡邁向自動駕駛。
  計算領域的三大方向,引領DCN發(fā)展趨勢,向400G智能無損的自動駕駛網絡邁進。
  400GE DCN網絡
  迎接計算節(jié)點100GE接口浪潮
  處理器多核化以及AI處理器的普及, IO帶寬需求大幅增加?偩技術的發(fā)展,部分緩解了計算的IO瓶頸。2020年,PCIe 4.0@16GT/s開始商用,IO帶寬達到50G~100G/200G;2021年,PCIe5.0@32GT/s芯片也將發(fā)布,IO帶寬達到100G~400G。
  網卡的速率成為提升IO能力的又一關鍵。網卡從10GE演進到25GE,并快速推進到100GE。配置100GE網卡的服務器在2020年快速起量,成為主流。根據分析師機構CREHAN的預測,在2020年, 100GE網卡的發(fā)貨量將超越50GE網卡,成為業(yè)界對25GE網卡下一代的選擇;
  基于成本、功耗和生態(tài)考慮,DCN或將跳過200G,直接演進到400G。從歷史實踐看,服務器網卡和網絡速率之比為1:4,即25G網卡對應100G網絡,100G網卡對應400G網絡;從光模塊架構看,200G和400G都采用4-lane架構,PAM4調制方式,成本和功耗趨同,導致400G每比特成本相比200G降低一倍;從光模塊生態(tài)看,400G模塊種類豐富,給客戶更多的選擇;目前,200G的模塊種類只有100m SR4和2km FR4兩種;400G的模塊種類達到了5種,涵蓋100m、500m和2km。
  華為在2019年初已經發(fā)布了業(yè)界首款面向AI時代的數據中心交換機CloudEngine 16800,支持業(yè)界最高密度的48*400GE端口/每槽位,業(yè)界的5倍,為100G服務器接入,400G數據中心網絡做好了充分的準備。
  計算能力并行化
  驅動DCN向智能無損網絡演進
  隨著計算規(guī)模增大,通信占比持續(xù)增大,抵消了規(guī)模增長帶來的收益,造成集群性能的負增長。如圖所示【3】,Netflix的分布式電影評分推薦系統(tǒng)中,當計算規(guī)模達到90臺,出現(xiàn)拐點,計算效率不升反降。
  為了降低通信占比,降低應用等待時間,增大網絡規(guī)模,無損網絡是必經之路。
  眾所周知,應用之間通信需求是無損的。有兩種實現(xiàn)方式:
 。1)無損協(xié)議+有損網絡:
  在10G網卡時代,一般采用這種方式,即網絡可以在擁塞時丟包,在協(xié)議層進行補救,如在TCP協(xié)議上部署重傳機制,在發(fā)現(xiàn)網絡丟包后,進行重傳。
  (2)有損協(xié)議+無損網絡:
  進入到25G/100G網卡時代, 采用網卡硬化協(xié)議棧,解決對CPU的消耗。為了硬化協(xié)議棧,只能簡化協(xié)議,從而依賴無損網絡。據測算,要吞吐25G~100G的數據,要消耗服務器10%~30%左右的CPU;為了解決此問題,需要在智能網卡上硬化協(xié)議,硬化帶來的好處是高性能,但也會喪失協(xié)議的靈活性。業(yè)界采用RDMA協(xié)議,替代復雜的TCP, 便于網卡的硬化。RDMA協(xié)議對丟包極其敏感,2%的丟包就會造成網絡有效吞吐降到0。所以,無損網絡成為DCN的基本特征。
  從TCP誕生之初,是為Internet設計的,考慮的是低速的,長距(數百公里)的網絡,圍繞流量控制技術,出現(xiàn)了大量的創(chuàng)新。在進入到400G DCN時代,環(huán)境發(fā)生了巨大的變化,從Internet的慢速鏈路到DCN 400G高速鏈路, 從數百公里的長距Internet到百米的DCN網絡,從全互聯(lián)的流量模型到Incast突發(fā)流量模型, TCP已經不能適用這種變化,需要對流量控制技術在協(xié)議和網絡上重新定義,RDMA協(xié)議替代TCP,將成為必然。
  擁塞控制,是通過網絡和端點協(xié)作,控制入網流量速率,使得入網流量和網絡帶寬匹配,滿而不溢。網絡擁塞通知的準確性,對網絡利用率影響很大。過早擁塞通知,將導致計算側過度減速,網絡利用率低。過晚擁塞通知,將導致網絡過載,導致丟包。通過AI算法,預測流量模型,準確的通知計算側,控制入網流量。
  更進一步,網絡基于準確的活躍流統(tǒng)計,為每條流分配合適的速率,避免計算節(jié)點之間探測式發(fā)送,減少突發(fā),從而減少網絡的抖動。這種基于Credit的擁塞機制,特別適合存儲等低抖動網絡上。
  在并行計算中, 存在木桶效應,即最長完成的流,決定整個任務的完成時間。所以,對不同的流進行差異化的調度,降低整個任務的完成時間。在關鍵流或者co-flow識別上, AI算法,可以發(fā)揮出重要的作用。
  在大規(guī)模并行計算場景下,讓網絡深度參與到計算通信過程中,從而減少通信量和時間,提升應用性能,稱為在網計算。
  我們知道,并行計算下,多端點之間的通信是全互聯(lián)的關系,通信量存在N平方問題。造成隨著計算規(guī)模增大,計算性能下降,在網計算的思路是把網絡作為中間節(jié)點,參與到計算參數過程中,即把部分計算的功能部署到網絡上。這樣,通信的復雜度從O(2(n-1))降為O(1);也就是消除計算規(guī)模增大的性能拐點。
  在網計算,需要通信層和網絡協(xié)作,主流的并行計算通信層包括MPI和NCCL兩種,所以網絡也需要分別適配這兩種通信層。
  華為提出業(yè)界首創(chuàng)的智能無損DCN,基于內置的AI芯片和智能無損的iLossless調度算法,重定義流量控制技術,重分布網絡計算功能, 100%釋放算力。作為業(yè)界唯一的0丟包的以太網,經過第三方Tolly的權威認證,在計算和存儲場景,要比業(yè)界其他廠商的交換機提升30%的應用性能。
  計算虛擬化深入發(fā)展
  驅動DCN從SDN邁向自動駕駛
  • 計算虛擬化,打破了服務器物理邊界,計算資源可根據需求動態(tài)伸縮。SDN的出現(xiàn),是為了解決網絡隨計算而動的問題,即根據計算資源位置的變化,由SDN控制器動態(tài)為其構建一張邏輯網絡,稱為部署自動化。
  • 部署自動化階段,由原來的人-機接口,演進到機-機接口,配置效率百倍提升,從小時級到分鐘級。
  • 部署自動化的第一步是簡化;如果在復雜的網絡環(huán)境下部署自動化,會適得其反,讓事情變得更復雜。因為需要匹配各種組網,梳理復雜的依賴關系,應對各種流量模型。業(yè)界在SDN的實踐中也走過彎路,最終,遵循簡化優(yōu)選的原則,網絡拓撲簡化為Leaf/Spine,轉發(fā)簡化為VXLAN,協(xié)議簡化為BGP-EVPN,網關簡化為多活網關,為自動化打下堅實基礎。
  • 部署自動化的第二步是標準化;特別是SDN北向接口的標準化,讓網絡融入到云計算的生態(tài)中。Openstack云平臺成為主流,使得Neutron成為事實標準,加速SDN生態(tài)的成熟。
  • 部署自動化,一方面帶來百倍的部署效率提升,另一方面,也帶來兩大副作用:
  高頻度變更,使得配置錯誤存在放大效應
  傳統(tǒng)網絡以天計的變更頻度,讓管理員有充裕的時間進行檢查。但SDN以分鐘計的高頻變更,讓一個小小的配置錯誤,都放大數百倍,成為潛在的隱患。據谷歌披露【4】,數據中心網絡中68%的故障是由于網絡變更造成的。網絡驗證技術,在配置生效前,校驗配置面的錯誤、沖突以及數據面的環(huán)路和黑洞等,可提前消除配置風險。
  高頻度變更,把壓縮運維時間到分鐘級
  當網絡瞬息萬變,傳統(tǒng)靜態(tài)網絡的運維方式都將失效。如何在幾分鐘之內,完成故障檢測,定位和恢復,成為核心需求。
  智能運維,基于海量數據采集和AI預測算法,提前預測故障,像扁鵲大哥一樣,在病情發(fā)作前,提前發(fā)現(xiàn),并下藥鏟除。當故障發(fā)生時, 采用融入專家經驗的知識圖譜, 撥開各種表面現(xiàn)象,找到根因,為故障恢復提供依據。
  自動駕駛網絡,除了部署和運維的自動化,還包括規(guī)劃自動化,建設自動化和網絡自優(yōu)化,即“規(guī)建維優(yōu)”全生命周期自動化。
  如自動駕駛汽車,自動駕駛網絡根據自動化程度也分為5級,華為CloudFabric數據中心網絡的自動駕駛能力已經演進到L3級,即釋放運維人員的手。未來會走向L4高度自治和L5完全自治網絡,釋放運維人員的眼和腦。走向L5的自動駕駛,還有很長的路要走,需要業(yè)界同仁的共同努力。
  AI是使能器
  支撐DCN向智能無損和自動駕駛網絡演進
  無論是智能無損還是自動駕駛網絡,它的最終實現(xiàn)和落地離不開AI技術應用。沒有AI算法的支撐,自動駕駛網絡和智能無損將是空中樓閣。AI算法在語音、語言處理、圖像等領域獲得了巨大的成功,將AI技術和網絡結合,也將使得網絡煥發(fā)青春。
  如下圖所示, 在識別、預測、調優(yōu)和質量評估等方面, 學術界和工業(yè)界都投入了巨大的研究熱情,也初顯成效。
  華為正在攜手學術界和工業(yè)界, 持續(xù)挖掘AI能力, 和網絡技術充分結合,持續(xù)提升計算效率,一起邁向全新的DCN時代。
【免責聲明】本文僅代表作者本人觀點,與CTI論壇無關。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責任。

專題

CTI論壇會員企業(yè)