新聞中心
當(dāng)前位置:網(wǎng)站首頁(yè) > 新聞中心
DPU:5G邊緣云的新基石
2021年7月24日,由江蘇省未來(lái)網(wǎng)絡(luò)創(chuàng)新研究院主辦、SDNLAB承辦的2021中國(guó)5G網(wǎng)絡(luò)創(chuàng)新論壇上,多家機(jī)構(gòu)談到了DPU的進(jìn)展,我們對(duì)此進(jìn)行了整理,以饗讀者。
5G時(shí)代帶來(lái)通信帶寬的巨大提升,更多的帶寬使能更多的應(yīng)用。數(shù)據(jù)量的迅猛增多以及服務(wù)器網(wǎng)絡(luò)帶寬的快速增長(zhǎng)都已經(jīng)遠(yuǎn)超計(jì)算能力的增長(zhǎng),有線速I/O處理需求的應(yīng)用程序受到CPU和內(nèi)存的限制,現(xiàn)有系統(tǒng)也會(huì)因?yàn)镃PU資源占用而導(dǎo)致延遲增加,包處理性能出現(xiàn)波動(dòng)。
5G時(shí)代帶來(lái)互聯(lián)終端設(shè)備的大爆發(fā),也帶來(lái)數(shù)據(jù)大爆發(fā)。據(jù)統(tǒng)計(jì)2019年全球產(chǎn)生數(shù)據(jù)45ZB,預(yù)計(jì)到2024年這一數(shù)字將達(dá)到142ZB,其中24%的數(shù)據(jù)將來(lái)自終端實(shí)時(shí)數(shù)據(jù)。海量數(shù)據(jù)條件下低時(shí)延網(wǎng)絡(luò)傳輸及數(shù)據(jù)處理的算力需求及性能壓力巨大。
5G時(shí)代帶來(lái)個(gè)性化定制私域網(wǎng)絡(luò)時(shí)代。5G網(wǎng)絡(luò)不止用于公眾客戶,更主要的賦能各行各業(yè),作為新基建的重要組成,推動(dòng)社會(huì)發(fā)展。5G將大量部署在網(wǎng)絡(luò)邊緣,提供實(shí)時(shí)應(yīng)用和服務(wù)。據(jù)IDC統(tǒng)計(jì),近10年來(lái)全球算力增長(zhǎng)明顯滯后于數(shù)據(jù)的增長(zhǎng)。每3.5個(gè)月全球算力的需求就會(huì)翻一倍,遠(yuǎn)超算力增長(zhǎng)的速度。算力,作為先進(jìn)生產(chǎn)力,承載了十萬(wàn)億美元規(guī)模經(jīng)濟(jì)。在5G的推動(dòng)下,計(jì)算組織從“端-云”一體,到“端-邊緣-云”一體;從內(nèi)存計(jì)算發(fā)展到網(wǎng)內(nèi)計(jì)算。基礎(chǔ)設(shè)施云資源作為5G發(fā)展的重要基石,也發(fā)生了極大的變化。
5G的需求
5G MEC是一種分布式計(jì)算部署架構(gòu),將計(jì)算能力、業(yè)務(wù)以及部分5G網(wǎng)絡(luò)能力部署到網(wǎng)絡(luò)邊緣,實(shí)現(xiàn)低時(shí)延的就地?cái)?shù)據(jù)處理、敏感數(shù)據(jù)本地處理。MEC可以很好的適配低頻、頻次不確定性同時(shí)時(shí)間敏感的業(yè)務(wù)場(chǎng)景。(來(lái)源:網(wǎng)絡(luò)通信與安全紫金山實(shí)驗(yàn)室)
5G MEC包括5G網(wǎng)關(guān)UPF、邊緣應(yīng)用平臺(tái)MEP、行業(yè)應(yīng)用APP以及虛擬化基礎(chǔ)設(shè)施。5G MEC作為一體式設(shè)備部署在靠近終端用戶側(cè)的邊緣位置,提供大帶寬、低時(shí)延的網(wǎng)絡(luò)連接能力,AI、圖像渲染等計(jì)算能力,以及面向行業(yè)的安全能力。圖1:邊緣云網(wǎng)融合架構(gòu)(來(lái)源于會(huì)上中國(guó)電信研究院的演講)
邊緣計(jì)算將從傳統(tǒng)的集中式互聯(lián)網(wǎng)交換(Internet EXCHange IX)模型擴(kuò)展到邊緣交換模型。位于邊緣的最終用戶和設(shè)備遠(yuǎn)離主要IX點(diǎn),流量到達(dá)這些位置所需的距離會(huì)降低性能并顯著增加傳輸成本。網(wǎng)絡(luò)互聯(lián)需要在靠近最終用戶的最后一公里網(wǎng)絡(luò)附近的邊緣進(jìn)行。數(shù)據(jù)在邊緣互聯(lián)和共享,不涉及核心網(wǎng)。邊緣互聯(lián)將更多流量保留在本地。
低延遲網(wǎng)絡(luò)是邊緣計(jì)算的重要組成,要求網(wǎng)絡(luò)節(jié)點(diǎn)盡可能靠近本地。隨著越來(lái)越多的數(shù)據(jù)在本地產(chǎn)生本保存,網(wǎng)絡(luò)互聯(lián)密度將在邊緣激增,骨干網(wǎng)將延伸到邊緣,對(duì)等互聯(lián)和數(shù)據(jù)交換將發(fā)生在接入網(wǎng)的1-2跳內(nèi)。隨著邊緣計(jì)算基礎(chǔ)設(shè)施的建設(shè),許多設(shè)施將發(fā)揮網(wǎng)絡(luò)間數(shù)據(jù)交換點(diǎn)的作用。網(wǎng)絡(luò)匯聚于這些節(jié)點(diǎn),為邊緣服務(wù)提供支持,降低邊緣服務(wù)延遲,縮短光纖距離,減少網(wǎng)絡(luò)跳數(shù)。隨著計(jì)算向邊緣擴(kuò)展,網(wǎng)絡(luò)交叉連接也將更加分散。預(yù)計(jì)到2025年,75%的數(shù)據(jù)將在工廠、醫(yī)院、零售、城市的邊緣產(chǎn)生、處理、存儲(chǔ)和分析。
5G具有靈活的前導(dǎo)碼,以滿足低延遲連接的需求。隨著邊緣計(jì)算需求的增長(zhǎng),現(xiàn)有的回傳網(wǎng)絡(luò)處理速度無(wú)法匹配5G網(wǎng)絡(luò)數(shù)據(jù)產(chǎn)生的速度和容量需求,需要在邊緣部署新的、更快和更高容量的路由。
5G虛擬化網(wǎng)絡(luò)功能需要高度分布式的數(shù)據(jù)中心。這類數(shù)據(jù)中心可以部署足夠多的服務(wù)器,在運(yùn)行5G網(wǎng)絡(luò)的同時(shí)運(yùn)行邊緣云服務(wù)。
將工作負(fù)載置于邊緣要求對(duì)應(yīng)用構(gòu)建和運(yùn)行的方式進(jìn)行調(diào)整,讓代碼可以從數(shù)據(jù)中心的服務(wù)器到客戶場(chǎng)所設(shè)備中的微控制器。需要管理高度分布式的應(yīng)用和數(shù)據(jù),編排大規(guī)模的邊緣操作。(云原生技術(shù)和DevSecOps技術(shù))推送到邊緣的代碼應(yīng)該是自包含的,每個(gè)組件必須完整,包含代碼、配置、庫(kù)以及軟件定義的環(huán)境,代碼作為一個(gè)整體構(gòu)建、測(cè)試和部署,確保容器或虛擬機(jī)可以在任何地方運(yùn)行。
DPU的出現(xiàn)
在云基礎(chǔ)設(shè)施領(lǐng)域,CPU用于通用計(jì)算,構(gòu)建應(yīng)用生態(tài),虛擬化技術(shù)例如Hypevisor等占用大量的內(nèi)存和CPU資源,而真正用作共享的資源受到較大的影響。以網(wǎng)絡(luò)協(xié)議處理為例,解析報(bào)文需要接近100個(gè)cycle,線速處理10G的網(wǎng)絡(luò)需要約4個(gè)Xeon CPU的核,單做網(wǎng)絡(luò)數(shù)據(jù)包處理,就可以占去一個(gè)8核高端CPU一半的算力。而GPU用于加速計(jì)算,專注于圖像處理、流媒體處理,并繼續(xù)朝著AR、VR處理,AI加速的方向發(fā)展。在云基礎(chǔ)設(shè)施領(lǐng)域,需要一種技術(shù),能夠卸載CPU負(fù)荷,最大限度的將硬件資源共享給租戶。
十年前,網(wǎng)絡(luò)處理器(NP)主要用于包處理、協(xié)議處理加速,應(yīng)用在各種網(wǎng)關(guān)、防火墻、UTM等設(shè)備上,多采用多核NOC架構(gòu)。后來(lái)Intel推出了DPDK技術(shù),在用戶空間上利用自身提供的數(shù)據(jù)平面庫(kù)手法數(shù)據(jù)包,繞過(guò)linux內(nèi)核協(xié)議棧,極大提升了包轉(zhuǎn)發(fā)速率,原來(lái)需要NP來(lái)實(shí)現(xiàn)的網(wǎng)關(guān)類設(shè)備,現(xiàn)在X86就能滿足性能要求。而DPU則是5G時(shí)代集網(wǎng)絡(luò)加速為一體的新型數(shù)據(jù)處理單元。DPU內(nèi)部融合了RDMA、網(wǎng)絡(luò)功能、存儲(chǔ)功能、安全功能、虛擬化功能。接手CPU不擅長(zhǎng)的網(wǎng)絡(luò)協(xié)議處理、數(shù)據(jù)加解密、數(shù)據(jù)壓縮等數(shù)據(jù)處理任務(wù),同時(shí)兼顧傳輸和計(jì)算的需求。DPU起到連接樞紐的作用,一端連接CPU、GPU、SSD、FPGA加速卡等本地資源,一端連接交換機(jī)/路由器等網(wǎng)絡(luò)資源??傮w而言,DPU不僅提高了網(wǎng)絡(luò)傳輸效率,而且釋放了CPU算力資源,從而帶動(dòng)整體數(shù)據(jù)中心的降本增效。
1950年以來(lái),CPU是計(jì)算機(jī)或智能設(shè)備的核心
1990年以來(lái),GPU登上舞臺(tái)
而5G的時(shí)代是數(shù)據(jù)革命時(shí)代,也是DPU的時(shí)代。
什么是DPU
DPU是相當(dāng)于智能網(wǎng)卡的升級(jí)版本,增強(qiáng)了網(wǎng)絡(luò)安全和網(wǎng)絡(luò)協(xié)議的處理能力,增強(qiáng)了分布式存儲(chǔ)的處理能力,將軟件定義網(wǎng)絡(luò)、軟件定義存儲(chǔ)、軟件定義加速器融合到一個(gè)有機(jī)的整體中,解決協(xié)議處理,數(shù)據(jù)安全,算法加速等計(jì)算負(fù)載,替代數(shù)據(jù)中心用于處理分布式存儲(chǔ)和網(wǎng)絡(luò)通信的CPU資源。
DPU本質(zhì)上是分類計(jì)算,是將數(shù)據(jù)處理/預(yù)處理從CPU卸載,同時(shí)將算力分布在更靠近數(shù)據(jù)發(fā)生的地方,從而降低通信量,涵蓋基于GPU的異構(gòu)計(jì)算,基于網(wǎng)絡(luò)的計(jì)算(In-NetworkComputing)、基于內(nèi)存(In-Memory-Computing)的計(jì)算等多個(gè)方面。DPU定位于協(xié)同處理單元,是數(shù)據(jù)面與控制面分離思想的一種實(shí)現(xiàn),其與CPU協(xié)作配合,后者負(fù)責(zé)通用控制,前者專注于數(shù)據(jù)處理。在局域網(wǎng)場(chǎng)景下DPU通過(guò)PCIe/CXL等技術(shù)連接同一邊緣內(nèi)各種CPU、GPU,廣域網(wǎng)場(chǎng)景下主要通過(guò)Ethernet/infiniband等技術(shù)實(shí)現(xiàn)邊緣與邊緣間、邊緣與云之間的連接。
DPU包括特定的報(bào)文處理引擎,如P4、POF等,此外還包含ARM等協(xié)處理器能夠處理路由器場(chǎng)景中的大量分支預(yù)測(cè)。具備低延遲的交換能力,能將不同類型的數(shù)據(jù)包快速分發(fā)給不同的處理單元。
基于DPU的網(wǎng)絡(luò)處理模塊是完全可編程的。相比于ASIC,DPU能隨著網(wǎng)絡(luò)、協(xié)議、封裝和加密算法的快速變化,以軟件的速度改變硬件的能力。通過(guò)DPU提高每個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)上的計(jì)算能力,相比標(biāo)準(zhǔn)網(wǎng)卡,同等算力所需的服務(wù)器數(shù)量更少,降低了前期成本、空間、電力和散熱的要求,DPU會(huì)降低大規(guī)模部署網(wǎng)絡(luò)服務(wù)的TCO。
DPU將成為新的數(shù)據(jù)網(wǎng)關(guān),集成安全功能,使網(wǎng)絡(luò)接口成為隱私的邊界。可將開銷巨大的加解密算法如國(guó)密標(biāo)準(zhǔn)的非對(duì)稱加密算法SM2、哈希算法SM3和對(duì)稱分組密碼算法SM4,交由DPU處理。未來(lái),隨著區(qū)塊鏈技術(shù)的成熟,共識(shí)算法POW、驗(yàn)簽等都會(huì)消耗大量的CPU算力也可以固化在DPU中。
DPU將成為存儲(chǔ)的入口。分布式系統(tǒng)中NVMeof協(xié)議擴(kuò)展到InfiniBand或TCP互聯(lián)的節(jié)點(diǎn)中,實(shí)現(xiàn)存儲(chǔ)的共享和遠(yuǎn)程訪問(wèn)。這些數(shù)據(jù)流的協(xié)議處理可以集成在DPU中,作為各種互聯(lián)協(xié)議控制器。
DPU將成為云服務(wù)提供商管理資源的工具,云服務(wù)提供商將云資源管理占用全部下沉至DPU,將CPU、GPU全部釋放出來(lái),作為基礎(chǔ)設(shè)施提供給云租戶。提供者與使用者兩者之間的資源嚴(yán)格區(qū)分,管理界面清晰,方便使用。
DPU實(shí)現(xiàn)的方式:
不同廠商DPU實(shí)現(xiàn)方式不一:Marvell收購(gòu)了Innovium,提供面向5G的基帶處理 DPU,其OCTEON 10系列DPU,采用臺(tái)積電5nm制程,首次采用ARM Neoverse N2 CPU內(nèi)核;
Netronome,其NFP4000流處理器,包括48個(gè)數(shù)據(jù)包處理內(nèi)核和60個(gè)流處理內(nèi)核,所有這些內(nèi)核都可以通過(guò)P4編程;
Pensando其Capri處理器具有多個(gè)可編程的P4處理單元。
Fungible,其DPU基于MIPS,面向網(wǎng)絡(luò)、存儲(chǔ)、虛擬化,包含52個(gè)MIPS小型通用核以及6個(gè)大類的專用核。英偉達(dá) 2019年3月,收購(gòu)以色列芯片公司Mellanox,其推出的BlueField-2包括8個(gè)ARM Cortex-A72核及多個(gè)專用加速核區(qū)域。DOCA(data center infrastructure-on-a-chip Architecture)作為 DPU上的軟件開發(fā)平臺(tái),提供標(biāo)準(zhǔn)API,將驅(qū)動(dòng)程序、庫(kù)、示例代碼、文檔和與包裝的容器組合在一起,支持基于DPU應(yīng)用和服務(wù)的快速開發(fā)。
英特爾,收購(gòu)了深度學(xué)習(xí)芯片公司Nervana System,以及移動(dòng)和嵌入式機(jī)器學(xué)習(xí)公司Movidius,將CPU與FPGA結(jié)合在一起構(gòu)建DPU。提供DPDK(Intel Data Plane Development Kit),為用戶空間高效的數(shù)據(jù)包處理提供庫(kù)函數(shù)核驅(qū)動(dòng)的支持,通過(guò)SR-IOV技術(shù),實(shí)現(xiàn)不同應(yīng)用通過(guò)DMA直接與PCIe設(shè)備一起工作。FPGA擴(kuò)展到300萬(wàn)個(gè)邏輯單元,可以與其他處理模塊一起實(shí)現(xiàn)網(wǎng)絡(luò)、內(nèi)存、存儲(chǔ)和計(jì)算。
Broadcom基于Arm實(shí)現(xiàn)DPU,主要面向交換機(jī)、路由器芯片。以NetXtreme E系列控制器為基礎(chǔ),搭載TruFlow技術(shù),推出了Stingray SmartNIC。
Xilinx 2019年收購(gòu)了solarFlare,其最新發(fā)布的Alveo SN1000系列基于 16nm UltraScale+FPGA架構(gòu),容量為100萬(wàn)個(gè)LUT,包含一個(gè)NXP的16核ARM處理器,可以在FPGA上每秒處理400萬(wàn)個(gè)狀態(tài)連接和1億個(gè)數(shù)據(jù)包。其solarFlare onload(TCPDirect)功能應(yīng)用于全球90%的金融交易所。
AWS Nitro,采用了網(wǎng)絡(luò)卡、存儲(chǔ)卡、控制器卡多卡形態(tài)來(lái)實(shí)現(xiàn)DPU功能。收購(gòu)了以色列芯片上Annapurna labs。
阿里云,推出了MOC卡產(chǎn)品,集成了志強(qiáng)D處理器、FPGA,是一種單卡形態(tài)產(chǎn)品。
英偉達(dá)的DPU(BlueField-2)功能特色
從2021中國(guó)5G網(wǎng)絡(luò)創(chuàng)新論壇上英偉達(dá)沈宇希嘉賓的演講中獲知,英偉達(dá)的BlueField-2采用SoC架構(gòu)設(shè)計(jì),最大200Gbps帶寬,編碼方式支持NRZ 25Gbps模式和PAM4 50Gbps模式,內(nèi)置ConnectX-6 Dx網(wǎng)卡芯片,支持RDMA,同時(shí)支持TLS/IPSec。圖2:BlueField-2 DPU芯片
DPU可以提供實(shí)時(shí)時(shí)鐘。搭載ConnectX-6DX的DPU,通過(guò)PHC2SYS能夠?qū)崿F(xiàn)服務(wù)器與網(wǎng)卡之間400ns的同步精度,ConnetX-6DX之間借助PTP4l可以實(shí)現(xiàn)20ns的同步精度,滿足5G無(wú)線DU時(shí)鐘同步需求。
DPU增強(qiáng)邊緣網(wǎng)絡(luò)部署智能。DPU支持裸金屬、虛擬化、容器化部署模式。裸金屬控制層通過(guò)DPU仿真NVMe設(shè)備,數(shù)據(jù)層借助DPU的ASIC芯片高速轉(zhuǎn)發(fā),并通過(guò)NVMatrix基于Infiniband或RoCEv2無(wú)損網(wǎng)絡(luò)連接后端高通量分部式集群。DPU可為裸金屬物理機(jī)接入靈活可擴(kuò)展的高速云盤服務(wù)。
DPU可以提供靈活可擴(kuò)展的網(wǎng)絡(luò)設(shè)備。DPU可以配置為兩類設(shè)備:一類為NVIDIA原生設(shè)備,包括PF/VF、SF;另一類為VirtIO-Net設(shè)備。其中,SF專門針對(duì)基于裸金屬的大規(guī)模容器開發(fā),功能與VF設(shè)備相當(dāng),支持RDMA、內(nèi)核協(xié)議棧,開啟無(wú)需打開SR-IOV。該DPU最大支持512個(gè)SF(SubFunction)。圖3:DPU示意圖
DPU對(duì)網(wǎng)絡(luò)加速。DPU采用了ASAP2網(wǎng)絡(luò)加速技術(shù)。ConnetX-6DX內(nèi)置了Embeded switch(E-Switch),能夠?qū)崿F(xiàn)網(wǎng)絡(luò)設(shè)備之前的數(shù)據(jù)交換和處理。E-Switch可編程,支持查表操作及表跳轉(zhuǎn),表項(xiàng)與OVS數(shù)據(jù)面匹配。OVS數(shù)據(jù)面可卸載至E-Switch,通過(guò)ASIC實(shí)現(xiàn)了內(nèi)核OVS的卸載,轉(zhuǎn)發(fā)性能高。通過(guò)ASAP2 將OVS數(shù)據(jù)面、控制面、管理面分開,后兩者通過(guò)DPU的ARM計(jì)算組件來(lái)實(shí)現(xiàn),數(shù)據(jù)面卸載到E-Switch,從而實(shí)現(xiàn)加速的效果。E-Switch支持多種Overlay協(xié)議的卸載,如VXLAN、GRE等,支持報(bào)文頭修改,實(shí)現(xiàn)NAT功能。E-Switch支持Connection Track,實(shí)現(xiàn)TCP連接的狀態(tài)監(jiān)控,此外還支持流量統(tǒng)計(jì)和限速、鏡像;E-Switch與現(xiàn)有SDN控制器及編排工具無(wú)縫兼容?;谠揇PU,裸金屬云可以快速部署,實(shí)現(xiàn)網(wǎng)絡(luò)性能的提升。
DPU提供高可靠的存儲(chǔ)。相比于智能網(wǎng)卡,DPU增加了存儲(chǔ)卸載功能,通過(guò)SNAP技術(shù)向主機(jī)OS呈現(xiàn)多個(gè)存儲(chǔ)設(shè)備。應(yīng)用對(duì)DPU的訪問(wèn)由IO Processor統(tǒng)一處理,包括SPDK和硬件卸載兩種處理方式。用戶可以在DPU連接的存儲(chǔ)設(shè)備上安裝操作系統(tǒng),并啟動(dòng),從而構(gòu)建本地完全沒(méi)有磁盤的裸金屬架構(gòu),實(shí)現(xiàn)比本地磁盤更高的可靠性。租戶對(duì)存儲(chǔ)的定義和訪問(wèn)都通過(guò)DPU完成,對(duì)主機(jī)操作系統(tǒng)無(wú)依賴,同時(shí)可以充分利用遠(yuǎn)端存儲(chǔ)支持?jǐn)?shù)據(jù)快速遷移(分鐘級(jí))。
小結(jié)
當(dāng)前,雖然有眾多巨頭的參與,DPU市場(chǎng)仍然處于初級(jí)階段。隨著網(wǎng)絡(luò)流量指數(shù)上漲,在任何有大流量的地方,DPU都將存在,市場(chǎng)前景廣闊。在DPU加持下,5G時(shí)代邊云協(xié)同、云網(wǎng)一體都將逐漸成為現(xiàn)實(shí)。
作者:5G研究小組? 來(lái)源:SDNLAB君
|