聚焦 DPU 技術研發與創新 天翼云打造全新一代云計算體系結構
2022-09-07
9月2日,第二屆(jie)SmartNIC&DPU技術(shu)創新峰會在北(bei)京召開。本次大會由江蘇省未(wei)來(lai)網絡創新研究院和SDNLAB聯合行業(ye)技術(shu)先鋒力量、產(chan)業(ye)典型應用企業(ye)共同發(fa)起,圍繞SmartNIC/DPU技術(shu)創新、產(chan)業(ye)應用等(deng)問題(ti)展開研討與(yu)交流。大會現(xian)場還(huan)發(fa)布了(le)2022 SmartNIC & DPU Awards年度評選結果,天翼云DPU云核為基礎打造的(de)全(quan)新云計算體系(xi)結構榮獲(huo)匠芯技術(shu)獎。

在SmartNIC&DPU技(ji)術分(fen)會場,天(tian)(tian)(tian)翼云(yun)科技(ji)有限(xian)公司資深研發(fa)專(zhuan)家(jia)劉祿仁分(fen)享了天(tian)(tian)(tian)翼云(yun)DPU技(ji)術的研發(fa)與(yu)實踐經驗。他表示,天(tian)(tian)(tian)翼云(yun)作為(wei)(wei)國內領先的云(yun)服務商,基于當前(qian)DPU技(ji)術演進(jin)路線,結合需求的零散化、動態變化以(yi)及對DPU產品線上運維問(wen)題(ti)的考量,以(yi)FPGA+CPU的架構作為(wei)(wei)切入點,成功研發(fa)出天(tian)(tian)(tian)翼云(yun)DPU1.0產品,并以(yi)自研DPU云(yun)核為(wei)(wei)基礎打(da)造了為(wei)(wei)云(yun)而生(sheng)的全新云(yun)計算(suan)體系結構。
當(dang)前,摩爾定律的放緩(huan)與(yu)全球(qiu)數據(ju)量(liang)爆發(fa)之間(jian)的矛盾正在(zai)(zai)迅速激化(hua)。IDC數據(ju)顯示,全球(qiu)數據(ju)量(liang)在(zai)(zai)過去10年年均(jun)復合增長(chang)率接近50%,并進一步預測每四個月對(dui)于算(suan)力(li)(li)的需求(qiu)就會翻一倍。與(yu)此相對(dui)的是,傳(chuan)統的數據(ju)中(zhong)心架構(gou)難以滿足大(da)規(gui)模的算(suan)力(li)(li)需求(qiu),CPU性能每年僅提升3%,形(xing)成了明顯的“剪(jian)刀差”現(xian)象。在(zai)(zai)CPU無法(fa)滿足龐大(da)算(suan)力(li)(li)需求(qiu)的背景下,DPU應運而生。

DPU作(zuo)為(wei)計算(suan)負(fu)載的(de)(de)引擎,直(zhi)接效果(guo)是給CPU“減負(fu)”,能(neng)夠提高(gao)數據中心的(de)(de)運(yun)算(suan)效率,減少(shao)能(neng)耗(hao)浪(lang)費(fei),進而降低成本,在(zai)數字時代具有巨大的(de)(de)商業價值與(yu)發(fa)展潛力(li)。天(tian)翼云(yun)DPU1.0實現(xian)了虛擬化的(de)(de)零損耗(hao),具備高(gao)性(xing)能(neng)、低延遲、低抖(dou)動的(de)(de)特性(xing),網絡轉發(fa)性(xing)能(neng)高(gao)達4000萬PPS,存儲云(yun)盤IOPS可(ke)以(yi)達到60W。此外(wai),天(tian)翼云(yun)DPU1.0通(tong)過將傳(chuan)統運(yun)行在(zai)主(zhu)機側的(de)(de)應用轉到DPU云(yun)核上(shang),減少(shao)大量(liang)的(de)(de)適配(pei)工作(zuo),在(zai)主(zhu)機不(bu)同算(suan)力(li)核和不(bu)同架構上(shang)可(ke)做到即(ji)插即(ji)用。
此外(wai),從產品的研發到落地(di),天翼云DPU團(tuan)隊在(zai)網絡、存儲(chu)及(ji)RDMA方面也積(ji)累了豐富的實踐經驗。
在網絡卸載方面,針對(dui)流(liu)表數量大、轉發性能要(yao)(yao)求高、對(dui)SoC和(he)FPGA的(de)內(nei)存容量需(xu)求大、穩定性要(yao)(yao)求高等(deng)(deng)挑(tiao)戰(zhan),天翼云對(dui)rte_flow等(deng)(deng)主要(yao)(yao)數據結構進行壓縮(suo),并對(dui)流(liu)表空(kong)中計算,優化(hua)(hua)裁剪(jian)offload卸載路(lu)徑的(de)多層(ceng)級緩存,從而支持4M流(liu)表,實現了內(nei)存優化(hua)(hua);對(dui)所(suo)有流(liu)表進行合并計算,避免在硬件(jian)層(ceng)執行包重注,使轉發效(xiao)率達到(dao)4000萬(wan)PPS;基于硬件(jian)精確流(liu)表特點設計專用老化(hua)(hua)統(tong)計線程(cheng),減輕OVS Revalidator壓力;初步拆分OVS的(de)統(tong)計和(he)老化(hua)(hua)事務邏(luo)輯,優化(hua)(hua)硬件(jian)流(liu)表的(de)老化(hua)(hua)統(tong)計上報實現邏(luo)輯,提升(sheng)軟件(jian)OVS Revalidator執行效(xiao)率;支持熱升(sheng)級、熱遷移(yi)及熱恢復,做到(dao)B/V/C全場景的(de)并池,大幅提升(sheng)穩定性。
在存儲卸載(zai)方面,針對經(jing)常(chang)(chang)(chang)出現的(de)SoC異常(chang)(chang)(chang)重啟、SPDK異常(chang)(chang)(chang)重啟、熱遷移丟IO等現象,天翼云(yun)從中抽象出共(gong)同特性,利用(yong)軟件(jian)(jian)(jian)(jian)協同的(de)思想(xiang),將SoC側(ce)軟件(jian)(jian)(jian)(jian)的(de)正常(chang)(chang)(chang)行(xing)為和(he)異常(chang)(chang)(chang)行(xing)為進(jin)(jin)行(xing)統一(yi),組件(jian)(jian)(jian)(jian)啟動時統一(yi)發送msg信息給硬件(jian)(jian)(jian)(jian),硬件(jian)(jian)(jian)(jian)收到該msg會解(jie)析(xi)其內容,進(jin)(jin)而(er)從硬件(jian)(jian)(jian)(jian)保存的(de)queue指針信息進(jin)(jin)行(xing)分析(xi),在用(yong)戶(hu)無感狀態下(xia)實現全部(bu)異常(chang)(chang)(chang)的(de)統一(yi)化處理。
在高性(xing)能網(wang)絡方面,擁(yong)(yong)(yong)塞算法(fa)(fa)是RDMA的核心和關鍵(jian),為(wei)提(ti)(ti)高RDMA網(wang)絡的性(xing)能,天翼云(yun)聚焦下一代高效CC算法(fa)(fa)設計,以(yi)更(geng)(geng)好地避(bi)免擁(yong)(yong)(yong)塞、保證公(gong)平性(xing),實現更(geng)(geng)快速(su)收斂、更(geng)(geng)低(di)(di)時延、更(geng)(geng)簡(jian)單(dan)部(bu)署。針對(dui)不(bu)同應(ying)用(yong)場景,天翼云(yun)設計了(le)2套(tao)算法(fa)(fa)eSurfing-CC: 針對(dui)智(zhi)能網(wang)卡+商(shang)用(yong)交(jiao)換(huan)(huan)機(ji)的組合(he),提(ti)(ti)出(chu)基(ji)于RTT+CNP的2段(duan)式端(duan)(duan)到端(duan)(duan)CC算法(fa)(fa),具(ju)有(you)(you)主(zhu)動(dong)擁(yong)(yong)(yong)塞控制、無需(xu)依賴(lai)交(jiao)換(huan)(huan)機(ji)的配(pei)置(zhi)、支持快速(su)啟動(dong)快速(su)收斂等優勢;針對(dui)智(zhi)能網(wang)卡+可(ke)(ke)編程交(jiao)換(huan)(huan)機(ji)的組網(wang)場景,天翼云(yun)在交(jiao)換(huan)(huan)機(ji)上部(bu)署CC算法(fa)(fa),使交(jiao)換(huan)(huan)機(ji)同樣具(ju)備主(zhu)動(dong)擁(yong)(yong)(yong)塞通知能力和主(zhu)動(dong)發(fa)包能力,可(ke)(ke)以(yi)有(you)(you)效降低(di)(di)端(duan)(duan)到端(duan)(duan)響應(ying)時延,同時簡(jian)化(hua)建模和配(pei)置(zhi)復雜度,提(ti)(ti)高系統的可(ke)(ke)擴展性(xing)。
目前,基于天(tian)翼云DPU核心技術打(da)造的多(duo)款產品已(yi)落地應(ying)用,以天(tian)翼云彈(dan)性(xing)裸金屬服務(wu)器為例,該服務(wu)器兼具云服務(wu)器彈(dan)性(xing)和物理機性(xing)能,通過將網絡、存儲等功能卸載(zai)至(zhi)DPU卡,可極大降低(di)物理機側CPU和內存等資源消耗,最終算力(li)遠超(chao)普通云主機,現已(yi)服務(wu)于金融、汽車等多(duo)行業企業。
隨著5G時代數據(ju)量(liang)和傳輸速度的飛速增長,國內廠商爭相進入DPU賽道。根據(ju)Canalys Cloud Channels Analysis預(yu)測,到2023年(nian),中(zhong)國DPU市場(chang)規模將(jiang)達190億人民(min)幣。可以預(yu)見,在數據(ju)中(zhong)心(xin)流量(liang)不斷加大的情(qing)況下,DPU幫助數據(ju)中(zhong)心(xin)提(ti)升算力、降低成本與(yu)能耗(hao)的同時,將(jiang)有更大的施展空間和廣闊(kuo)的發展前景。