英特爾 至強(qiang) Max 系列(lie)處理器是唯一一款(kuan)基于 x86 的(de)高(gao)帶寬內存 (HBM) 處理器,可最大程度提(ti)(ti)高(gao)帶寬。英特爾 Max 系列(lie) CPU 在(zai)架構設計(ji)上大幅增(zeng)強(qiang)采用 HBM 的(de)英特爾 至強(qiang) 平(ping)臺的(de)性(xing)能(neng),相較(jiao)于競品,其(qi)針對實際工作負載的(de)性(xing)能(neng)提(ti)(ti)升了 4.8 倍,比如建(jian)模、人工智(zhi)能(neng)、深度學習(xi)、高(gao)性(xing)能(neng)計(ji)算 (HPC) 和(he)數(shu)據分析。包括以(yi)下幾個型(xing)號(hao):
英特爾® 至強(qiang)® CPU Max 9468 處理器(105 M 高速緩存(cun),2.10 GHz,48核)
英特爾® 至(zhi)強® CPU Max 9460 處理器(97.5 M 高速緩存,2.20 GHz,40核)
英特爾® 至強® CPU Max 9470 處理(li)器(105 M 高速緩存,2.00 GHz,52核)
英(ying)特爾® 至強® CPU Max 9480 處理器(112.5 M 高速緩存,1.90 GHz,56核)
英特爾® 至(zhi)強® CPU Max 9462 處理(li)器(75 M 高速緩存,2.70 GHz,32核)
處理器框圖(tu)如下圖(tu)所示:

圖 1 處理器(qi)示意(yi)圖
處(chu)(chu)理器包含 4 個(ge) HBM2e 堆棧(zhan),每個(ge)處(chu)(chu)理器的高帶(dai)寬(kuan)內(nei)存 (HBM) 總容量超(chao)(chao)過(guo) 60GB,另外還有 8 通(tong)道 DDR 內(nei)存。雙(shuang)路系統中,兩個(ge)處(chu)(chu)理器通(tong)過(guo)最多 4 個(ge)英(ying)特(te)爾(er) 超(chao)(chao)級(ji)通(tong)道互聯(Intel Ultra Path Interconnect,英(ying)特(te)爾(er) UPI)鏈路連接。雙(shuang)路系統的 HBM 總容量為 128 GB。

圖 2 HBM 中的內(nei)存堆(dui)棧
HBM 內(nei)(nei)存由(you)多個 DRAM 內(nei)(nei)存堆棧組成,通過(guo)寬總線連接(jie)。每個堆棧包(bao)含 8 個堆疊在底層邏(luo)輯芯片(pian)上(shang)的 DRAM。英特爾至強(qiang)CPU Max 系列處(chu)理器配備(bei) 4 個堆棧,HBM 總容量超過(guo) 60GB。
CPU配置
英特爾至強CPU Max 系(xi)列(封(feng)裝(zhuang)或插槽(cao))處(chu)理器中的 HBM 和(he)(he) DDR 內(nei)存可以采用三(san)種內(nei)存模式和(he)(he)兩種集群模式進行配置。
三種內存模式

圖 3 HBM 內存模式(shi)
1 “僅 HBM”內存模式
若(ruo)未(wei)安(an)裝(zhuang)(zhuang) DDR,可選(xuan)擇“僅 HBM”內(nei)存模式(shi)。在此模式(shi)下,HBM 是操(cao)作(zuo)系(xi)(xi)統(tong)和(he)(he)應(ying)用(yong)(yong)唯(wei)一可用(yong)(yong)的內(nei)存。所(suo)有已安(an)裝(zhuang)(zhuang)的 HBM 都對操(cao)作(zuo)系(xi)(xi)統(tong)可見,而(er)應(ying)用(yong)(yong)則會看(kan)到操(cao)作(zuo)系(xi)(xi)統(tong)暴露的部(bu)分。因此,操(cao)作(zuo)系(xi)(xi)統(tong)和(he)(he)應(ying)用(yong)(yong)均可隨時使用(yong)(yong) HBM。但操(cao)作(zuo)系(xi)(xi)統(tong)、后(hou)臺服(fu)務(wu)和(he)(he)應(ying)用(yong)(yong)必須(xu)共享可用(yong)(yong)的 HBM 容量(liang)(每處理器 超過60 GB,實際六十四GB)。
2 “Flat”模式或一級內存 (1LM) 模式
若已安(an)裝 DDR 內(nei)存,可(ke)在(zai)系統啟(qi)動時于 BIOS 菜單中(zhong)選擇(ze)“Flat”(也稱 1LM)模(mo)(mo)式,使 HBM 和(he) DDR 對軟(ruan)件(jian)可(ke)見。在(zai)此模(mo)(mo)式下(xia),HBM 和(he) DDR 各自作(zuo)為(wei)獨立(li)的地址(zhi)空(kong)(kong)間對軟(ruan)件(jian)可(ke)見,即 DDR 作(zuo)為(wei)一個獨立(li)的地址(zhi)空(kong)(kong)間(NUMA 節點)為(wei)軟(ruan)件(jian)所見,而 HBM 作(zuo)為(wei)另(ling)一個地址(zhi)空(kong)(kong)間(NUMA 節點)為(wei)軟(ruan)件(jian)所見。如下(xia)文第(di) 6.2 節所述,用(yong)戶需要使用(yong) NUMA 感知(zhi)工(gong)具(例如 numactl)或庫,才(cai)能(neng)在(zai)該模(mo)(mo)式下(xia)使用(yong) HBM。其他操作(zuo)系統配置需在(zai) HBM 作(zuo)為(wei)常規內(nei)存池一部分被訪問前完成。
3 “緩存”模式或二級內存 (2LM) 模式
若已安裝 DDR,可(ke)在系統啟動時(shi)于 BIOS 菜單中(zhong)選(xuan)擇“緩(huan)(huan)存(cun)”(也稱 2LM)模式,使 HBM 作為 DDR 的內(nei)存(cun)側緩(huan)(huan)存(cun)。在該模式下,僅 DDR 地址空間(jian)對(dui)軟件可(ke)見,而(er) HBM 則(ze)作為 DDR 的透(tou)明內(nei)存(cun)側緩(huan)(huan)存(cun)。因(yin)此,應用(yong)和命(ming)令(ling)行(xing)無需修改即可(ke)使用(yong)“緩(huan)(huan)存(cun)”模式。HBM 屬于直接映(ying)射(she)緩(huan)(huan)存(cun),可(ke)能(neng)需要額外采取配(pei)置步驟才能(neng)盡量減少沖(chong)突未命(ming)中(zhong) (conflict miss) 這種(zhong)情況。