新建資源組
更新時間 2025-05-08 09:14:46
最近更新時間: 2025-05-08 09:14:46
分享文章
本文向您介紹新建資源組,幫助您了解一體化計算加速平臺·異構計算資源組的基本情況。
資源組是指運行所需要的資源組合。一體化計算加速平臺·異構計算提供兩種資源組類型:標準資源組和擴展資源組。標準資源組提供基于GPU物理機和GPU云主機(部分資源池支持)的集群化開通與管理,擴展資源組在標準資源組基礎上提供全托管和高可用控制面板的標準Kubernetes集群服務,支持以本產品的計算節點作為Kubernetes集群的工作節點。用戶可在一體化計算加速平臺·異構計算產品控制臺便捷地完成購買、使用的全流程,如果用戶已購買單獨的裸金屬資源,也可在資源組創建時選擇已有節點將裸金屬添加至一體化計算加速平臺·異構計算資源組,用于后續的訓練任務使用。關鍵能力包括:
- 算力節點間RDMA無損高速網絡連接
- 高性能自研集合通信庫CTCCL
- 高性能自研Checkpoint框架CTFlashCkpt
使用前提
當前用戶是主賬號。
操作步驟
- 登錄,單擊左側導航欄中的“資源組”,進入資源組列表頁。
- 單擊列表頁左上方的上方的“創建資源組”,進入創建頁面。
- 在創建頁面進行新建資源組流程,根據自己的需求選擇創建“標準資源組”或者“擴展資源組”。
- 標準資源組創建需要輸入資源組信息:輸入資源組名稱、可用區、網絡等基本信息。標準資源組配額默認10個,可通過工單升級,單資源池最多升級為50個。
字段說明:
| 字段名稱 | 類型 | 是否必填 | 長度 | 說明 |
|---|---|---|---|---|
| 資源組名稱 | 輸入框 | 是 | 20字符 | 支持中英文、數字、下劃線(_),1-20個字符,不能以下劃線開頭。資源組名稱不能重復。 |
| 可用區 | 單選 | 是 | - | 默認第一個可用區,根據各資源池可用區情況顯示。 |
| 節點類型 | 多選 | 是 | - | 包括物理機和云主機兩類,默認全部選中,至少選擇一種。 |
| 資源組GPU卡類型 | 單選 | 是 | - | 包括英偉達和昇騰兩個類型,默認選中英偉達。 |
| 虛擬私有云 | 下拉單選 | 是 | - | 點擊可刷新VPC列表,點擊“創建VPC”新打開頁面跳轉至VPC創建頁面。 |
| 子網 | 下拉單選 | 是 | - | 篩選子網下的 普通子網類型,點擊選擇VPC子網,點擊“創建子網”新打開頁面跳轉至VPC創建頁面。 |
| 安全組 | 顯示 | 是 | - | 默認查詢是否有對應的安全組,如有則展示,如無則需要點擊自動創建按鈕進行創建,管理節點的安全組名稱是:cwai-VPCID。可點擊自動創建按鈕。 |
| 網絡拓撲親和性 | 勾選項 | 否 | - | 該功能目前處于試用階段,僅適用于GPU裸金屬場景,開通時系統會根據網絡拓撲現狀優先選擇相鄰位置的節點以降低節點間通信時延。 |
| 描述 | 輸入框 | 否 | 1-300字符 | |
| 協議 | 鏈接 | 是 | - | 點解鏈接至協議頁面,勾選之后可點擊確認按鈕。 |
- 擴展資源組創建的具體步驟如下:
擴展資源組配額默認10個,可通過工單升級,單資源池最多升級為50個。
1)輸入資源組名稱、可用區、網絡等基本信息。
| 字段名稱 | 類型 | 是否必填 | 長度 | 說明 |
|---|---|---|---|---|
| 資源組名稱 | 輸入框 | 是 | 20字符 | 支持中英文、數字、下劃線(_),1-20個字符,不能以下劃線開頭。資源組名稱不能重復。 |
| 可用區 | 單選 | 是 | - | 默認第一個可用區,根據各資源池的可用區顯示。 |
| 節點類型 | 單選 | 是 | - | 包括物理機和云主機兩個選項,只能選擇一個,默認選中物理機。 |
| 資源組GPU卡類型 | 單選 | 是 | - | 包括英偉達和昇騰兩個類型,默認選中英偉達。 |
| 虛擬私有云 | 下拉單選 | 是 | - | 點擊可刷新VPC列表,點擊“創建VPC”新打開頁面跳轉至VPC創建頁面。 |
| 子網 | 下拉單選 | 是 | - | 顯示普通類型的子網信息,點擊創建子網,可跳轉至創建子網頁面。 |
| 安全組 | 顯示 | - | 默認查詢是否有對應的安全組,如有則展示,如無則需要點擊自動創建按鈕進行創建,管理節點的安全組名稱是:cwai-VPCID 。可點擊自動創建按鈕。 | |
| 網絡拓撲親和性 | 勾選項 | 否 | - | 該功能目前處于試用階段,僅適用于GPU裸金屬場景,開通時系統會根據網絡拓撲現狀優先選擇相鄰位置的節點以降低節點間通信時延。 |
| 調度策略 | 多選項 | 否 | - | 支持DRF,Binpack ,Gang三種調度策略,可以多選。 |
| 描述 | 輸入框 | 否 | 0-300字符 |
2)輸入組件配置信息:
| 字段名稱 | 類型 | 是否必填 | 長度 | 說明 |
|---|---|---|---|---|
| 資源組規模 | 單選 | 是 | - | 包括4種,1-100節點,101-300節點,301-500節點,500節點以上,默認選擇 1-00節點。 |
| 計費模式 | 單選 | 是 | - | 支持包周期或按需兩種模式,默認包周期。 |
| 規格 | 單選 | 是 | - | 選擇資源池可選的規格。 |
| 操作系統 | 單選 | 是 | - | 選擇管理節點的操作系統。 |
| 系統盤 | 單選 | 是 | - | 僅支持超高IO類型,最小40G,系統盤規格范圍40-2048。 |
| 數據盤 | 單選 | 是 | - | 選擇一塊數據盤,僅支持超高IO類型,最小500G,數據盤規格范圍500-32768。 |
| 數量 | 輸入框 | 是 | - | 默認為3。 |
| API Server | 選擇 | 是 | - | 標準I型,增強I型,高階I型,默認標準I型。 |
| 使用EIP暴露API server | 選擇 | 否 | - | 默認未勾選。 |
| EIP | 選擇 | 否 | - | 當使用EIP暴露API server 為選中狀態時,需要選擇已有的EIP。 |
| 時長 | 選擇 | 是 | - | 包周期時顯示,支持按年、按月,按月支持1-11月,按鈕支持1-3年。 |
| 續訂方式 | 選項 | 是 | - | 包括自動續訂,手動續訂。 |
3)開通信息確認:勾選協議,點擊確認按鈕完成擴展資源組創建。完成支付后即完成資源組的創建,后續資源組管理員便可在資源組列表/詳情頁中對資源組進行管理。