創建隊列
更新時間 2025-01-10 09:52:46
最近更新時間: 2025-01-10 09:52:46
分享文章
一個資源組可創建多個隊列,在運行訓練任務時,通過將任務綁定到隊列進行資源的排隊和使用申請。只有擴展資源組可以用來創建隊列。
使用前提
- 當前用戶是主賬號。
- 資源組列表中存在>=1個擴展資源組。
操作步驟
- 登錄一體化計算加速平臺·異構計算平臺,在左側導航欄點擊“資源組>隊列”,進入“隊列列表”頁面。
- 單擊左上方“創建隊列”,進入“創建隊列”頁面。
- 在創建頁面填寫基本信息和配置信息。
基本信息
| 參數名稱 | 說明 |
|---|---|
| 資源組 | 必填,選擇隊列所屬的擴展資源組。 |
| 隊列名稱 | 必填,支持中英文、數字、下劃線(_),1-20個字符,不能以下劃線為開頭。 |
| 隊列描述 | 選填,隊列的簡介。支持最多輸入300字符。 |
配置信息
| 參數名稱 | 說明 |
|---|---|
| 節點型號 | 必填,選擇基本信息中已選資源組的節點類型。 節點型號名字展示了芯片廠商、顯卡型號、該節點型號中每個節點內可用的GPU、CPU、內存的規格。此處型號中CPU與內存顯示已去除節點自身系統占用的部分。 選定節點型號后,可點擊“刷新”按鈕,刷新該節點類型的資源組內GPU、CPU、內存可用量。 |
| GPU | 必填,整數,填寫為該隊列分配的GPU數量。輸入值需∈[0,資源組剩余量]。 輸入GPU卡數后可點擊“計算”按鈕,可依據GPU輸入卡數和節點型號的資源比例計算出CPU/內存參考值,參考值可修改。 示例:節點類型選擇為huawei-Ascend910 8卡 172C 1382G,此時資源組內該節點類型的GPU/CPU/內存剩余資源量分別為32卡/688C/5528G,在GPU文本框內輸入16卡,點擊“計算”按鈕,會依據8卡:172C:1382G的比例計算出CPU/內存的參考值344/2764,并填入對應文本框。可根據實際需要對參考值進行更改。 |
| CPU | 必填,整數,填寫為該隊列分配的CPU數量。輸入值需∈[0,資源組剩余量]。 |
| 內存 | 必填,整數,填寫為該隊列分配的內存數量。輸入值需∈[0,資源組剩余量]。 |
| 節點親和性 | 非必填,設置節點調度策略,目前僅支持軟親和調度,設置后在創建任務時可以讓任務優先運行在指定標簽的節點上。需在“節點”模塊為相應節點設置標簽后才可選擇。 |
4.完成上述配置后,單擊右下角“創建”即完成擴展資源組中隊列的創建。在“隊列列表”頁面可查看新創建的隊列信息。
- 支持通過隊列列表查看隊列綁定的工作空間。
- 支持以資源組名稱和隊列名稱維度檢索隊列。
- 支持通過單擊刷新按鈕,查看最新的隊列的GPU/CPU/內存的總配額和已用配額、排隊任務數、排隊任務總需求配額。