GPU資源監控面板
更新時間 2025-06-11 12:12:44
最近更新時間: 2025-06-11 12:12:44
分享文章
本節主要介紹了GPU資源監控面板的用戶指南。
GPU 資源監控面板能夠幫助您從不同的維度(比如:集群、節點、訓練任務等)監控集群的GPU資源使用情況,以及集群的各命名空間下的資源配額使用情況。
前提條件
已開通智算容器集群
監控安裝
登錄 “云容器引擎” 控制臺,在左側導航欄選擇 “集群”。
在“集群”頁面顯示的集群列表中,單擊目標集群名稱,然后在左側導航欄,選擇 “智算套件”。
安裝監控組件,等待安裝完成。
監控面板
從“運維管理” - “監控” 可打開監控面板頁面,提供了 GPU/NPU 多維監控能力。