訓練類
更新時間 2025-01-10 09:50:56
最近更新時間: 2025-01-10 09:50:56
分享文章
本文匯總了使用一體化計算加速平臺·異構計算產品時常見的訓練類問題。
訓練任務處于已完成狀態時占用資源嗎?
訓練完成的任務會繼續占用資源,如需釋放資源請備份相關訓練結果數據點擊停止任務資源即可被釋放。
進行多機多卡訓練時,Master容器實例運行成功,但Worker容器實例一直處于Pending狀態的原因是什么?
可能是由于啟動命令簡單引起Master容器已運行成功并退出,Worker容器初始化需要Master容器運行狀態,但此時Master容器已退出。具體原因請提交工單查詢。