節點掛載點檢查
更新時間 2024-01-05 16:04:17
最近更新時間: 2024-01-05 16:04:17
分享文章
本文主要介紹節點掛載點檢查。
檢查項內容
檢查節點上是否存在不可訪問的掛載點。
解決方案
問題場景:節點上存在不可訪問的掛載點
節點存在不可訪問的掛載點,通常是由于該節點或節點上的Pod使用了網絡存儲nfs(常見的nfs類型有obsfs、sfs等),且節點與遠端nfs服務器斷連,導致掛載點失效,所有訪問該掛載點的進程均會D住卡死。
步驟 1 登錄節點。
步驟 2 節點上依次執行如下命令:
df -h for dir in ?df -h | grep -v "Mounted on" | awk "{print \\$NF}"?;do cd $dir; done && echo "ok"
步驟 3 若返回ok則無問題。
否則,請另起一個終端執行如下命令,查詢先前命令是否存在D狀態:
ps aux | grep "D "
步驟 4 若發現進程存在D狀態,則確認為該問題,目前只可以通過重置節點解決。請選擇一個合適的時間重置節點后,重試升級。
說明重置節點會重置所有節點標簽,可能影響工作負載調度,請在重置節點前檢查并保留您手動為該節點打上的標簽。