移除節點
更新時間 2024-01-05 16:04:19
最近更新時間: 2024-01-05 16:04:19
分享文章
本文主要介紹移除節點。
操作場景
在集群中移除節點會將該節點移出集群,然后重裝節點的操作系統,并清理節點上的CCE組件。
移除不會刪除節點對應的服務器。移除前請確認您的正常業務運行不受影響,請謹慎操作。
節點移出集群后會繼續開機運行,并繼續產生費用。
約束限制
- 當且僅當CCE集群狀態為運行中或不可用時允許移除節點。
- 當且僅當CCE節點狀態為運行中、不可用或錯誤時允許被移除。
- 為使CCE節點正常移除,且移除后能正常重裝操作系統清理CCE組件,請確保服務器處于正常運行中狀態。
- 若節點在CCE集群移除后重裝操作系統失敗,請手動完成失敗節點的操作系統重裝,并在重裝后登錄節點執行清理腳本完成CCE組件清理,具體步驟參見[重裝操作系統失敗如何處理]( " ")。
- 移除節點會導致與節點關聯的[本地持久存儲卷]( " ")類型的PVC/PV數據丟失,無法恢復,且PVC/PV無法再正常使用。移除節點時使用了本地持久存儲卷的Pod會從移除的節點上驅逐,并重新創建Pod,Pod會一直處于pending狀態,因為Pod使用的PVC帶有節點標簽,由于沖突無法調度成功。
注意事項
- 移除節點會涉及Pod遷移,可能會影響業務,請在業務低峰期操作。
- 操作過程中可能存在非預期風險,請提前做好相關的數據備份。
- 操作過程中,后臺會把當前節點設置為不可調度狀態。
- 移除節點重裝操作系統后將清理原有的LVM分區,通過LVM管理的數據將會清空,請提前做好相關的數據備份。
操作步驟
步驟 1 登錄CCE控制臺,單擊集群名稱進入集群。
步驟 2 在左側列表中選擇節點管理,單擊節點后的“更多 > 移除”。
圖 移除節點

您還可以選中多個節點一起移除,如下圖所示。
圖 一次移除多個節點

步驟 3 在彈出的“移除節點”配置重裝操作系統需要的登錄信息,單擊“是”,等待完成節點移除。
移除節點后,原有節點上的工作負載實例會自動遷移至其他可用節點。
重裝操作系統失敗如何處理
移除節點重裝操作系統可能會失敗,如果碰到這種情況,您可以執行如下步驟重裝操作系統并清理節點上的CCE組件。
步驟 1 登錄服務器的管理控制臺,完成操作系統的重裝,詳細步驟請參見切換操作系統。
步驟 2 登錄服務器,執行如下命令完成CCE組件和LVM數據的清理。
將如下腳本寫入clean.sh文件。
lsblk
vgs --noheadings | awk '{print $1}' | xargs vgremove -f
pvs --noheadings | awk '{print $1}' | xargs pvremove -f
lvs --noheadings | awk '{print $1}' | xargs -i lvremove -f --select {}
function init_data_disk() {
all_devices=$(lsblk -o KNAME,TYPE | grep disk | grep -v nvme | awk '{print $1}' | awk '{ print "/dev/"$1}')
for device in ${all_devices[@]}; do
isRootDisk=?(lsblk -o KNAME,MOUNTPOINT (lsblk?oKNAME,MOUNTPOINT?device 2>/dev/null| grep -E '[[:space:]]/$' | wc -l )
if [[ ${isRootDisk} != 0 ]]; then
continue
fi
dd if=/dev/urandom of=${device} bs=512 count=64
return
done
exit 1
}
init_data_disk
lsblk
執行如下命令。
bash clean.sh