隔離主機
更新時間 2023-08-21 17:33:01
最近更新時間: 2023-08-21 17:33:01
分享文章
本章節主要介紹翼MapReduce的隔離主機操作。
操作場景
某個主機出現異常或故障,無法提供服務或影響集群整體性能時,可以臨時將主機從集群可用節點排除,使客戶端訪問其他可用的正常節點。
說明隔離主機僅支持隔離非管理節點。
對系統的影響
- 主機隔離后該主機上的所有角色實例將被停止,且不能對主機及主機上的所有實例進行啟動、停止和配置等操作。
- 主機隔離后部分服務的實例不再工作,服務的配置狀態可能過期。
- 主機隔離后無法統計并顯示該主機硬件和主機上實例的監控狀態及指標數據。
- 待操作節點的SSH端口需保持默認(22),否則將導致本章節任務操作失敗。
操作步驟
- 登錄FusionInsight Manager。
- 單擊“主機”。
- 勾選待隔離主機前的復選框。
- 在“更多”選擇“隔離”。
在彈出窗口中,輸入當前登錄的用戶密碼確認管理員身份,單擊“確定”。
- 在確認隔離的對話框中勾選“我確定隔離所選主機,接受可能出現的服務故障等后果。”單擊“確定”。
界面提示“操作成功。”,單擊“完成”,主機成功隔離,“運行狀態”顯示為“已隔離”。
- 以root用戶登錄到被隔離主機上,執行pkill -9 -u omm命令終止節點上的omm用戶的進程,然后執行ps -ef | grep 'container' | grep '${BIGDATA_HOME}' | awk '{print $2}' | xargs -I '{}' kill -9 '{}'命令查找并終止container的進程。
- 管理員已排除主機的異常或故障后,需要將主機隔離狀態取消才能繼續使用該主機。
在“主機”界面勾選已隔離的主機,選擇“更多 > 取消隔離”。
說明取消隔離后,主機上所有角色實例默認不啟動。若需要啟動主機上角色實例,可以在“主機”頁面勾選目標主機,然后選擇“更多 > 啟動所有實例”。