升級集群的好處
云容器引擎使用kubernetes的原生v<主要版本>.<次要版本>.<補丁版本>版本語義,目前尚只支持4個次要版本,分別為v1.23.3, v1.25.6, v1.27.8, v1.29.3版本。云容器引擎會定期發布支持的Kubernetes版本并逐步停止對過期版本的技術支持。建議使用v1.23.3版本的用戶建議盡快升級到更高版本kubernetes,已獲得更好的使用體驗。
主動升級集群有以下好處:
- 降低安全和穩定性風險:隨著Kubernetes版本迭代,會不斷優化及修復發現的安全及穩定性漏洞,長久使用過期版本集群會給業務帶來安全和穩定性風險。
- 享受更好的維護支持:對于過期Kubernetes版本,云容器引擎不再提供安全補丁和問題修復,也無法保證過期版本的技術支持質量。使用新版本能夠讓您享受更好的技術支持和答疑服務。
- 使用新版本的新功能:隨著社區Kubernetes版本的演進,新版本包含新的功能和改進,云容器引擎也將適配新版本,為您帶來更好的開發和運維體驗。
注意事項
1、版本升級策略說明
云容器引擎集群使用kubernetes的官方工具kubeadm升級集群,單次升級只能升級一個次要版本。例如,Kubernetes版本為v1.23.3的云容器引擎集群升級到v1.25.6時,需要進行兩次集群升級,即先升級到v1.24.17版本,再升級到v1.25.6版本。其中v1.24.17版本為過渡版本,云容器引擎并未提供正式的版本支持,用戶需盡快升級至v1.25.6版本。
2、注意事項說明
用戶可以登錄云容器引擎控制臺,在集群頁面可查看到已有的集群實例,在集群列表右側功能區選擇更多->升級,進入版本升級操作界面,初次打開實例的集群升級操作界面時會檢測集群是否已安裝。
cube-system-upgrade-controller和node-problem-detector插件,這兩個插件需要安裝到待升級的集群實例才能使用云容器引擎服務的集群升級功能,檢測到未安裝時控制臺頁面會有相關提示,用戶點擊安裝插件按鈕即可安裝這兩個插件。
集群升級是一項有風險的操作,云容器引擎的將集群升級分為集群預檢和升級兩個步驟,集群預檢功能會評估集群健康狀態以及升級至下一個版本時存在的API兼容性風險,偵測到風險時會提醒用戶存在的風險項,用戶可根據頁面提示修復風險項后再執行升級操作。
3、使用了自定義配置
如果您對集群曾有自定義配置,請仔細閱讀以下說明。
配置項 說明 節點規格 節點資源不足或執行過節點規格縮容操作有可能會影響集群升級。 自定義操作系統鏡像 自定義操作系統鏡像未經過官方嚴格驗證可能導致集群升級不成功。 手工變更集群配置 如果對集群配置有過修改,例如修改了容器運行時配置、直接手工編輯過kubelet的配置文件,集群升級過程有可能失敗或自定義配置有可能丟失。
升級流程、方式及所需時間
升級流程
- 準備工作:當前云容器引擎一次只能往前升級一個次要版本,升級至下一個云容器引擎支持的次要版本時需要執行兩次升級操作。升級前請先參考上文注意事項相關描述。
- 前置檢查:執行前置檢查,若有檢測到風險項,請按控制臺提示進行操作。
- 集群升級:前置檢查通過后,可開始集群升級,云容器引擎會依次升級控制節點和節點池節點。
- 集群升級后:核驗集群、檢查節點池運行是否正常,檢查集群業務是否運行正常。
升級方式
云容器引擎專有集群是采用原地升級方式,首先升級Master節點,Master節點升級是串行的,一次只升級一個Master節點。升級Master組件,包括kube-apiserver、kube-controller-manager、kube-scheduler、Kube-proxy、Etcd、Kubelet等。
云容器引擎當前尚不支持按節點池升級Worker節點,Master節點升級完畢后自動開始升級Worker節點,Worker節點升級可并發執行,并發數通過每批次最大并行數進行配置,每批次最大并行數最大值不能超過Worker節點數量的1/2。
升級所需時間
云容器引擎專有集群的Master節點需逐個、串行升級,每個Master節點升級時間約為8分鐘,Worker節點根據用戶配置的并發數量進行升級,單個worker節點升級時間約為1分鐘。
操作步驟
同時升級控制面和所有節點池
1、登錄云容器引擎控制臺,在左側導航欄選擇集群進入集群列表頁面。
2、在集群列表頁面,選擇待升級的集群實例,在右側功能區選擇更多 > 升級進入集群升級頁面。若頁面提示安裝cube-system-upgrade-controller和node-problem-detector插件,則點擊安裝插件按鈕安裝這兩個插件。
3、在集群升級設置每批次的最大并行數,然后單擊前置檢查,前置檢查約需要執行1分鐘。
若提示前置檢查為正常時,則可以繼續進行集群升級操作。
若提示前置檢查未通過,可點擊查看詳情,然后按照頁面提示進行修復。修復完成后可再次執行前置檢查,確認故障已排查后單擊開始升級。
4、升級完成后,您可以在集群列表查看集群版本,確認升級是否成功。
注意1、升級過程中,請勿添加或刪除節點。
2、集群升級過程發生錯誤時,系統將暫停集群升級進程,集群可能處于部分節點已完成升級的中間狀態,可通過工單待工程師排除問題后再繼續嘗試升級。
3、集群升級過程中,請勿修改system-upgrade命名空間下的相關資源。