一、 集群安裝nginx-ingress插件失敗,一直處于創建中?
問題背景
客戶已經購買并搭建了CCE集群,希望在公網上可以訪問到CCE上部署的應用服務,目前最高效的方式是在ingress資源上注冊該應用的Service路徑,從而滿足要求。
但客戶安裝ingress插件后,插件狀態一直顯示“創建中”,nginx-ingress-contoller的pod一直處于pending狀態。
解決方案
nginx限制的內存資源不足導致無法啟動,取消限制后正常。
場景模擬
步驟 1 新集群3個節點,規格 6cpu,12G內存,每個節點2U4G。
步驟 2 單擊nginx-ingress插件安裝,選擇規格2核2G。
步驟 3 nginx-ingress deployment安裝成功,但是nginx-ingress-controller安裝失敗。
一直處于創建中


安裝失敗


步驟 4 錯誤顯示資源不足。


步驟 5 添加節點資源為4U8G后,nginx-ingress安裝正常。
問題原因
最初建立的集群中各節點的基本配置為2U4G,且各節點上有kubelet,kube-proxy及docker等相關程序占用系統資源,導致節點可用資源低于2000m,無法滿足nginx-ingress插件的要求,從而無法安裝。
建議方案
請重新購買節點,節點要求(>=4U8G)。
1.1.2 NPD插件版本過低導致進程資源殘留問題
問題描述
在節點負載壓力比較大的場景下,可能存在NPD進程資源殘留的問題。
問題現象
登錄到CCE集群的ECS節點,查詢存在大量npd進程。


解決方案
升級npd插件至最新版本。
步驟 1 登錄CCE控制臺,進入集群,在左側導航欄中選擇“插件管理”,在“已安裝插件”下,單擊npd下的“升級”。
說明
如果npd插件版本已經為1.13.6及以上版本,則不需要進行升級操作。
步驟 2 在基本信息頁面選擇插件版本(例如1.13.6),單擊“下一步”。
步驟 3 npd插件暫未開放可配置參數,直接單擊“升級”即可升級npd插件。