應用場景
在云容器引擎服務中,資源監控已經對接了云監控服務,并能夠使用云監控提供的指標告警能力。
前提條件
已創建集群,具體操作請參見 用戶指南 > 集群 > 新建集群 章節。若已有集群,無需重復操作。
集群已安裝ccse-monitor插件,可參考 用戶指南 > 插件 章節
創建通知組
登陸云容器引擎控制臺, 點擊左側導航欄中的集群,進入集群列表頁面。
在集群列表中點擊需要配置告警的集群,進入集群管理頁面.
左側菜單欄選擇 運維管理 > 指標告警 > 通知組 進入通知組配置頁面。
通知組支持聯系人、翼連、WebHook集成三種通知對象,其中聯系人支持手機號(短信)和郵箱(郵件)、翼連支持發送到翼連群、WebHook支持發送到用戶指定的WebHook后端。
創建基礎策略
登陸云容器引擎控制臺, 點擊左側導航欄中的集群,進入集群列表頁。
在集群列表中點擊需要配置告警的集群,進入集群管理頁面。
左側菜單欄選擇 運維管理 > 指標告警 > 告警策略 進入通知策略配置頁面,點擊按鈕 創建通知策略 創建通知策略。
通知策略可以配置通知對象、通知模板、渲染API地址、通知時段,其中通知對象為用戶在通知組設置的對象,郵件、短信、翼連三種告警方式支持分別獨立配置模板,一般沒有特殊需求使用默認模板即可。
配置指標告警
登陸云容器引擎控制臺, 點擊左側導航欄中的集群,進入集群列表頁面。
在集群列表中點擊需要配置告警的集群,進入集群管理頁面。
左側菜單欄選擇 運維管理 > 指標告警 > 告警規則 進入告警規則頁面,點擊按鈕 創建告警規則 創建告警規則。
目前共提供的告警分組有Kubernetes節點、Kubernetes負載、指標采集上報和黑盒監控,其中節點、負載和指標采集上報均為基礎告警,只要安裝了ccse-monitor插件即可使用,黑盒監控需要應用接入黑盒監控才可使用,可參考 用戶指南 > 集群可觀測 > 黑盒監控 章節。
選擇告警分組和告警指標后會顯示告警閾值及當前集群的指標值,部分指標可以通過告警條件調整告警閾值及判斷條件;告警觸發條件可以選擇立即觸發或告警條件持續數分鐘后才觸發。
查看告警事件歷史及告警發送歷史
登陸云容器引擎控制臺, 點擊左側導航欄中的集群,進入集群列表頁面。
在集群列表中點擊需要配置告警的集群,進入集群管理頁面。
左側菜單欄選擇 運維管理 > 指標告警 > 告警事件歷史 或 告警發送歷史 可分別查看集群告警事件歷史及告警發送歷史。
告警事件歷史頁面可以查看告警事件名稱、事件描述、事件數量、事件狀態等信息,通過右上角事件狀態篩選下拉框還可以篩選指定狀態的告警事件。
告警發送歷史頁面可以查看事件告警的告警狀態、通知狀態等,還可以根據告警的狀態、等級等進行篩選。