概述
AOM提供告警降噪功能,您可以在發送告警通知前按告警降噪規則對告警進行處理,處理完成后再發送通知,避免產生告警風暴。該功能目前僅支持廣州4資源池。
告警降噪功能分為分組、去重、抑制、靜默四部分。
去重為內置策略,服務后臺會自動檢驗告警內容是否一致實現去重的效果,用戶無需手動創建規則。
告警降噪流程圖


分組、抑制、靜默需手動創建規則,創建方式見下方文檔說明。
說明此模塊只作用于消息通知部分,所有觸發的告警和事件都可在告警、事件頁面查看。
創建分組規則
使用分組規則,您可以從告警中篩選出滿足條件的告警子集,然后按分組條件對告警子集分組,告警觸發時同組告警會被匯聚在一起發送一條通知。
當分組條件設為“告警級別等于緊急”時,表示系統會先根據分組條件從告警中過濾出滿足告警級別為緊急的告警子集,然后根據通知合并方式對告警子集合并,合并后的告警可以關聯行動規則,觸發告警通知。
分組流程


創建分組規則
用戶最多可創建100條分組規則。
步驟 1 在左側導航欄中選擇“告警 > 告警降噪”。
步驟 2 在“分組規則”頁簽下單擊 “創建分組規則”,設置規則名稱、分組條件等信息。
創建分組規則


分組規則參數說明
類別 參數名稱 說明 - 規則名稱 分組規則的名稱。名稱只能由大小寫字母、數字、下劃線組成,且不能以下劃線開頭和結尾,最多不能超過100個字符。 描述 分組規則的描述。最多不能超過1024個字符。 告警分組規則 分組條件 根據設置的條件對告警過濾,篩選出符合分組條件的告警,并為符合分組條件的告警設置告警行動規則。
分組條件最多可設置10個并行條件,每個并行條件下最多可設置10個串行條件,每個并行條件下可設置一個或多個告警行動規則。
多個串行條件之間是“和”的關系,多個并行條件之間是“或”的關系,告警需滿足其中一個并行條件下的所有的串行條件。
例如一個并行條件下設置了三個串行條件,依次為“告警級別等于緊急”、“告警級別等于重要”、“告警源等于AOM”,則告警級別為緊急和重要的AOM告警會被篩選出來,并根據設置的告警行動規則執行告警通知操作。告警合并規則 通知合并方式 根據指定字段對分組后的告警合并,合并在一組的告警會被匯聚在一起發送一條通知。
合并方式包括:
按告警源
按告警源 + 嚴重度
按告警源 + 所有標簽首次等待 首次創建告警合并集合后,等待多久發送第一次告警通知。通常設置為秒級別的時間,便于告警合并后再發送,避免告警風暴。
取值范圍:0s-10min,推薦設置為 15s。變化等待 合并集合內的告警數據發生變化后,等待多久發送告警通知。通常設置為分鐘級別的時間。如果您需要盡快收到告警通知,也可設置為秒級時間。
此處的變化是指新增告警或告警狀態改變。
取值范圍:5s-30min,推薦設置為60s。重復等待 合并集合內的告警數據重復后,等待多久發送告警通知。通常設置為小時級別的時間。
此處的重復是指無新增告警和狀態變化,僅其他屬性(例如標題、內容等)改變。
取值范圍:0min-15day,推薦設置為1h。?
步驟 3 設置完成后,單擊“立即創建”,完成分組規則創建。
更多分組規則操作
分組規則創建完成后,還可以執行相關操作。
相關操作
| 操作 | 說明 |
|---|---|
| 編輯分組規則 | 單擊“操作”列的“編輯”。 |
| 刪除分組規則 | 刪除單條規則:單擊對應規則“操作”列的“刪除”。 刪除單條或多條規則:勾選對應規則前的復選框,單擊“批量刪除”。 |
| 搜索分組規則 | 在右上角的搜索框中輸入規則名稱關鍵字,單擊 后顯示匹配對象。 |
創建抑制規則
使用抑制規則,您可以抑制或阻止與某些特定告警相關的其他告警通知。例如:當嚴重級別的告警產生時,可以抑制與其相關的低級別的告警。或當節點故障發生時,抑制節點上的進程或者容器的所有其他告警。
注意事項
若在發送告警通知之前抑制條件對應的源告警已恢復正常,則抑制規則失效,抑制對象(被源告警抑制的告警)將正常發送告警通知。
用戶最多可創建100條抑制規則。
創建抑制規則
步驟 1 在左側導航欄中選擇“告警 > 告警降噪”。
步驟 2 在“抑制規則”頁簽下單擊 “創建抑制規則”,設置規則名稱、根源告警等信息。
創建抑制規則


設置抑制規則
類別 參數名稱 說明 - 規則名稱 抑制規則的名稱。名稱只能由大小寫字母、數字、下劃線組成,且不能以下劃線開頭和結尾,最多不能超過100個字符。 描述 抑制規則的描述。最多不能超過1024個字符。 抑制規則 根源告警 根源告警表示產生抑制的某類特定告警。
根源告警最多可設置10個并行條件,每個并行條件下最多可設置10個串行條件。多個串行條件之間是“和”的關系,多個并行條件之間是“或”的關系,告警需滿足其中一個并行條件下的所有的串行條件。
若串行條件設置為“告警級別等于緊急”,則符合告警級別為緊急的告警會被篩選出來,作為根源告警。抑制告警 抑制告警表示被根源告警抑制的某類特定告警。
參數設置方式與根源告警相同。
當根源告警的串行條件設為“告警級別等于緊急”,抑制告警的串行條件設為“告警級別等于提示”時,表示當產生緊急級別的告警時,會抑制提示級別的告警。
步驟 3 設置完成后,單擊“立即創建”。
抑制規則創建后,默認對所有分組后的告警生效。
更多抑制規則操作
抑制規則創建完成后,您還可以執行相關操作。
相關操作
| 操作 | 說明 |
|---|---|
| 編輯抑制規則 | 單擊“操作”列的“編輯”。 |
| 刪除抑制規則 | 刪除單條規則:單擊對應規則“操作”列的“刪除”。 刪除單條或多條規則:勾選對應規則前的復選框,“批量刪除”。 |
| 搜索抑制規則 | 在右上角的搜索框中輸入規則名稱關鍵字,單擊 后顯示匹配對象。 |
創建靜默規則
通過靜默規則,您可以在指定時間段屏蔽告警通知,靜默規則一旦創建完成,即刻生效。
創建靜默規則
用戶最多可創建100條靜默規則。
步驟 1 在左側導航欄中選擇“告警 > 告警降噪”。
步驟 2 在“靜默規則”頁簽下單擊“創建靜默規則”,設置規則名稱、靜默條件等信息。
創建靜默規則


設置靜默規則
類別 參數名稱 說明 - 規則名稱 靜默規則的名稱。名稱只能由大小寫字母、數字、下劃線組成,且不能以下劃線開頭和結尾,最多不能超過100個字符。 描述 靜默規則的描述。最多不能超過1024個字符。 靜默規則 靜默條件 待靜默的告警通知需符合的條件,即滿足該條件的告警通知均會被屏蔽。
靜默條件最多可設置10個并行條件,每個并行條件下最多可設置10個串行條件。多個串行條件之間是“和”的關系,多個并行條件之間是“或”的關系,告警需滿足其中一個并行條件下的所有的串行條件。
若串行條件設置為“告警級別等于緊急”,則符合告警級別為緊急的告警通知會被屏蔽。靜默時間 告警通知被屏蔽的時間,包含以下兩種:
固定時間:僅在指定的時間段執行屏蔽告警通知的操作。
?周期時間:根據設置的時間周期循環執行屏蔽告警通知的操作。時區/語言 告警通知被屏蔽的時區/語言,默認為用戶首選項配置的時區/語言,可根據需要修改。
步驟 3 設置完成后,單擊“確定”。
更多靜默規則操作
靜默規則創建完成后,您還可以執行相關操作。
相關操作
| 操作 | 說明 |
|---|---|
| 修改靜默規則 | 單擊“操作”列的“編輯”。 |
| 刪除靜默規則 | 刪除單條規則:單擊對應規則“操作”列的“刪除”。 刪除單條或多條規則:勾選對應規則前的復選框,單擊“批量刪除”。 |
| 搜索靜默規則 | 在右上角的搜索框中輸入規則名稱關鍵字,單擊 后顯示匹配對象。 |
后顯示匹配對象。
后顯示匹配對象。
后顯示匹配對象。