操作場景
FusionInsight Manager支持配置監控指標閾值用于關注各指標的健康情況,如果出現異常的數據并滿足預設條件后,系統將會觸發一條告警信息,并在告警頁面中出現此告警信息。
操作步驟
- 登錄FusionInsight Manager。
- 選擇“運維 > 告警 > 閾值設置”。
- 在監控分類中選擇集群內指定主機或服務的監控指標。
詳見下圖:配置指標閾值


例如“主機內存使用率”,界面顯示此閾值的信息:
- 發送告警開關指示為

表示將觸發告警。 - “告警ID”和“告警名稱”包含閾值將觸發的告警信息。
- Manager會檢查監控指標數值是否滿足閾值條件,若連續檢查且不滿足的次數等于“平滑次數”設置的值則發送告警,支持自定義。
- “檢查周期(秒)”表示Manager檢查監控指標的時間間隔。
- 規則列表中的條目為觸發告警的規則。
- 單擊“添加規則”,可以新增指標的監控行為。
監控指標規則參數
參數名 參數解釋 參數值 規則名稱 規則名稱
CPU_MAX(舉例)
告警級別
告警級別
l? ? 緊急
l? ? 重要
l? ? 次要
l? ? 提示
l? ? 緊急
l? ? 重要
l? ? 次要
l? ? 提示
閾值類型
選擇某指標的最大值或最小值,類型為“最大值”表示指標的實際值大于設置的閾值時系統將產生告警,類型為“最小值”表示指標的實際值小于設置的閾值時系統將產生告警。
l? ? 最大值
l? ? 最小值
日期
設置規則生效的日期,即哪一天運行規則。
l? ? 每天
l? ? 每周
l? ? 其他
添加日期
僅在“日期”模式為“其他”時可見,設置規則運行的自定義日期,支持多選。
09-30
閾值設置
設置規則運行的具體時間范圍。
起止時間:00:00-8:30
設置規則監控指標的閾值
閾值:10
說明支持單擊
或
設置多個閾值時間條件。
支持單擊
或
設置多個閾值時間條件。
- 單擊“確定”保存規則。
- 在新添加規則所在的行,單擊“操作”中的“應用”,此時規則的“生效狀態”變成“生效”。
當前已創建的規則單擊“取消應用”后,才能應用新規則。
監控指標參考
FusionInsight Manager轉告警監控指標可分為節點信息指標與集群服務指標。下表表示節點中可配置閾值的指標。
節點信息監控指標轉告警列表
監控指標組名稱 監控指標名稱 指標含義 默認閾值 CPU 主機CPU使用率
描述周期內當前集群的運算和控制能力,可通過觀察該統計值,了解集群整體資源的使用情況。
90.0%
磁盤
磁盤使用率
描述主機磁盤的使用率。
90.0%
磁盤inode使用率
統計采集周期內磁盤inode使用率。
80.0%
內存
主機內存使用率
統計當前時間點的內存平均使用率。
90.0%
主機狀態
主機文件句柄使用率
統計采集周期內該主機的文件句柄使用率。
80.0%
主機PID使用率
主機PID使用率。
90%
網絡狀態
TCP臨時端口使用率
統計采集周期內該主機的TCP臨時端口使用率。
80.0%
網絡讀信息
讀包錯誤率
統計采集周期內該主機上該網口的讀包錯誤率。
0.5%
讀包丟包率
統計采集周期內該主機上該網口的讀包丟包率。
0.5%
讀吞吐率
統計周期內網口的平均讀吞吐率(MAC層)。
80%
網絡寫信息
寫包錯誤率
統計采集周期內該主機上該網口的寫包錯誤率。
0.5%
寫包丟包率
統計采集周期內該主機上該網口的寫包丟包率。
0.5%
寫吞吐率
統計周期內網口的平均寫吞吐率(MAC層)。
80%
進程
D狀態進程總數
統計周期內主機上D狀態進程數量。
0
omm進程使用率
統計周期內omm進程使用率。
90