告警解釋
系統每小時周期性檢測租戶所關聯的每個目錄的文件對象使用率(每個目錄已使用的文件對象個數/每個目錄分配的文件對象個數),并把每個目錄實際的文件對象使用率和該目錄設置的閾值相比較。當檢測到租戶所關聯的目錄文件對象使用率高于該目錄的閾值時,產生該告警。
當上報告警的目錄的文件對象使用率小于或等于該目錄設置的閾值時,告警恢復。
告警屬性
| 告警ID | 告警級別 | 是否自動清除 |
|---|---|---|
| 14025 | 次要 | 是 |
告警參數
| 參數名稱 | 參數含義 |
|---|---|
| 來源 | 產生告警的集群名稱。 |
| 服務名 | 產生告警的服務名稱。 |
| 角色名 | 產生告警的角色名稱。 |
| 主機名 | 產生告警的主機名稱。 |
| 租戶名 | 產生告警的租戶名稱。 |
| 目錄名 | 產生告警的目錄名稱。 |
| Trigger condition | 系統當前指標取值滿足自定義的告警設置條件。 |
對系統的影響
當監控的租戶目錄下的文件對象使用率超過用戶自定義設置的閾值時觸發該告警,但不影響對該目錄繼續寫入文件。一旦超過該目錄分配的最大文件對象個數,則HDFS寫入數據會失敗。
可能原因
- 告警閾值配置不合理。
- 租戶分配的文件目錄數上限不合理。
處理步驟
查看閾值設置是否合理
1.查看告警定位信息,獲取上報告警的租戶名稱,租戶目錄。
2.在FusiongInsight Manager首頁,單擊“租戶資源”頁面選擇上報告警的租戶名稱,單擊“資源”,查看上報告警的租戶目錄所對應的文件數閾值配置設置是否合理(默認90%為合理值,用戶可以根據自己的實際需求調節)。
- 是,執行步驟5。
- 否,執行步驟3。
3.根據該租戶該目錄文件數的實際使用情況,在“資源”頁面單擊“修改”修改或取消上報告警的租戶目錄所對應的文件數閾值配置。
4.等待1分鐘,檢查該告警是否恢復。
- 是,處理完畢。
- 否,執行步驟5。
查看租戶分配的文件對象數是否合理
5.在FusionInsight Manager首頁,在“租戶資源”頁面選擇上報告警的租戶名稱,單擊“資源”,查看上報告警的租戶目錄所對應的文件目錄數上限設置是否合理(根據該租戶該目錄實際業務情況而定)。
- 是,執行步驟8。
- 否,執行步驟6。
6.根據租戶該目錄的實際業務情況,在“資源”頁面單擊“修改”修改或取消上報告警的租戶目錄所對應的文件目錄數上限。
7.等待1分鐘,檢查該告警是否恢復。
- 是,處理完畢。
- 否,執行步驟8。
收集故障信息
8.在FusionInsight Manager首頁,選擇“運維 > 日志 > 下載”。
9.在“服務”中勾選待操作集群的“HDFS”和Manager下的NodeAgent。
10.單擊右上角的
設置日志收集的“開始時間”和“結束時間”分別為告警產生時間的前后20分鐘,單擊“下載”。
11.請聯系運維人員,并發送已收集的故障日志信息。
告警清除
此告警修復后,系統會自動清除此告警,無需手工清除。
參考信息
無。