ALM-13005 ZooKeeper中組件頂層目錄的配額設置失敗
更新時間 2023-07-11 18:23:11
最近更新時間: 2023-07-11 18:23:11
分享文章
本章節主要介紹ALM-13005 ZooKeeper中組件頂層目錄的配額設置失敗。
告警解釋
系統每5小時周期性為組件和“customized.quota”配置項中的每個ZooKeeper頂層目錄設置配額,當設置某個目錄的配額失敗時,會產生該告警。
當設置失敗的目錄重新設置配額成功時,告警恢復。
告警屬性
| 告警ID | 告警級別 | 是否自動清除 |
|---|---|---|
| 13005 | 次要 | 是 |
告警參數
| 參數名稱 | 參數含義 |
|---|---|
| 來源 | 產生告警的集群名稱。 |
| 服務名 | 產生告警的服務名稱。 |
| 服務目錄 | 產生告警的目錄名稱。 |
| Trigger Condition | 產生告警的具體原因。 |
對系統的影響
組件可以向對應的ZooKeeper頂層目錄中寫入大量數據,導致Zookeeper服務不可用。
可能原因
告警目錄對應的配額值不合理。
處理步驟
檢查告警目錄對應的配額值是否合理
- 在FusionInsight Manager,選擇“集群 > 待操作集群的名稱 > 服務 >ZooKeeper > 配置 > 全部配置 > 配額”。查看“customized.quota”配置項中,是否有產生該告警的告警目錄及對應的配額值。
- 是,執行步驟 5。
- 否,執行步驟 2。
- 查看下表中的組件告警目錄列中,是否有產生該告警的告警目錄。
詳見下表:各組件告警目錄
| 組件名稱 | 組件告警目錄 |
|---|---|
| Hbase | /hbase |
| Hive | /beelinesql |
| Yarn | /rmstore |
| Storm | /stormroot |
| Streaming | /storm |
| Kafka | /kafka |
- 是,執行步驟3。
- 否,執行步驟7。
-
查看該表中告警目錄對應的組件名稱,并打開其相應的服務界面,選擇“配置 > 全部配置”,右上角搜索框輸入“zk.quota”,搜索結果就是該告警目錄對應的配額值。
-
檢查產生告警的目錄對應的配額值是否不合理。合理的配額值應該大于等于目錄當前的實際使用值,該值可以在告警參數“Trigger Condition”中獲取。
-
根據告警信息的提示,修改不合理的配額值,并保存配置。
-
等待配置項“service.quotas.auto.check.cron.expression”中指定的定時時長后,查看告警是否消失。
- 是,處理完畢。
- 否,執行步驟7。
收集故障信息
- 在FusionInsight Manager界面,選擇“運維 > 日志 > 下載”。
- 在“服務”中勾選待操作集群的“ZooKeeper”。
- 單擊右上角的
設置日志收集的“開始時間”和“結束時間”分別為告警產生時間的前后10分鐘,單擊“下載”。 - 請聯系運維人員,并發送已收集的故障日志信息。
告警清除
此告警修復后,系統會自動清除此告警,無需手工清除。
參考信息
無。