ALM-12067 tomcat資源異常
更新時間 2023-07-11 16:58:53
最近更新時間: 2023-07-11 16:58:53
分享文章
本章節主要介紹 ALM-12067 tomcat資源異常。
告警解釋
HA每85秒周期性檢測Manager的Tomcat資源。當HA連續2次都檢測到Tomcat資源異常時,產生該告警。
當HA檢測到Tomcat資源正常后,告警恢復。
Tomcat資源為單主資源,一般資源異常會導致主備倒換,看到告警時,基本已經主備倒換,并在新主環境上啟動新的Tomcat資源,告警恢復。該告警用于提示用戶,Manager主備倒換的原因。
告警屬性
| 告警ID | 告警級別 | 是否自動清除 |
|---|---|---|
| 12067 | 重要 | 是 |
告警參數
| 參數名稱 | 參數含義 |
|---|---|
| 來源 | 產生告警的集群或系統名稱。 |
| 服務名 | 產生告警的服務名稱。 |
| 角色名 | 產生告警的角色名稱。 |
| 主機名 | 產生告警的主機名。 |
對系統的影響
- Manager主備倒換。
- Tomcat持續重啟。
可能原因
- Tomcat目錄權限異常,Tomcat進程異常。
處理步驟
檢查Tomcat目錄權限是否正常
1.打開FusionInsight Manager頁面,在告警列表中,單擊此告警所在行的
,查看該告警的主機地址。
2.以root用戶登錄告警所在主機。
3.執行命令 su - omm ,切換到omm用戶。
4.執行命令 vi $BIGDATA_LOG_HOME/omm/oms/ha/scriptlog/tomcat.log ,查看ha的Tomcat資源日志,是否有如下關鍵字“Cannot find XXX” ,根據如下關鍵字修復對應文件的權限。
5.等待5分鐘,查看告警是否自動清除。
- 是,處理完畢。
- 否,執行步驟6。
收集故障信息
6.在FusionInsight Manager界面,選擇“運維>日志>下載”。
7.在“服務”中勾選“OmmServer”和 “Tomcat”,單擊“確定”。
8.單擊右上角的
設置日志收集的時間范圍,一般為告警產生時間的前后10分鐘,單擊“下載”。
9.請聯系運維人員,并發送已收集的故障日志信息。
告警清除
此告警修復后,系統會自動清除此告警,無需手工清除。
參考信息
無。