告警解釋
當主Manager節點在7秒內沒有收到備Manager節點的心跳信號時,產生該告警。
當主Manager節點收到備Manager節點的心跳信號后,告警恢復。
告警屬性
| 告警ID | 告警級別 | 是否自動清除 |
|---|---|---|
| 12010 | 重要 | 是 |
告警參數
| 參數名稱 | 參數含義 |
|---|---|
| 來源 | 產生告警的集群或系統名稱。 |
| 服務名 | 產生告警的服務名稱。 |
| 角色名 | 產生告警的角色名稱。 |
| 主機名 | 產生告警的主機名。 |
對系統的影響
如果主Manager進程異常,主備倒換無法進行,影響業務。
可能原因
- 主備Manager節點間鏈路異常。
- 節點名配置錯誤。
- 防火墻禁用端口。
處理步驟
檢查主備Manager服務器間的網絡是否正常
1.在FusionInsight Manager頁面,選擇“運維 > 告警 > 告警”,單擊此告警所在行的
,查看該告警的備Manager服務器(即Peer Manager)IP地址。
2.以root用戶登錄主Manager服務器。
3.執行ping 備Manager心跳IP地址命令檢查備Manager服務器是否可達。
- 是,執行步驟6。
- 否,執行步驟4。
4.聯系網絡管理員查看是否為網絡故障。
- 是,執行步驟5。
- 否,執行步驟6。
5.修復網絡故障,查看告警列表中,該告警是否已清除。
- 是,處理完畢。
- 否,執行步驟6。
檢查節點名配置是否正確
6.進入軟件安裝目錄。
cd /opt
7.查找主備節點的配置文件目錄。
find -name hacom_local.xml
8.進入workspace目錄。
cd ${BIGDATA_HOME}/om-server/OMS/workspace0/ha/local/hacom/conf/
9.使用vim命令打開hacom_local.xml,查看local、peer節點配置是否正確,local配置主節點,peer配置備節點。
- 是,執行步驟12。
- 否,執行步驟10。
10.修改hacom_local.xml中主備節點的配置,修改完成后,按Esc回到命令模式,輸入命令:wq保存退出。
11.查看此告警信息是否自動清除。
- 是,處理完畢。
- 否,執行步驟12。
檢查是否防火墻禁用端口
12.執行命令lsof -i :20012查詢主備節點的心跳端口是否打開,有查詢結果說明端口已經開放,否則說明端口被防火墻禁用。
- 是,執行步驟13。
- 否,執行步驟16。
13.執行命令iptables -P INPUT ACCEPT,防止與服務器斷開。
14.清除防火墻。
iptables -F
15.查看告警列表中,該告警是否已清除。
- 是,處理完畢。
- 否,執行步驟16。
收集故障信息
- 在FusionInsight Manager界面,選擇“運維 > 日志 > 下載”。
- 在“服務”中勾選如下節點信息,單擊“確定”。
- OmmServer
- Controller
- NodeAgent
- 單擊右上角的

設置日志收集的“開始時間”和“結束時間”分別為告警產生時間的前后10分鐘,單擊“下載”。 - 請聯系運維人員,并發送已收集的故障日志信息。
告警清除
此告警修復后,系統會自動清除此告警,無需手工清除。
參考信息
無。