用戶在日常使用中,可以在MRS管理所有組件(含角色實例)和主機的狀態及指標信息:
- 狀態信息,包括運行、健康、配置及角色實例狀態統計。
- 指標信息,各組件的主要監控指標項。
- 導出監控指標(MRS 3.x及之后版本暫不支持)。
說明
操作方法請參考管理服務和主機監控。
MRS 3.x及之后版本操作方法請參考操作方法。
用戶可以選擇頁面自動刷新間隔的設置,也可以單擊馬上刷新。
組件管理支持三種參數值:
“每30秒刷新一次”:刷新間隔30秒。
“每60秒刷新一次”:刷新間隔60秒。
“停止”:停止刷新。
前提條件
已完成IAM用戶同步(在集群詳情頁的“概覽”頁簽,單擊“IAM用戶同步”右側的“同步”進行IAM用戶同步)。
操作方法
管理組件監控
說明MRS Manager操作,請參考管理服務監控操作。
1.在MRS集群詳情頁面,單擊“組件管理”。
組件列表中標題包含“服務”、“操作狀態”、“健康狀態”、“配置狀態”、“角色數”和“操作”。
- 服務操作狀態描述如下表所示。
服務操作狀態
| 狀態 | 描述 |
|---|---|
| 已啟動 | 服務已啟動。 |
| 已停止 | 服務已停止。 |
| 啟動失敗 | 用戶啟動操作失敗。 |
| 停止失敗 | 用戶停止操作失敗。 |
| 未知 | 后臺系統重啟后,服務的初始狀態。 |
- 服務健康狀態如下表所示。
服務健康狀態
| 狀態 | 描述 |
|---|---|
| 良好 | 該服務中所有角色實例正常運行。 |
| 故障 | 至少一個角色實例運行狀態為“故障”或被依賴的服務狀態不正常。 |
| 未知 | 該服務中所有角色實例狀態為“未知”。 |
| 正在恢復 | 后臺系統正在嘗試自動啟動服務。 |
| 亞健康 | 該服務所依賴的服務狀態不正常,異常服務的相關接口無法被外部調用。 |
- 服務配置狀態如下表所示。
服務配置狀態
| 狀態 | 描述 |
|---|---|
| 已同步 | 系統中最新的配置信息已生效。 |
| 配置超期 | 參數修改后,最新的配置未生效。需重啟相應服務生效最新配置信息。 |
| 配置失敗 | 參數配置過程中出現通信或讀寫異常。嘗試使用“同步配置”恢復。 |
| 配置中 | 參數配置進行中。 |
| 未知 | 無法獲取當前配置狀態。 |
默認以“服務”列按升序排列,單擊 服務 、 操作狀態 、健康狀態或配置狀態可修改排列方式。
2.單擊列表中指定服務名稱,查看服務狀態及指標信息。
3.定制、查看監控圖表。
a.在“圖表”區域框中,單擊“定制”自定義服務監控指標。
b.在“時間區間”選擇查詢時間,單擊“查看”顯示該時間段內的監控數據。
管理角色實例監控

說明針對MRS 3.x之前版本,請參考管理角色實例監控操作。
1.在MRS集群詳情頁面,單擊“組件管理”,在組件列表中單擊服務指定名稱。
2.單擊“實例”,查看角色狀態。
角色實例列表中包含實例信息的 角色、主機名 、管理 IP 、業務 IP 、 機架 、運行狀態及 配置狀態 。
- 角色實例的運行狀態如下表所示。
角色實例運行狀態
| 狀態 | 描述 |
|---|---|
| 良好 | 表示實例當前運行正常。 |
| 故障 | 表示實例當前無法正常工作。 |
| 已退服 | 表示實例處于退服狀態。 |
| 未啟動 | 表示實例已停止。 |
| 未知 | 表示實例的初始狀態信息無法檢測。 |
| 正在啟動 | 表示實例正在執行啟動過程。 |
| 正在停止 | 表示實例正在執行停止過程。 |
| 正在恢復 | 表示實例可能存在異常正在自動修復。 |
| 正在退服 | 表示實例正在執行退服過程。 |
| 正在入服 | 表示實例正在執行入服過程。 |
| 啟動失敗 | 表示實例啟動操作失敗。 |
| 停止失敗 | 表示實例停止操作失敗。 |
- 角色實例的配置狀態如下表所示。
角色實例配置狀態
| 狀態 | 描述 |
|---|---|
| 已同步 | 系統中最新的配置信息已生效。 |
| 配置超期 | 參數修改后,最新的配置未生效。需重啟相應服務生效最新配置信息。 |
| 配置失敗 | 參數配置過程中出現通信或讀寫異常。嘗試使用“同步配置”恢復。 |
| 配置中 | 參數配置進行中。 |
| 未知 | 無法獲取當前配置狀態。 |
默認以“角色”列按升序排列,單擊角色、主機名、管理 IP 、業務IP 、機架 、運行狀態或配置狀態可修改排列方式。
支持在“角色”篩選相同角色的全部實例。
單擊“高級搜索”,在角色搜索區域中設置搜索條件,單擊“搜索”,查看指定的角色信息。單擊“重置”清除輸入的搜索條件。支持模糊搜索條件的部分字符。
3.單擊列表中指定角色實例名稱,查看角色實例狀態及指標信息。
4.定制、查看監控圖表。
a.在“圖表”區域框中,單擊“定制”自定義服務監控指標。
b.在“時間區間”選擇查詢時間,單擊“查看”顯示該時間段內的監控數據。
管理主機監控

說明針對MRS 3.x之前版本,請參考管理主機監控操作。
1.在MRS集群詳情頁面,單擊“節點管理”并展開節點組信息,查看所有主機狀態。
主機列表中包括 節點名稱 、 IP 、 機架 、 操作狀態 、 健康狀態 、CPU 使用率 、 內存使用率 、 磁盤使用率 、 網絡速度 、 規格名 、 規格 、 可用區 。
- 主機操作狀態如下表所示。
主機操作狀態
| 狀態 | 描述 |
|---|---|
| 正常 | 主機及主機上的服務角色正常運行。 |
| 已隔離 | 主機被用戶隔離,主機上的服務角色停止運行。 |
- 主機健康狀態描述如下表所示。
主機健康狀態
| 狀態 | 描述 |
|---|---|
| 良好 | 主機心跳檢測正常。 |
| 故障 | 主機心跳超時未上報。 |
| 未知 | 執行添加操作時,主機的初始狀態。 |
默認以“節點名稱”列按升序排列,單擊 節點名稱 、 IP 、 機架 、 操作狀態 、 健康狀態 、CPU 使用率 、 內存使用率 、 磁盤使用率 、 網絡速度 、規格名或規格可修改排列方式。
2.單擊列表中指定的節點名稱,查看單個節點狀態及指標。