管理服務和主機監控
更新時間 2023-08-29 17:43:29
最近更新時間: 2023-08-29 17:43:29
分享文章
本章節主要介紹翼MapReduce的管理服務和主機監控功能。
用戶可以在日常使用中,可以在MRS Manager管理所有服務(含角色實例)和主機的狀態及指標信息:
- 狀態信息,包括運行、健康、配置及角色實例狀態統計。
- 指標信息,各服務的主要監控指標項。
- 導出監控指標。
說明用戶可以選擇頁面自動刷新間隔的設置,也可以單擊
馬上刷新。
支持三種參數值:
l? “每30秒刷新一次”:刷新間隔30秒。
l? “每60秒刷新一次”:刷新間隔60秒。
l? “停止刷新”:停止刷新。
管理服務監控
- 在MRS Manager,單擊“服務管理”。
服務列表中標題包含“服務”、“操作狀態”、“健康狀態”、“配置狀態”、“角色數”和“操作”。
- 服務操作狀態描述如下表所示。
| 狀態 | 描述 |
|---|---|
| 已啟動 | 服務已啟動。 |
| 已停止 | 服務已停止。 |
| 啟動失敗 | 用戶啟動操作失敗。 |
| 停止失敗 | 用戶停止操作失敗。 |
| 未知 | 后臺系統重啟后,服務的初始狀態。 |
- 服務健康狀態如下表所示。
| 狀態 | 描述 |
|---|---|
| 良好 | 該服務中所有角色實例正常運行。 |
| 故障 | 至少一個角色實例運行狀態為“故障”或被依賴的服務狀態不正常。 |
| 未知 | 該服務中所有角色實例狀態為“未知”。 |
| 正在恢復 | 后臺系統正在嘗試自動啟動服務。 |
| 亞健康 | 該服務所依賴的服務狀態不正常,異常服務的相關接口無法被外部調用。 |
- 服務配置狀態如下表所示。
| 狀態 | 描述 |
|---|---|
| 已同步 | 系統中最新的配置信息已生效。 |
| 過期 | 參數修改后,最新的配置未生效。需重啟相應服務生效最新配置信息。 |
| 失敗 | 參數配置過程中出現通信或讀寫異常。嘗試使用“同步配置”恢復。 |
| 同步中 | 參數配置進行中。 |
| 未知 | 無法獲取當前配置狀態。 |
默認以“服務”列按升序排列,單擊 服務 、 操作狀態 、健康狀態或配置狀態可修改排列方式。
- 單擊列表中指定服務名稱,查看服務狀態及指標信息。
- 定制、導出監控圖表。
- 在“圖表”區域框中,單擊“定制”自定義服務監控指標。
- 在“時間區間”選擇查詢時間,單擊“查看”顯示該時間段內的監控數據。
- 單擊“導出”,導出當前查看的指標數據。
管理角色實例監控
在MRS Manager,單擊“服務管理”,在服務列表中單擊服務指定名稱。
- 單擊“實例”,查看角色狀態。
角色實例列表中包含實例信息的 角色、主機名 、管理 IP 、業務 IP 、 機架 、 操作狀態 、健康狀態及 配置狀態 。
- 角色實例的狀態如下表所示。
| 狀態 | 描述 |
|---|---|
| 已啟動 | 角色實例已啟動。 |
| 已停止 | 角色實例已停止。 |
| 啟動失敗 | 用戶啟動操作失敗。 |
| 停止失敗 | 用戶停止操作失敗。 |
| 退服中 | 角色實例正在退服。 |
| 已退服 | 角色實例已退服。 |
| 入服中 | 角色實例正在入服。 |
| 未知 | 后臺系統重啟后,角色實例的初始狀態。 |
- 角色實例的健康狀態如下表所示。
| 狀態 | 描述 |
|---|---|
| 良好 | 該角色實例正常運行。 |
| 恢復中 | 后臺系統正在嘗試自動啟動角色實例。 |
| 故障 | 該角色實例運行異常,如PID不存在,無法訪問端口。 |
| 未知 | 角色實例所在主機與后臺系統未連接。 |
| 亞健康 | 該角色實例部分正常運行 |
- 角色實例的配置狀態如下表所示。
| 狀態 | 描述 |
|---|---|
| 已同步 | 系統中最新的配置信息已生效。 |
| 過期 | 參數修改后,最新的配置未生效。需重啟相應服務生效最新配置信息。 |
| 失敗 | 參數配置過程中出現通信或讀寫異常。嘗試使用“同步配置”恢復。 |
| 同步中 | 參數配置進行中。 |
| 未知 | 無法獲取當前配置狀態。 |
默認以“角色”列按升序排列,單擊角色、主機名、管理 IP 、業務IP 、機架 、 操作狀態 、健康狀態或配置狀態可修改排列方式。
支持在“角色”篩選相同角色的全部實例。
單擊“高級搜索”,在角色搜索區域中設置搜索條件,單擊“搜索”,查看指定的角色信息。單擊“重置”清除輸入的搜索條件。支持模糊搜索條件的部分字符。
- 單擊列表中指定角色實例名稱,查看角色實例狀態及指標信息。
- 定制、導出監控圖表。
- 在“圖表”區域框中,單擊“定制”自定義服務監控指標。
- 在“時間區間”選擇查詢時間,單擊“查看”顯示該時間段內的監控數據。
- 單擊“導出”,導出當前查看的指標數據。
管理主機監控
- 在MRS Manager,單擊“主機管理”,看所有主機狀態。
主機列表中包括主機名稱、管理IP、業務IP、機架、網絡速度、操作狀態、健康狀態、磁盤使用率、內存使用率、CPU使用率。
- 主機操作狀態如下表所示。
| 狀態 | 描述 |
|---|---|
| 正常 | 主機及主機上的服務角色正常運行。 |
| 已隔離 | 主機被用戶隔離,主機上的服務角色停止運行。 |
- 主機健康狀態描述如下表所示。
| 狀態 | 描述 |
|---|---|
| 良好 | 主機心跳檢測正常。 |
| 故障 | 主機心跳超時未上報。 |
| 未知 | 執行添加操作時,主機的初始狀態。 |
默認以“主機名稱”列按升序排列,單擊 主機名稱 、管理 IP 、業務 IP 、 機架 、 網絡速度 、 操作狀態 、 健康狀態 、 磁盤使用率 、內存使用率或CPU使用率可修改排列方式。
單擊“高級搜索”,在搜索區域中,設置查詢條件,單擊“搜索”,查看指定的主機。單擊“重置”清除輸入的搜索條件。支持模糊搜索條件的部分字符。
- 單擊列表中指定的主機名稱,查看單個主機狀態及指標。
- 定制、導出監控圖表。
- 在“圖表”區域框中,單擊“定制”自定義服務監控指標。
- 在“時間區間”選擇查詢時間,單擊“查看”顯示該時間段內的監控數據。
- 單擊“導出”,導出當前查看的指標數據。