資源運行異常怎么辦?
資源狀態包括正常、亞健康、異常和通道靜默。亞健康、異常或通道靜默都可能導致資源運行異常,您可參考如下指導進行分析和修復。
亞健康
當有級別為次要或提示的告警時資源狀態為亞健康。
修復建議:請在告警界面參考告警詳細信息處理告警。
異常
當有級別為緊急或重要的告警時資源狀態為異常。
修復建議:請在告警界面參考告警詳細信息處理告警。
通道靜默
當ICAgent無法采集資源的指標時資源狀態為通道靜默,通道靜默可能由于但不限于以下原因導致。
- 可能原因一:ICAgent問題
修復建議:在左側導航欄中選擇“配置管理 > Agent管理”,在列表的“ICAgent狀態”列查看ICAgent狀態,若狀態不為“運行”,則說明ICAgent未安裝或運行異常,可參考下表進行處理。
ICAgent修復建議
| 狀態 | 修復建議 |
|---|---|
| 未安裝 | 主機未安裝ICAgent,請安裝 ICAgent ,操作詳見。 |
| 安裝中 | 正在為主機安裝ICAgent,安裝ICAgent預計需要1分鐘左右,請耐心等待。 |
| 安裝失敗 | 主機ICAgent安裝失敗,請后重新安裝。 |
| 升級中 | 正在為主機升級ICAgent,升級ICAgent預計需要1分鐘左右,請耐心等待。 |
| 升級失敗 | 主機ICAgent升級失敗,請后重新安裝。 |
| 離線 | 輸入的AK/SK錯誤或ECS委托設置錯誤導致主機ICAgent功能異常,請獲取正確的AK/SK或正確設置ECS委托。 |
| 異常 | 主機ICAgent功能異常,請提交工單處理,操作詳見。 |
- 可能原因二:AOM不支持監控當前資源類型
修復建議:請檢查您的資源是否為AOM監控的類型,AOM當前支持監控的資源類型有:主機、K8s容器、用戶進程(AOM不監控主機的系統進程)。
如何設置全屏模式在線時長?
為保障客戶信息的安全性,AOM提供了在線超時退出機制,即:登錄控制臺后,打開任意一個界面,如果在1小時內無任何操作,則會自動退出到登錄界面。
當在使用AOM的全屏模式進行監控時,全屏模式會隨著用戶帳號的退出而退出,無法實時進行監控。為滿足您的多樣化需求,AOM支持您自定義全屏模式在線時長。
注意事項
- 為提高安全性,請在不需要使用全屏模式進行監控時,及時退出全屏模式。
- 全屏模式在線時長與是否操作無關,只要滿足已設時長,則退出到登錄界面。
- 全屏模式在線時長以最后一次設置為準。
例如,打開了多個頁簽在多個顯示屏下進行全屏監控,則在線時長以最后一次設置為準。
再如,在“運維概覽”界面和“儀表盤”界面均設置了在線時長,則以最后一次設置為準。
- 全屏模式在線時長優先級高于系統在線超時退出機制。
例如,登錄控制臺后,打開了AOM全屏界面并設置在線時長為2小時,同時打開了AOM全屏界面外的其他任意界面,則對于其他任意界面該設置也同時生效,即2小時后自動退出到登錄界面。
- 當所有全屏界面都退出后,則恢復系統在線超時退出機制。
例如,登錄控制臺后,打開了多個AOM全屏界面并設置在線時長為2小時,同時打開了AOM全屏界面外的其他任意界面,當退出所有AOM全屏界面后,對于任意界面,在1小時內無任何操作,會自動退出到登錄界面。
設置儀表盤全屏模式在線時長
步驟 1 登錄AOM控制臺,在左側導航欄中選擇“總覽 > 儀表盤”。
步驟 2 單擊“儀表盤”界面右上角的 ,在彈出的對話框中設置全屏模式在線時長。
- 自定義在線時長:默認在線時長為1小時,您可在文本框中輸入1~24小時。
例如,在文本框中輸入2,則2小時后自動退出到登錄界面。
- 保持在線:表示不限制,即全屏界面永遠不會自動退出到登錄界面,可持續在全屏模式下進行監控。
步驟 3 單擊“確認”,進入儀表盤全屏模式。
如何獲取AK/SK?
每個用戶最多可創建2個訪問密鑰(AK/SK),且一旦生成永久有效。
- AK(Access Key ID):訪問密鑰ID,是與私有訪問密鑰關聯的唯一標識符。訪問密鑰ID和私有訪問密鑰一起使用,對請求進行加密簽名。
- SK(Secret Access Key):與訪問密鑰ID結合使用的密鑰,對請求進行加密簽名,可標識發送方,并防止請求被修改。
操作步驟
1、登錄控制臺,將鼠標移動到右上方的用戶名稱,并在下拉列表中選擇“我的憑證”。
2、在“我的憑證”頁面中選擇“訪問密鑰”頁簽。
3、在列表上方單擊“新增訪問密鑰”,輸入驗證碼或密碼。
4、單擊“確定”,生成并下載AK/SK。
創建訪問密鑰成功后,您可以在訪問密鑰列表中查看訪問密鑰ID(AK),在下載的.csv文件中查看秘密訪問密鑰(SK)。
- 請及時下載保存,彈窗關閉后將無法再次獲取該密鑰信息,但您可重新創建新的密鑰。
- 當您下載訪問密鑰后,可以在瀏覽器頁面左下角打開格式為.csv的訪問密鑰文件,或在瀏覽器“下載內容”中打開。
- 為了帳號安全性,建議您妥善保管并定期修改訪問密鑰,修改訪問密鑰的方法為刪除舊訪問密鑰,然后重新生成。
如何查詢服務不可用時間?
您可以進入AOM的容器監控頁面,在工作負載的監控視圖里查看服務在各個時間的狀態值,0代表正常,非0代表異常。
AOM告警規則狀態為什么顯示“數據不足”?
AOM告警規則中,資源項有時會出現數據不足的情況,如下圖所示。

可能的原因如下:
1、數據上報延遲過大(曲線圖最新數據上報時間和當前時間的時間差大于一個周期,閾值上報周期設定中可選1分鐘和5分鐘),上報周期內獲取不到數據會報數據不足。
2、指標刪除或指標所在的宿主已不存在,而閾值規則仍在,此時會報數據不足。
正常狀態的工作負載,AOM界面顯示異常是什么原因?
在AOM頁面看到工作負載的狀態顯示異常,但是實際上在CCE頁面看工作負載是正常的。
查看工作負載狀態

可能的原因如下:
1、ICAgent的版本過低。
ICAgent當前需要用戶主動升級的,但是過舊的ICAgent版本可能存在狀態上報延遲導致顯示異常的問題。
遇到工作負載狀態顯示不對的情況,首先在Agent管理頁面查看ICAgent的版本是不是最新的。
查看ICAgent的版本
2、節點的時間與實際不同步。
如果節點時間與實際時間相差過大,會導致ICAgent指標上報延遲,從而導致狀態判斷出現問題。
遇到工作負載狀態顯示不對的問題,需要排查節點的時間與當前時間相比是否過快或過慢,也可以通過在AOM頁面查看NTP指標的偏移進行確認。
如何創建委托apm_admin_trust?
創建委托
步驟 1 登錄統一身份認證控制臺。
步驟 2 在左側導航欄,單擊“委托”,進入委托頁面。
步驟 3 單擊右上角“創建委托”,進入創建委托頁面。
步驟 4 參考下表設置創建委托的參數。
創建委托
| 名稱 | 說明 | 樣例 |
|---|---|---|
| 委托名稱 | 標識該委托代理的名稱。說明委托名稱必須為apm_admin_trust。 | apm_admin_trust |
| 委托類型 | 選擇“普通帳號”。 | 普通帳號 |
| 委托帳號 | 請輸入被委托的帳號名稱**。** | - |
| 持續時間 | 選擇“永久” | 永久 |
| 描述 | 可選參數,用于補充說明該委托代理的詳細信息。 | - |
步驟 5 在“權限選擇”區域,單擊“配置權限”。
步驟 6 配置以下權限: DMS User(或DMS UserAccess)、CCE Administrator、 CCI Administrator、ECS User(或ECS CommonOperations),并在“項目[所屬區域]”選定生效區域。
步驟 7 單擊“確定”,委托關系創建成功。
如何處理界面“ICAgent狀態”為“離線”的問題
ICAgent安裝完成后,界面“ICAgent狀態”為“離線”。
界面“ICAgent狀態”為“離線”

問題分析
- 原因:AK/SK配置不正確或30200、30201端口未連通。
- 影響:ICAgent無法正常使用。
解決辦法
步驟 1 以root用戶登錄安裝ICAgent的服務器。
步驟 2 執行以下命令,檢查AK/SK配置是否正確。
cat /var/ICAgent/oss.icAgent.trace | grep proxyworkflow.go
- 若無回顯信息,則說明AK/SK配置錯誤 => 執行步驟3
- 若有回顯信息,則說明AK/SK配置正確 => 執行步驟4
步驟 3 配置AK/SK后,重新安裝ICAgent。如果仍未安裝成功,請執行步驟4。
步驟 4 查詢端口連通性。
1、執行以下命令,獲取ACCESS的IP地址。
cat /opt/oss/servicemgr/ICAgent/envs/ICProbeAgent.properties | grep ACCESS_IP
2、依次執行以下命令,檢查30200、30201端口的連通性。
curl -k //ACCESS_IP:30200 curl -k //ACCESS_IP:30201
若回顯信息為“404”,則說明端口連通性正常 => 請聯系技術支持工程師。
若回顯信息不為“404”,則說明端口未連通 => 請聯系網絡管理開放端口后,重新安裝ICAgent。如果仍未安裝成功,請聯系技術支持工程師。