概述
更新時間 2024-01-09 14:59:41
最近更新時間: 2024-01-09 14:59:41
分享文章
本節主要介紹概述
應用運維管理(Application Operations Management)是云上應用的一站式立體化運維管理平臺,實時監控用戶的應用及相關云資源,采集并關聯資源的各項指標、日志及事件等數據共同分析應用健康狀態,提供靈活的告警及豐富的數據可視化功能,幫助用戶及時發現故障,全面掌握應用、資源及業務的實時運行狀況。
AOM作為云上應用的一站式立體化運維管理平臺,可以實現對云主機、存儲、網絡、WEB容器、docker、kubernetes等應用運行環境的深入監控并進行集中統一的可視化管理,能夠有效預防問題的產生及快速幫助應用運維人員定位故障,降低運維成本。AOM并非傳統監控,它通過應用的角度看業務,滿足企業對業務的高效和快速迭代的需求,可幫助企業實現 IT 對業務的有效支撐,保護、優化IT資產投資,使企業更好的達到其戰略目標并實現IT資產調優。
控制臺說明
類別 說明 總覽 提供監控概覽及儀表盤功能。
監控概覽
“監控概覽”界面提供了資源、應用、應用用戶體驗的全鏈路、多層次、一站式運維界面。
儀表盤
通過儀表盤可將不同圖表展示到同一個屏幕上,通過不同的儀表形式來展示資源數據,例如,曲線圖、數字圖等,進而全面、深入地掌握監控數據。告警 提供告警列表、事件列表、告警規則、告警通知等功能。
告警列表
告警是指AOM自身或外部服務在異常情況或在可能導致異常情況下上報的信息,并且您需采取相應措施清除故障,否則會由于AOM自身或外部服務的功能異常而引起業務的異常。
告警列表展示已設時間范圍內產生的告警。
事件列表
事件告訴您AOM自身或外部服務發生了某種變化,但不一定會引起業務異常,事件一般用來表達一些重要信息。
事件列表展示已設時間范圍內產生的事件。
告警規則
通過告警規則可對服務設置事件條件或者對資源的指標設置閾值條件。當服務的資源數據滿足事件條件時產生事件類告警。當資源的指標數據滿足閾值條件時產生閾值告警,當沒有指標數據上報時產生數據不足事件,以便您在第一時間發現異常并進行處理。監控 提供應用監控、組件監控、主機監控、容器監控、指標瀏覽等功能。
應用監控
應用是您根據業務需要,對相同或者相近業務的一組組件進行邏輯劃分,AOM提供以應用維度整體進行監控。
組件監控
組件即您部署的服務,包括容器和普通進程。
組件列表展示了每個組件的類型、CPU占用、內存占用和告警狀態等信息,AOM支持從組件下鉆到實例,從實例下鉆到容器。通過各層狀態,您可完成對組件的立體監控。
主機監控
通過AOM您可監控主機的資源占用與健康狀態,監控主機的磁盤、文件系統等常用系統設備,監控運行在主機上的業務進程或實例的資源占用與健康狀態。
容器監控
容器監控的對象僅為通過CCE部署的工作負載、通過ServiceStage創建應用。
指標瀏覽
指標瀏覽展示了各資源的指標數據,您可實時監控指標值及趨勢,還可將關注的指標添加到儀表盤,對其創建閾值規則和導出監控報告等操作,以便實時查看業務及分析數據。日志 提供日志搜索、日志文件、日志轉儲、日志路徑等功能。
日志搜索
當需要通過日志來分析和定位問題時,使用日志搜索功能可幫您快速在海量日志中查詢到所需的日志,您還可結合日志的來源信息和上下文原始數據一起輔助定位問題。
日志文件
您可快速查看組件實例的日志文件,以便定位問題。
日志轉儲
AOM支持將日志轉儲到對象存儲服務(Object Storage ? Service,簡稱OBS)的OBS桶中,以便進行長期存儲。
日志路徑
AOM支持容器服務日志和虛機(這里的虛機指操作系統為Linux的彈性云主機或物理機)日志采集,即采集您自定義的日志文件并展現在AOM界面中,以供您檢索。使用該功能前首先要配置日志采集路徑。配置管理 提供ICAgent管理、應用發現、日志配置等功能。
ICAgent管理
ICAgent用于采集指標、日志和應用性能數據。對于在ECS、BMS控制臺直接購買的主機,您需手動安裝ICAgent。對于通過CCE間接購買的主機,ICAgent會自動安裝,您不用安裝ICAgent。
數據訂閱
支持用戶訂閱指標或者告警信息,訂閱后可以將數據轉發到用戶配置的kafka或DMS的Topic中,供消費者消費轉發的訂閱的信息。
應用發現
應用發現是指AOM通過配置的規則發現和收集您主機上部署的應用和關聯的指標。
日志配置
提供日志配額和分詞設置功能。
配額配置
當指標超過配額時,時間較早的指標將會被刪除。
指標配置
指標采集開關用來控制是否對指標數據進行采集(SLA指標、自定義指標除外)。