APM應用廣泛,下面介紹APM的典型應用場景,以便您深入了解。
應用異常診斷
業務痛點
分布式微服務架構下的應用,雖然豐富多樣且開發效率高,但是給傳統運維診斷技術帶來了巨大挑戰。以電商為例,主要遇到如下問題:
- 定位問題難
客服人員接到用戶反饋商品購買出現問題后,會交由技術人員排查解決。而微服務分布式架構中的一個業務請求通常要經過多個服務/節點后返回結果。一旦請求出現錯誤,往往要在多臺機器上反復翻看日志才能初步定位問題,對簡單問題的排查也常常涉及多個團隊。
- 架構梳理難
在業務邏輯變得逐漸復雜以后,很難從代碼層面去梳理某個應用依賴了哪些下游服務(數據庫、HTTP API、緩存),以及被哪些外部調用所依賴。業務邏輯的梳理、架構的治理和容量的規劃(例如促銷活動的準備過程中,需要為每個應用準備多少臺機器)也變得更加困難。
業務實現
APM提供大型分布式應用異常診斷能力,當應用出現崩潰或請求失敗時,通過應用拓撲+調用鏈下鉆能力分鐘級完成問題定位。
- 可視化拓撲:應用拓撲自發現,異常應用實例無處躲藏。
- 調用鏈追蹤:發現異常應用后,通過調用鏈一鍵下鉆,代碼問題根因清晰可見。
- 慢SQL分析:提供數據庫、SQL語句的調用次數、響應時間、錯誤次數等關鍵指標視圖,支持異常SQL語句導致的數據庫性能問題分析。
應用體驗管理
業務痛點
在用戶體驗至上的互聯網時代,即使后臺業務穩定運行,仍然無法獲悉用戶訪問系統時的具體情況,因而定位線上用戶偶現的前端問題變得非常困難。一個系統上線之后,訪問時的大量報錯導致用戶無法正常使用,如果APM無法及時獲知,就會導致流失大量用戶,如果用戶反饋頁面的使用情況,APM能否第一時間復現用戶的使用場景;能否知曉用戶遇到的詳細報錯信息而快速修復。
業務實現
APM提供應用體驗管理能力,實時分析應用事務從用戶請求、服務器到數據庫,再到服務器、用戶請求的完整過程,實時感知用戶對應用的滿意度,幫助您全面了解用戶體驗狀況。對于用戶體驗差的事務,通過拓撲和調用鏈完成事務問題定位。
- 應用KPI分析:吞吐量、時延、成功率指標分析,實時掌控用戶體驗健康狀態,用戶體驗一覽無遺。
- 全鏈路性能追蹤:Web服務、緩存、數據庫全棧跟蹤,性能瓶頸輕松掌握。
故障智能診斷
業務痛點
海量業務下,出現百種指標監控、KPI數據、調用跟蹤數據等豐富但無關聯的應用運維數據,如何通過應用、組件和URL跟蹤等多視角分析關聯指標和告警數據,自動完成故障根因分析;如何基于歷史數據學習與運維經驗庫,對異常事務智能分析給出可能原因。
業務實現
APM提供故障智能診斷能力,基于機器學習算法自動檢測應用故障。當URL跟蹤出現異常時,通過智能算法學習歷史指標數據,多維度關聯分析異常指標,提取業務正常與異常時上下文數據特征,如資源、參數、調用結構,通過聚類分析找到問題根因。