功能入口
- 選擇目標資源池,并登錄APM組件控制臺。
- 在左側導航欄中選擇「應用監控」-「應用列表」。
- 在應用列表中選擇您想查看的應用,點擊「應用名稱」打開新的應用詳情鏈接。
- 在左側導航欄中選擇「應用詳情」,您可以在應用詳情頁面切換至「其他基礎監控」頁簽,在左側關鍵指標中選擇不同的應用實例,可查看該應用實例相應的概覽信息。
功能說明
資源監控
包含對CPU、物理內存、流量的監控,是保障應用程序穩定性和可靠性的重要任務之一。
CPU
- CPU配額(CPU Quota):指為分配的CPU資源上限,單位是CPU核數。
- CPU使用量(CPU Usage):指實際使用的CPU資源量,單位是CPU核數。
需注意,使用量不能超過配額。例如,一個Pod的CPU配額為1核,表示該Pod中所有容器的CPU使用量總和不能超過1核。如果容器的CPU使用量超過了配額限制,容器將會被限制在配額范圍內運行,超出部分的CPU使用量將會被拋棄。
通過觀察CPU配額和CPU使用量可以合理分析CPU資源使用率,避免資源浪費和不足。
物理內存
- 內存配額(Memory Quota):指為分配的內存資源上限,通常以字節或者二進制字節(Byte、KB、MB、GB等)的形式表示。
- 內存使用量(Memory Usage):指實際使用的內存資源量,通常以字節或者二進制字節(Byte、KB、MB、GB等)的形式表示。
需注意,使用量不能超過配額。例如,一個Pod的內存配額為1GB,表示該Pod中所有容器的內存使用量總和不能超過1GB。如果容器的內存使用量超過了配額限制,容器將會被限制在配額范圍內運行,超出部分的內存使用量將會被拋棄。
通過觀察物理內存配額及內存使用量,可以幫助用戶根據應用程序的實際內存使用情況,合理設置內存配額,以避免內存資源的浪費和不足。
網絡流量
網絡流量:網絡數據量,單位是Byte。
- 接收字節數:也稱作入站流量,是指進入的數據量。
- 發送字節數:也稱作出站流量,是指發送出去的數據量。
監控網絡數據量可以診斷網絡性能問題、預測網絡容量需求,了解網絡的使用情況和資源瓶頸,及時進行網絡流量控制和優化,以避免網絡擁塞和數據傳輸失敗。
網絡數據包
網絡數據包:通信的基本單位。它是在網絡中傳輸的數據的載體,包含了一定的控制信息和有效載荷數據。
- 接收包數:接收包數是指網絡接口(網卡)成功接收到的數據包的總數量。它表示從網絡中接收到的數據包的計數。
- 接收丟包數:接收丟包數指的是在接收過程中丟失的數據包數量。這表示在數據包傳輸過程中,一些數據包未能成功到達目的地或未能被接收,導致丟包。
- 接收失敗數:接收失敗數是指在接收過程中發生的錯誤數量。這些錯誤可能與數據包傳輸、網絡協議或硬件設備有關,例如校驗錯誤、幀錯誤等。
- 發送包數:發送包數是指通過網絡接口成功發送的數據包的總數量。它表示從容器pod發送到網絡的數據包的計數。
- 發送丟包數:發送丟包數指的是在發送過程中丟失的數據包數量。這表示在數據包傳輸過程中,一些數據包未能成功到達目的地或未能被接收,導致丟包。
- 發送失敗數:發送失敗數是指在發送過程中發生的錯誤數量。這些錯誤可能與數據包傳輸、網絡協議或硬件設備有關,例如校驗錯誤、幀錯誤等。
監控網絡數據包的數量可以幫助管理員診斷網絡性能問題和瓶頸,以及進行資源分配和負載均衡的調整。例如,如果某個容器接收到的網絡數據包數量過多,可能會導致容器負載過高,需要調整容器資源分配或者優化應用程序的網絡使用方式。此外,對于網絡數據包的監控還可以幫助管理員檢測網絡攻擊和安全漏洞,以及進行網絡流量控制和優化。
Netty內存
監控netty內存的使用情況。包括已使用直接內存和最大直接內存的變化趨勢。
- 已使用直接內存:這是指Netty當前已經分配并使用的直接內存大小。直接內存(Direct Memory)是指操作系統可以直接訪問的內存,這種內存通常用于網絡IO操作,因為它可以減少數據在用戶空間和內核空間之間的拷貝,從而提高性能。Netty通過usedDirectMemory()方法可以查詢當前系統下Netty的已使用直接內存大小。
- 最大直接內存:這是指Netty配置的最大直接內存大小。如果Netty的直接內存使用超過了這個配置值,將會拋出OutOfDirectMemoryError異常。這個配置值通常在Netty啟動時設置,并且可以通過配置文件進行調整。例如,如果Netty配置的最大直接內存為16M,那么當實際使用的直接內存超過16M時,就會出現內存溢出的錯誤。
總結來說,"已使用直接內存"反映了Netty當前正在使用的直接內存量,而"最大直接內存"則是Netty能夠使用的最大直接內存量。這兩個參數對于監控和優化Netty應用程序的性能至關重要。
Java方法
監控Java方法明細,表頭包括。
- 類名:指定被監控方法所屬的類名。
- 方法名:具體被監控方法的名稱。
- 調用次數:在一定時間段內,該方法被調用的總次數。
- 錯誤次數:在一定時間內,該方法執行過程中發生錯誤的次數。
- 最大耗時(ms):該方法在一段時間內的最長執行時間,通常以毫秒(ms)為單位。
- 平均耗時(ms):該方法在一定時間內的平均執行時間,通常是所有執行時間的總和除以調用次數得出的平均值。
- 0-10ms請求數:在執行時間在0-10毫秒范圍內的請求次數。
- 10-100ms請求數:在執行時間在10-100毫秒范圍內的請求次數。
- 100-500ms請求數:在執行時間在100-500毫秒范圍內的請求次數。
- 500-1000ms請求數:在執行時間在500-1000毫秒范圍內的請求次數。
- 1-10s請求數:在執行時間在1-10秒范圍內的請求次數。
- 10s以上請求數:在執行時間超過10秒的請求次數。
上述指標可以幫助監控 Java 方法的性能表現,識別潛在性能問題,并針對性地進行優化和調整,以確保應用程序的性能和穩定性。
XXL-JOB
xxl-job定時任務監控,目前僅支持查看,表頭如下。
- 請求次數:指定時間段內任務被觸發或執行的總次數。
- 錯誤次數:在相同時間段內,任務執行過程中發生錯誤的次數。
- 慢請求次數:代表執行時間超過設定閾值的任務執行次數。通常,慢請求指執行時間超過了預設的性能閾值,可能需要進一步優化。
- 最大響應時間(ms):表示在一定時間內任務執行的最長響應時間,通常以毫秒(ms)為單位。這個指標可以幫助發現執行時間較長的任務,有助于優化性能。
- 總響應時間(ms):是指任務執行的總響應時間的總和,表示在一段時間內所有任務執行的總體性能表現。通常也以毫秒(ms)為單位。
這些指標有助于監控 XXL-Job 任務執行的情況、性能表現和異常情況,以提供反饋和指導,幫助優化任務調度系統的性能和穩定性。
統一交互操作說明:
- 將光標移到統計圖上,可以查看光標所至時間點的數據詳情。
- 單擊
圖標,可以將當前圖表放大顯示。