評分規則
更新時間 2025-01-06 17:47:53
最近更新時間: 2025-01-06 17:47:53
分享文章
實例概覽與實例畫像功能,支持對目標實例進行診斷并給出健康評分,本文介紹評分規則。
注意事項
- 健康度評分實行多維度評分制,每個評分維度采用百分制,存在告警直接扣分,得分不低于0分。
- 實例健康度評分取五個維度評分中的最低分。
- 閾值類告警扣分項需滿足條件持續60秒進行觸發,事件類告警扣分項需滿足條件持續90秒進行觸發。
評分規則表
天翼云RDS MySQL:
扣分項 ? ? ? ? ? ? 含義 ? ? ? ? ? ? 扣分子項 ? ? ? ? ? ? 條件 ? ? ? ? ? ? 所扣分數 ? ? ? ? ? ? 評分維度 ? ? ? ? ? ? 服務狀態異常 mysqld服務心跳檢測不通過。 嚴重 serviceDown=1 ? ? ? ? ? ? 50
? ? ? ? ? ?數據庫可用性 主從GTID不一致 當前主從GTID不一致。 警告 GTID=0 5 數據庫可用性 主從復制延遲 主從復制發生長時間延遲。 ? ? ? ? ? ? 警告 30 min>=replDelayTime>10 min ? ? ? ? ? ? 10 數據可靠性
? ? ? ? ? ?嚴重 ? ? ? ? ? ? replDelayTime>30 min ? ? ? ? ? ? 15 復制IO線程中斷 主從中斷,復制 IO 線程中斷。 嚴重
? ? ? ? ? ?slave_IO_Running=NO 10
? ? ? ? ? ?數據可靠性 復制SQL線程中斷 主從中斷,復制?SQL?線程中斷。
嚴重 ? ? ? ? ? ? slave_SQL_Running=NO ? ? ? ? ? ? 10 數據可靠性 備份失敗 當前實例備份失敗。 嚴重 BACK_UP=0 10 數據可靠性 備份超時 備份超時,耗時3小時以上 嚴重 BACK_UP=0 10 數據可靠性 CPU使用率 當前CPU使用率,多核CPU換算成單核計算。
? ? ? ? ? ?警告 80%>=cpuUsage>70%
? ? ? ? ? ?5 數據庫性能
? ? ? ? ? ?嚴重 cpuUsage>80%
? ? ? ? ? ?10 內存使用率 當前內存使用率。 警告 90%>=memUsage>80%
? ? ? ? ? ?5 數據庫性能
? ? ? ? ? ?嚴重 memUsage>90%
? ? ? ? ? ?10 連接使用率 當前連接使用數 / 最大允許連接數 * 100%。 警告 80%>=connectionRate>70% 5 數據庫性能
? ? ? ? ? ?嚴重 connectionRate>80% 10 IO使用率 當前IO值?/ 最大允許IO值 * 100%。
? ? ? ? ? ?警告 90%>=ioUsage>70%
? ? ? ? ? ? ? ? 5 數據庫性能
? ? ? ? ? ?嚴重 ioUsage>90%
? ? ? ? ? ?10 活動線程數
? ? ? ? ? ?當前活躍會話數。
? ? ? ? ? ?警告 min(4*cpuCores+8,96)>=threadRunning>min(2*cpuCores+8,64) 10
? ? ? ? ? ?數據庫性能
? ? ? ? ? ?嚴重 maxConnections>threadRunning>min(4*cpuCores+8,96)
? ? ? ? ? ?50 慢SQL 當前慢SQL總數相較前一采集時間點慢SQL總數的增量。
? ? ? ? ? ?提示 10>=slowSqlCount>0? ? ? ? ? ? 5 數據庫性能
? ? ? ? ? ?警告 50>=slowSqlCount>10
? ? ? ? ? ?20 嚴重 slowSqlCount>50
? ? ? ? ? ?50 行鎖等待
? ? ? ? ? ?當前發生行鎖等待。
? ? ? ? ? ?嚴重
? ? ? ? ? ?rowLockWait>0 5 數據庫性能 ? ? ? ? ? ? 元數據鎖 近一分鐘存在waiting_for_table_metadata_lock 嚴重 waiting_for_table_metadata_lock>0 10 數據庫性能 磁盤使用率 當前磁盤空間實際使用率。 警告 90%>=usedSpaceUtil>80% 10 數據庫可維護性 嚴重 usedSpaceUtil>90% 50