告警參考(適用于MRS 3.x版本)
更新時間 2023-07-05 02:54:32
最近更新時間: 2023-07-05 02:54:32
分享文章
- ALM-12001 審計日志轉儲失敗
- ALM-12004 OLdap資源異常
- ALM-12005 OKerberos資源異常
- ALM-12006 節點故障
- ALM-12007 進程故障
- ALM-12010 Manager主備節點間心跳中斷
- ALM-12011 Manager主備節點同步數據異常
- ALM-12014 設備分區丟失
- ALM-12015 設備分區文件系統只讀
- ALM-12016 CPU使用率超過閾值
- ALM-12017 磁盤容量不足
- ALM-12018 內存使用率超過閾值
- ALM-12027 主機PID使用率超過閾值
- ALM-12028 主機D狀態進程數超過閾值
- ALM-12033 慢盤故障
- ALM-12034 周期備份任務失敗
- ALM-12035 恢復任務失敗后數據狀態未知
- ALM-12038 監控指標轉儲失敗
- ALM-12039 OMS數據庫主備不同步
- ALM-12040 系統熵值不足
- ALM-12041 關鍵文件權限異常
- ALM-12042 關鍵文件配置異常
- ALM-12045 網絡讀包丟包率超過閾值
- ALM-12046 網絡寫包丟包率超過閾值
- ALM-12047 網絡讀包錯誤率超過閾值
- ALM-12048 網絡寫包錯誤率超過閾值
- ALM-12049 網絡讀吞吐率超過閾值
- ALM-12050 網絡寫吞吐率超過閾值
- ALM-12051 磁盤Inode使用率超過閾值
- ALM-12052 TCP臨時端口使用率超過閾值
- ALM-12053 主機文件句柄使用率超過閾值
- ALM-12054 證書文件失效
- ALM-12055 證書文件即將過期
- ALM-12057 元數據未配置周期備份到第三方服務器的任務
- ALM-12061 進程使用率超過閾值
- ALM-12062 OMS參數配置同集群規模不匹配
- ALM-12063 磁盤不可用
- ALM-12064 主機隨機端口范圍配置與集群使用端口沖突
- ALM-12066 節點間互信失效
- ALM-12067 tomcat資源異常
- ALM-12068 acs資源異常
- ALM-12069 aos資源異常
- ALM-12070 controller資源異常
- ALM-12071 httpd資源異常
- ALM-12072 floatip資源異常
- ALM-12073 cep資源異常
- ALM-12074 fms資源異常
- ALM-12075 pms資源異常
- ALM-12076 gaussDB資源異常
- ALM-12077 omm用戶過期
- ALM-12078 omm密碼過期
- ALM-12079 omm用戶即將過期
- ALM-12080 omm密碼即將過期
- ALM-12081 ommdba用戶過期
- ALM-12082 ommdba用戶即將過期
- ALM-12083 ommdba密碼即將過期
- ALM-12084 ommdba密碼過期
- ALM-12085 服務審計日志轉儲失敗
- ALM-12087 系統處于升級觀察期
- ALM-12089 節點間網絡互通異常
- ALM-12101 AZ不健康
- ALM-12102 AZ高可用組件未按容災需求部署
- ALM-12110 獲取ECS臨時ak/sk失敗
- ALM-13000 ZooKeeper服務不可用
- ALM-13001 ZooKeeper可用連接數不足
- ALM-13002 ZooKeeper直接內存使用率超過閾值
- ALM-13003 ZooKeeper進程垃圾回收(GC)時間超過閾值
- ALM-13004 ZooKeeper堆內存使用率超過閾值
- ALM-13005 ZooKeeper中組件頂層目錄的配額設置失敗
- ALM-13006 Znode數量或容量超過閾值
- ALM-13007 ZooKeeper客戶端可用連接數不足
- ALM-13008 ZooKeeper Znode數量使用率超出閾值
- ALM-13009 ZooKeeper Znode容量使用率超出閾值
- ALM-13010 配置quota的目錄Znode使用率超出閾值
- ALM-14000 HDFS服務不可用
- ALM-14001 HDFS磁盤空間使用率超過閾值
- ALM-14002 DataNode磁盤空間使用率超過閾值
- ALM-14003 丟失的HDFS塊數量超過閾值
- ALM-14006 HDFS文件數超過閾值
- ALM-14007 NameNode堆內存使用率超過閾值
- ALM-14008 DataNode堆內存使用率超過閾值
- ALM-14009 Dead DataNode數量超過閾值
- ALM-14010 NameService服務異常
- ALM-14011 DataNode數據目錄配置不合理
- ALM-14012 Journalnode數據不同步
- ALM-14013 NameNode FsImage文件更新失敗
- ALM-14014 NameNode進程垃圾回收(GC)時間超過閾值
- ALM-14015 DataNode進程垃圾回收(GC)時間超過閾值
- ALM-14016 DataNode直接內存使用率超過閾值
- ALM-14017 NameNode直接內存使用率超過閾值
- ALM-14018 NameNode非堆內存使用率超過閾值
- ALM-14019 DataNode非堆內存使用率超過閾值
- ALM-14020 HDFS目錄條目數量超過閾值
- ALM-14021 NameNode RPC處理平均時間超過閾值
- ALM-14022 NameNode RPC隊列平均時間超過閾值
- ALM-14023 總副本預留磁盤空間所占比率超過閾值
- ALM-14024 租戶空間使用率超過閾值
- ALM-14025 租戶文件對象使用率超過閾值
- ALM-14026 DataNode塊數超過閾值
- ALM-14027 DataNode磁盤故障
- ALM-14028 待補齊的塊數超過閾值
- ALM-14029 單副本的塊數超過閾值
- ALM-16000 連接到HiveServer的session數占最大允許數的百分比超過閾值
- ALM-16001 Hive數據倉庫空間使用率超過閾值
- ALM-16002 Hive SQL執行成功率低于閾值
- ALM-16003 Background線程使用率超過閾值
- ALM-16004 Hive服務不可用
- ALM-16005 Hive服務進程堆內存使用超出閾值
- ALM-16006 Hive服務進程直接內存使用超出閾值
- ALM-16007 Hive GC 時間超出閾值
- ALM-16008 Hive服務進程非堆內存使用超出閾值
- ALM-16009 Map數超過閾值
- ALM-16045 Hive數據倉庫被刪除
- ALM-16046 Hive數據倉庫權限被修改
- ALM-16047 HiveServer已從Zookeeper注銷
- ALM-16048 Tez或者Spark庫路徑不存在
- ALM-17003 Oozie服務不可用
- ALM-17004 Oozie堆內存使用率超過閾值
- ALM-17005 Oozie非堆內存使用率超過閾值
- ALM-17006 Oozie直接內存使用率超過閾值
- ALM-17007 Oozie進程垃圾回收(GC)時間超過閾值
- ALM-18000 Yarn服務不可用
- ALM-18002 NodeManager心跳丟失
- ALM-18003 NodeManager不健康
- ALM-18008 ResourceManager堆內存使用率超過閾值
- ALM-18009 JobHistoryServer堆內存使用率超過閾值
- ALM-18010 ResourceManager進程垃圾回收(GC)時間超過閾值
- ALM-18011 NodeManager進程垃圾回收(GC)時間超過閾值
- ALM-18012 JobHistoryServer進程垃圾回收(GC)時間超過閾值
- ALM-18013 ResourceManager直接內存使用率超過閾值
- ALM-18014 NodeManager直接內存使用率超過閾值
- ALM-18015 JobHistoryServer直接內存使用率超過閾值
- ALM-18016 ResourceManager非堆內存使用率超過閾值
- ALM-18017 NodeManager非堆內存使用率超過閾值
- ALM-18018 NodeManager堆內存使用率超過閾值
- ALM-18019 JobHistoryServer非堆內存使用率超過閾值
- ALM-18020 Yarn任務執行超時
- ALM-18021 Mapreduce服務不可用
- ALM-18022 Yarn隊列資源不足
- ALM-18023 Yarn任務掛起數超過閾值
- ALM-18024 Yarn任務掛起內存量超閾值
- ALM-18025 Yarn被終止的任務數超過閾值
- ALM-18026 Yarn上運行失敗的任務數超過閾值
- ALM-19000 HBase服務不可用
- ALM-19006 HBase容災同步失敗
- ALM-19007 HBase GC時間超出閾值
- ALM-19008 HBase服務進程堆內存使用率超出閾值
- ALM-19009 HBase服務進程直接內存使用率超出閾值
- ALM-19011 RegionServer的Region數量超出閾值
- ALM-19012 HBase系統表目錄或文件丟失
- ALM-19013 region處在RIT狀態的時長超過閾值
- ALM-19014 在ZooKeeper上的容量配額使用率嚴重超過閾值
- ALM-19015 在ZooKeeper上的數量配額使用率超過閾值
- ALM-19016 在ZooKeeper上的數量配額使用率嚴重超過閾值
- ALM-19017 在ZooKeeper上的容量配額使用率超過閾值
- ALM-19018 HBase合并隊列超出閾值
- ALM-19019 HBase容災等待同步的HFile文件數量超過閾值
- ALM-19020 HBase容災等待同步的wal文件數量超過閾值
- ALM-20002 Hue服務不可用
- ALM-24000 Flume服務不可用
- ALM-24001 Flume Agent異常
- ALM-24003 Flume Client連接中斷
- ALM-24004 Flume讀取數據異常
- ALM-24005 Flume傳輸數據異常
- ALM-24006 Flume Server堆內存使用率超過閾值
- ALM-24007 Flume Server直接內存使用率超過閾值
- ALM-24008 Flume Server非堆內存使用率超過閾值
- ALM-24009 Flume Server垃圾回收(GC)時間超過閾值
- ALM-24010 Flume證書文件非法或已損壞
- ALM-24011 Flume證書文件即將過期
- ALM-24012 Flume證書文件已過期
- ALM-24013 Flume MonitorServer證書文件非法或已損壞
- ALM-24014 Flume MonitorServer證書文件即將過期
- ALM-24015 Flume MonitorServer證書文件已過期
- ALM-25000 LdapServer服務不可用
- ALM-25004 LdapServer數據同步異常
- ALM-25005 Nscd服務異常
- ALM-25006 Sssd服務異常
- ALM-25500 KrbServer服務不可用
- ALM-26051 Storm服務不可用
- ALM-26052 Storm服務可用Supervisor數量小于閾值
- ALM-26053 Storm Slot使用率超過閾值
- ALM-26054 Nimbus堆內存使用率超過閾值
- ALM-27001 DBService服務不可用
- ALM-27003 DBService主備節點間心跳中斷
- ALM-27004 DBService主備數據不同步
- ALM-27005 數據庫連接數使用率超過閾值
- ALM-27006 數據目錄磁盤空間使用率超過閾值
- ALM-28001 Spark服務不可用(2.x及以前版本)
- ALM-27007 數據庫進入只讀模式
- ALM-29000 Impala服務不可用
- ALM-29004 Impalad進程內存占用率超過閾值
- ALM-29005 Impalad JDBC連接數超過閾值
- ALM-29006 Impalad ODBC連接數超過閾值
- ALM-29100 Kudu服務不可用
- ALM-29104 Tserver進程內存占用率超過閾值
- ALM-29106 Tserver進程CPU占用率過高
- ALM-29107 Tserver進程內存使用百分比超過閾值
- ALM-38000 Kafka服務不可用
- ALM-38001 Kafka磁盤容量不足
- ALM-38002 Kafka堆內存使用率超過閾值
- ALM-38004 Kafka直接內存使用率超過閾值
- ALM-38005 Broker進程垃圾回收(GC)時間超過閾值
- ALM-38006 Kafka未完全同步的Partition百分比超過閾值
- ALM-38007 Kafka默認用戶狀態異常
- ALM-38008 Kafka數據目錄狀態異常
- ALM-38009 Broker磁盤IO繁忙
- ALM-38010 存在單副本的Topic
- ALM-43001 Spark2x服務不可用
- ALM-43006 JobHistory2x進程堆內存使用超出閾值
- ALM-43007 JobHistory2x進程非堆內存使用超出閾值
- ALM-43008 JobHistory2x進程直接內存使用超出閾值
- ALM-43009 JobHistory2x進程GC時間超出閾值
- ALM-43010 JDBCServer2x進程堆內存使用超出閾值
- ALM-43011 JDBCServer2x進程非堆內存使用超出閾值
- ALM-43012 JDBCServer2x進程直接內存使用超出閾值
- ALM-43013 JDBCServer2x進程GC時間超出閾值
- ALM-43017 JDBCServer2x進程Full GC次數超出閾值
- ALM-43018 JobHistory2x進程Full GC次數超出閾值
- ALM-43019 IndexServer2x進程堆內存使用超出閾值
- ALM-43020 IndexServer2x進程非堆內存使用超出閾值
- ALM-43021 IndexServer2x進程直接內存使用超出閾值
- ALM-43022 IndexServer2x進程GC時間超出閾值
- ALM-43023 IndexServer2x進程Full GC次數超出閾值
- ALM-44004 Presto Coordinator資源組排隊任務超過閾值
- ALM-44005 Presto Coordinator進程垃圾收集時間超出閾值
- ALM-44006 Presto Worker進程垃圾收集時間超出閾值
- ALM-45175 OBS元數據接口調用平均時間超過閾值
- ALM-45176 OBS元數據接口調用成功率低于閾值
- ALM-45177 OBS數據讀操作接口調用成功率低于閾值
- ALM-45178 OBS數據寫操作接口調用成功率低于閾值
- ALM-45275 Ranger服務不可用
- ALM-45276 RangerAdmin狀態異常
- ALM-45277 RangerAdmin堆內存使用率超過閾值
- ALM-45278 RangerAdmin直接內存使用率超過閾值
- ALM-45279 RangerAdmin非堆內存使用率超過閾值
- ALM-45280 RangerAdmin垃圾回收(GC)時間超過閾值
- ALM-45281 UserSync堆內存使用率超過閾值
- ALM-45282 UserSync直接內存使用率超過閾值
- ALM-45283 UserSync非堆內存使用率超過閾值
- ALM-45284 UserSync垃圾回收(GC)時間超過閾值
- ALM-45285 TagSync堆內存使用率超過閾值
- ALM-45286 TagSync直接內存使用率超過閾值
- ALM-45287 TagSync非堆內存使用率超過閾值
- ALM-45288 TagSync垃圾回收(GC)時間超過閾值
- ALM-45425 ClickHouse服務不可用
- ALM-45426 ClickHouse服務在ZooKeeper的數量配額使用率超過閾值
- ALM-45427 ClickHouse服務在ZooKeeper的容量配額使用率超過閾值
- ALM-45736 Guardian服務不可用