| 告警規則名稱 | 告警級別 | 告警條件 | 自動解除條件 | 告警失敗條件 | 是否允許手動解除 | 告警郵件發送頻率 |
|---|---|---|---|---|---|---|
數據目錄讀寫錯誤 PathIOError | 重要 | 數據目錄狀態為壞盤 | 數據目錄狀態為正常 | 數據目錄被移除,數據目錄從存儲池中移除,或數據目錄所在服務器被移除 | 是 | 每天一次 |
數據目錄所在磁盤寫入速度慢 DiskWriteSlow | 警告 | 數據目錄所在磁盤寫入速度慢 | 數據目錄所在盤恢復正常 | 數據目錄被移除,數據目錄從存儲池中移除,或數據目錄所在服務器被移除 | 是 | 每天一次 |
許可證即將到期 LicenseWillExpire | 警告 | 當前時間(告警模塊所在服務器的系統時間)距離最后導入的許可證的到期時間<=15天且>0天 | 當前時間(告警模塊所在服務器的系統時間)距離告警許可證的到期時間>15天 | 許可證過期,或導入新的許可證(不同id的許可證) | 是 | 每天一次 |
許可證過期 LicenseExpired | 嚴重 | 當前時間(告警模塊所在服務器的系統時間)距離最后導入的許可證的到期時間<= 0天 | 當前時間(告警模塊所在服務器的系統時間)距離告警許可證的到期時間>0天 | 導入新的許可證(不同id的許可證) | 是 | 每天一次 |
許可證維保即將到期 LicenseMaintenanceWillExpire | 警告 | 當前時間(告警模塊所在服務器的系統時間)距離最后導入的許可證的維保到期時間<=15天且>0天 | 當前時間(告警模塊所在服務器的系統時間)距離告警許可證的維保到期時間>15天 | 許可證過期,或導入新的許可證(不同id的許可證) | 是 | 每天一次 |
許可證過保 LicenseMaintenanceExpired | 警告 | 當前時間(告警模塊所在服務器的系統時間)距離最后導入的許可證的維保到期時間<= 0天 | 當前時間(告警模塊所在服務器的系統時間)距離告警許可證的維保到期時間>0天 | 導入新的許可證 | 是 | 每天一次 |
試用期即將到期 TrialVersionWillExpire | 警告 | 當前未導入生效的許可證,并且當前時間(告警模塊所在服務器的系統時間)距離試用期過期時間<=15天且>=0天 | 無解除條件,只能手動解除 | 導入新的許可證 | 是 | 每天一次 |
資源用量接近使用上限 ResourceUsageApproachingLimit | 重要 | 本地卷總容量>=許可證容量的80% | 本地卷總容量<許可證容量的75% | 導入新的許可證 | 是 | 每天一次 |
告警中的告警條數接近上限 AlarmNumberApproachingLimit | 嚴重 | 告警中的告警條數>=8000 | 告警條數<7500 | 無 | 是 | 每天一次 |
告警郵件發送失敗 FailToSendAlarmEmail | 嚴重 | 告警郵件發送失敗 | 告警郵件發送成功 | 郵件配置被刪除,或郵件發送設置為disable | 是 | 每天一次 |
配額使用率超閾值 CapacityQuotaUsageExceedsThreshold | 警告 | 存儲池中數據目錄關聯磁盤的Path_Cap_Quota_Rate>=80%, 數據目錄層級的數據目錄關聯磁盤的Path_Cap_Quota_Rate>=80% 說明 數據目錄未設置容量配額,則按容量配額=磁盤總容量計算。 | 存儲池中數據目錄關聯磁盤的Path_Cap_Quota_Rate<75%,或數據目錄層級的數據目錄關聯磁盤的Path_Cap_Quota_Rate<75% 說明 數據目錄未設置容量配額,則按容量配額=磁盤總容量計算。 |
| 是 | 每天一次 |
配額用盡 CapacityQuotaUsageApproachLimit | 嚴重 | 基礎存儲池中數據目錄對應磁盤總配額使用率>=95% | 基礎存儲池中數據目錄對應磁盤總配額使用率<90% | 基礎存儲池名稱變更 | 是 | 每天一次 |
配額用盡 CapacityQuotaUsageApproachLimit | 警告 | 非基礎存儲池中數據目錄對應磁盤總配額使用率>=95%,或數據目錄對應磁盤配額使用率>=95% | 非基礎存儲池中數據目錄對應磁盤總配額<90%,或數據目錄對應磁盤配額使用率<90% |
| 是 | 每天一次 |
磁盤使用率超閾值 DiskUsageExceedsThreshold | 警告 | 存儲池中數據目錄對應磁盤的Path_Rate>=80%,或數據目錄對應磁盤的Path_Rate>=80% | 存儲池中數據目錄對應磁盤的Path_Rate<75%,或數據目錄對應磁盤的Path_Rate<75% |
| 是 | 每天一次 |
可用故障域數量不滿足卷寫入要求 InsufficientFDForLUNToWrite | 警告 | 卷所在緩存存儲池或存儲池的可用故障域數量及健康數據目錄數量不滿足卷的最小副本數要求 | 告警存儲池的可用故障域數量及健康數據目錄數量滿足卷的最小副本數要求 |
| 是 | 每天一次 |
數據目錄健康狀態變為警告 DiskPathHealthStatusWarning | 警告 | 數據目錄健康狀態變為警告 | 數據目錄健康狀態恢復正常 |
| 是 | 每天一次 |
數據目錄健康狀態變為錯誤 DiskPathHealthStatusError | 警告 | 數據目錄健康狀態變為錯誤 | 數據目錄健康狀態恢復正常 |
| 是 | 每天一次 |
數據服務健康狀態變為警告 DataServiceHealthStatusWarning | 警告 | 數據服務健康狀態變為警告 | 數據服務健康狀態恢復正常 |
| 是 | 每天一次 |
數據服務健康狀態變為錯誤 DataServiceHealthStatusError | 重要 | 數據服務健康狀態變為錯誤 | 數據服務健康狀態恢復正常 |
| 是 | 每天一次 |
協議解析服務異常 ProtocolServiceAbnormal | 重要 | 協議解析服務異常 | 協議解析服務恢復正常 |
| 是 | 每天一次 |
故障域狀態變為警告 FaultDomainWarning | 警告 | 故障域狀態變為警告 | 故障域狀態恢復正常 |
| 是 | 每天一次 |
故障域狀態變為錯誤 FaultDomainError | 重要 | 故障域狀態變為Error | 故障域狀態變為非Error |
| 是 | 每天一次 |
無法連接到云 CannotConnectToCloud | 嚴重 | 與云端連接斷開超過10分鐘 | 卷通過此服務器向云端讀取或寫入成功一次 |
| 是 | 每天一次 |
云賬戶異常 CloudAccountAbnormal | 嚴重 | 云端讀取或寫入失敗:欠費凍結、欠費凍結或違規凍結 | 云端讀取或寫入成功一次 | 卷被刪除、卷禁用或卷刪除失敗 | 是 | 每天一次 |
卷云端數據沖突 LUNCloudDataConflict | 嚴重 | 卷對應的云端數據出現比本地更新的版本 | 卷對應的云端數據版本全部比本地舊 | 卷被刪除、卷禁用或卷刪除失敗 | 是 | 每天一次 |
卷云端心跳沖突 LUNCloudHeartbeatConflic | 嚴重 | 卷的云端出現來自非本集群的心跳 | 卷的云端心跳僅來自本集群 | 卷被刪除、卷禁用或卷刪除失敗 | 是 | 每天一次 |
卷數據殘留 LUNDataResidue | 警告 | 強制刪除卷,卷數據殘留:
| 無法自動解除,只能手動解除告警 |
| 是 | 每天一次 |
客戶端連接斷開 InitiatorConnectionFailed | 警告 | 因為客戶端的原因,HBlock無法收到客戶端心跳,導致HBlock認為和客戶端連接斷開,立即告警。但是客戶端主動斷開連接的情況除外 | 該客戶端與Target連接成功。 |
| 是 | 每天一次 |
安裝目錄剩余空間不足 InsufficientSpaceonInstallationPath | 嚴重 | 安裝目錄所在磁盤的文件系統剩余空間<=4GiB | 安裝目錄所在磁盤的文件系統剩余空間>5GiB | 服務器被移除 | 是 | 每天一次 |
基礎服務異常 BaseServiceAbnormal | 嚴重 | 發生以下任一情況時,分別發出相應告警實例的告警:
| 匹配的告警實例恢復到以下程度:
| 告警機器上的基礎服務遷移完成 | 是 | 每天一次 |
基礎服務數據目錄剩余空間不足 InsufficientSpaceonMetaDir | 嚴重 | 基礎服務數據目錄所在磁盤的文件系統剩余空間<=4GiB | 基礎服務數據目錄所在磁盤的文件系統剩余空間>5GiB | 服務開始遷移 | 是 | 每天1次 |
告警列表
更新時間 2025-04-23 15:02:33
最近更新時間: 2025-04-23 15:02:33
分享文章
本節主要介紹告警列表。