監控
更新時間 2025-06-03 20:47:30
最近更新時間: 2025-06-03 20:47:30
分享文章
本頁面介紹云數據庫ClickHouse通過控制臺提供的查看實例監控信息功能。
我們提供全面的監控功能,用于實時監測和評估您的云數據庫ClickHouse集群的性能和運行狀況:
- 登錄云數據庫ClickHouse控制臺,并選擇實例所在區域。
- 在實例列表頁面,點擊目標實例ID所在行的"管理"按鈕進入詳細信息頁面。
- 在實例詳細信息頁面上方導航欄中,選擇"監控管理"選項。
以下是我們支持的監控指標的詳細描述:
| 監控指標 | 描述 |
|---|---|
| CPU使用率 | 監測每個ClickHouse節點的CPU利用率,反映節點的計算能力和負載情況。您可以通過監控CPU使用率來評估系統的處理能力,并及時進行資源調整。 |
| 內存使用量 | 跟蹤每個ClickHouse節點的內存消耗情況,了解內存使用情況可以幫助您優化查詢性能和調整內存配置。 |
| 磁盤使用空間 | 監控每個ClickHouse節點的磁盤空間占用情況,確保有足夠的存儲空間來容納數據和執行操作。及時了解磁盤使用情況可以避免因存儲空間不足而導致的數據丟失或運行故障。 |
| 每秒IO次數 | 記錄每秒的輸入輸出操作次數,包括讀取和寫入數據的次數。通過監控每秒IO次數,您可以評估ClickHouse節點的IO性能和磁盤負載情況,以便進行性能優化和容量規劃。 |
| 每秒讀寫字節數 | 監測每秒讀取和寫入的數據量,幫助您了解數據處理速度和吞吐量。通過監控每秒讀寫字節數,您可以評估系統的數據處理能力,并根據需要進行調整和優化。 |
| 當前運行查詢數 | 實時跟蹤正在運行的查詢數量,反映系統的查詢負載和性能狀況。通過監控當前運行查詢數,您可以了解系統的負載情況,并做出相應的優化和調整。 |
| 合并數量 | 監控數據合并操作的數量,用于評估數據壓縮和合并操作的效率。通過監控合并數量,您可以了解數據壓縮和合并的效果,并根據需要進行優化。 |
| 分區變更數量 | 記錄分區變更的次數,用于跟蹤分區操作和數據變更情況。了解分區變更數量可以幫助您追蹤數據變更的頻率和趨勢,以及相應的系統影響。 |
| 后臺任務數 | 跟蹤后臺任務的數量,包括數據清理、數據復制等后臺處理任務。通過監控后臺任務數,您可以了解后臺處理的工作負載和執行情況,以及相應的資源占用。 |
| TCP連接數 | 監控每個ClickHouse節點的TCP連接數量,用于評估網絡連接的負載和性能狀況。了解TCP連接數可以幫助您優化網絡配置和資源分配。 |
| HTTP連接數 | 記錄每個ClickHouse節點的HTTP連接數量,幫助您追蹤HTTP請求的并發情況。通過監控HTTP連接數,您可以評估系統的網絡負載和處理能力。 |
| Zookeeper監聽數 | 監測Zookeeper集群中的監聽數,用于了解集群狀態和數據同步情況。通過監控Zookeeper監聽數,您可以評估集群的穩定性和可用性。 |
| Zookeeper會話數 | 跟蹤Zookeeper集群中的會話數,用于評估集群的穩定性和連接狀態。了解Zookeeper會話數可以幫助您監控集群的健康狀況和系統連接情況。 |
通過這些詳細的監控指標,您可以全面了解和掌握云數據庫ClickHouse集群的性能表現、資源利用和系統狀態,以便及時調整和優化系統配置,確保系統的高可用性、高性能和穩定性。
告警設置
設置告警規則
| 參數名 | 參數解釋 |
|---|---|
| 策略名稱 | 告警策略的名稱,一個告警策略可以包含多個告警規則。 |
| 資源池 | 告警策略對應的資源池。 |
| 備注 | 告警策略的備注信息。 |
| 告警對象 | 可選擇天翼云數據庫組件,并選擇對應的告警實例。 |
| 模板類型 | 支持手動創建告警規則,用戶也可使用默認模板的六個默認告警規則。 |
| 閾值告警 | 支持2.1節中列舉的除集群狀態以外的所有監控指標。 |
| 事件告警 | 僅支持集群狀態的事件告警。 |
| 沉默周期 | 指告警發生后如果未恢復正常,間隔多久重復發送一次告警通知。 |
| 告警級別 | 支持選擇緊急、告警、普通三種告警級別。 |
| 告警方式 | 支持選擇郵箱、短信,支持同時選擇多種告警方式進行告警。填寫后將額外推送告警消息至指定的告警方式。 |
| 告警聯系人 | 目前只能選擇當前賬號,不可選擇其他用戶。選擇后會將告警信息推送至用戶綁定的郵箱和短信。 |
| 告警聯系組 | 目前普通用戶不可創建告警聯系群組,默認為空。后續迭代處理后將上線聯系組功能。 |