功能說明
用戶需要查看集群的監控指標信息時,可以通過云監控(Cloud Eye)確認集群各項指標情況。通過監控集群運行時的各項指標,用戶可以識別出數據庫集群狀態異常的時間段,然后在數據庫日志中,分析可能存在問題的活動,從而優化數據庫性能。本章節定義了數據倉庫服務上報云監控服務的監控指標的命名空間、監控指標列表和維度定義。用戶可以通過云監控服務提供的管理控制臺或API接口來檢索數據倉庫服務產生的監控指標和告警信息,詳情請參見云監控服務的《用戶指南》和《API參考》。
本章節包含如下內容:
- 命名空間
- 集群監控指標
- 維度
- 查看集群監控和節點監控信息
- 多節點間的監控指標對比
- 創建告警規則
- 配置OBS轉儲
命名空間
SYS.DWS
集群監控指標
通過云監控提供的數據倉庫服務相關監控指標,用戶可以獲取有關集群運行狀況和性能的信息,并深入了解節點級別的對應信息。
數據倉庫服務相關監控指標,具體請參見下表。
| 指標ID | 指標名稱 | 指標含義 | 取值范圍 | 測量對象 | 監控周期(原始指標) |
|---|---|---|---|---|---|
| dws001_shared_buffer_hit_ratio | 緩存命中率 | 該指標用于表示需要訪問的數據,在內存中可以直接獲取的數據量比例,以百分比為單位。 | 0%~100% | 數據倉庫集群 | 4分鐘 |
| dws002_in_memory_sort_ratio | 內存中排序比率 | 該指標用于表示在數據進行排序時,可以直接在內存中排序的數據量比例,以百分比為單位。 | 0%~100% | 數據倉庫集群 | 4分鐘 |
| dws003_physical_reads | 文件讀取次數 | 該指標用于表示讀取數據庫文件的累計次數。 | > 0 | 數據倉庫集群 | 4分鐘 |
| dws004_physical_writes | 文件寫入次數 | 該指標用于表示寫入數據庫文件的累計次數。 | > 0 | 數據倉庫集群 | 4分鐘 |
| dws005_physical_reads_per_second | 每秒文件讀取次數 | 該指標用于表示每秒讀取數據庫文件的次數。 | ≥0 | 數據倉庫集群 | 4分鐘 |
| dws006_physical_writes_per_second | 每秒文件寫入次數 | 該指標用于表示每秒寫入數據庫文件的次數。 | ≥0 | 數據倉庫集群 | 4分鐘 |
| dws007_db_size | 數據量大小 | 該指標用于表示數據庫中所有數據總量大小。 單位:兆字節(MB) |
≥0MB | 數據倉庫集群 | 4分鐘 |
| dws008_active_sql_count | 活躍SQL數 | 該指標用于表示數據庫當前活動的SQL個數。 | ≥0 | 數據倉庫集群 | 4分鐘 |
| dws009_session_count | 會話數 | 該指標用于表示數據庫當前訪問的連接個數。 | ≥0 | 數據倉庫集群 | 4分鐘 |
| dws010_cpu_usage | CPU使用率 | 該指標用于統計每個集群節點的CPU使用率,以百分比為單位。 | 0%~100% | 數據倉庫節點 | 1分鐘 |
| dws011_mem_usage | 內存使用率 | 該指標用于統計每個集群節點的內存使用率,以百分比為單位。 | 0%~100% | 數據倉庫節點 | 1分鐘 |
| dws012_iops | IOPS | 該指標用于統計每個集群節點每秒處理的I/O請求數量。 | ≥0 | 數據倉庫節點 | 1分鐘 |
| dws013_bytes_in | 網絡輸入吞吐量 | 該指標用于統計每秒從網絡輸入每個集群節點的數據總量。 單位:字節/秒 |
≥0字節/秒 | 數據倉庫節點 | 1分鐘 |
| dws014_bytes_out | 網絡輸出吞吐量 | 該指標用于統計從每個節點每秒發送到網絡的數據總量。 單位:字節/秒 |
≥0字節/秒 | 數據倉庫節點 | 1分鐘 |
| dws015_disk_usage | 磁盤利用率 | 該指標用于統計每個集群節點的磁盤使用情況,以百分比為單位。 | 0%~100% | 數據倉庫節點 | 1分鐘 |
| dws016_disk_total_size | 磁盤總大小 | 該指標用于統計每個集群節點的數據磁盤總大小。 單位:吉字節(GB) |
100GB~2000GB | 數據倉庫節點 | 1分鐘 |
| dws017_disk_used_size | 磁盤使用量 | 該指標用于統計每個集群節點的數據磁盤已用大小。 單位:吉字節(GB) |
0GB~3600GB | 數據倉庫節點 | 1分鐘 |
| dws018_disk_read_throughput | 磁盤讀吞吐量 | 該指標用于統計集群節點數據磁盤每秒讀取的數據量。 單位:字節/秒 |
≥0字節/秒 | 數據倉庫節點 | 1分鐘 |
| dws019_disk_write_throughput | 磁盤寫吞吐量 | 該指標用于統計集群節點數據磁盤每秒寫入的數據量。 單位:字節/秒 |
≥0字節/秒 | 數據倉庫節點 | 1分鐘 |
| dws020_avg_disk_sec_per_read | 磁盤讀耗時 | 該指標用于統計集群節點數據磁盤每次讀取數據的平均耗時。 單位:秒 |
> 0秒 | 數據倉庫節點 | 1分鐘 |
| dws021_avg_disk_sec_per_write | 磁盤寫耗時 | 該指標用于統計集群節點數據磁盤每次寫入數據的平均耗時。 單位:秒 |
> 0秒 | 數據倉庫節點 | 1分鐘 |
| dws022_avg_disk_queue_length | 磁盤平均隊列長度 | 該指標用于統計每個集群節點數據磁盤平均的I/O隊列長度。 | ≥0 | 數據倉庫節點 | 1分鐘 |
維度
| Key | Value |
|---|---|
| datastore_id | 數據倉庫集群ID |
| dws_instance_id | 數據倉庫節點ID |
查看集群監控和節點監控信息
1.登錄DWS 管理控制臺,進入“集群管理”頁面。
2.查看集群信息: 在集群列表中,在指定集群所在行,單擊“查看監控指標”,打開云監控管理控制臺。默認顯示的是集群監控信息。
用戶可以根據需要,選擇指定的監控指標名稱以及時間范圍,從而顯示監控指標的性能曲線。
3.查看節點信息 :單擊
可回到云監控管理控制臺,默認顯示“數據倉庫節點”頁簽,可以從集群節點維度查看每個節點的指標。
用戶可以根據需要,選擇指定的監控指標名稱以及時間范圍,從而顯示監控指標的性能曲線。
云監控也支持多個節點間的監控指標對比,具體操作請參見下方 多節點間的監控指標對比。
多節點間的監控指標對比
1.在云監控管理控制臺的左側導航欄中,選擇“總覽 > 監控面板”。
2.在“監控面板”頁面,單擊“創建監控面板”,在彈出對話框中,輸入“名稱”后,單擊“確定”。
3.在“監控面板”頁面,單擊右上角的“添加監控視圖”。
4.在彈出的“添加監控視圖”窗口中,配置標題和監控項。

說明單擊“添加監控項”可以添加多個監控指標。
以對比兩個節點間的CPU使用率為例,參數設置如下表所示。
配置樣例
| 參數名 | 樣例值 |
|---|---|
| 資源類型 | 數據倉庫服務 |
| 維度 | 數據倉庫節點 |
| 監控對象 | dws-demo-dws-cn-cn-2-1 dws-demo-dws-cn-cn-1-1 dws-demo-dws-dn-1-1 |
| 監控指標 | CPU使用率 |
5.單擊“確定”。
添加成功后,可在“監控面板”區域看到對應的監控視圖。鼠標移至監控視圖單擊右上角的
,可放大監控視圖,查看詳細的指標對比數據。
創建告警規則
通過設置DWS 的告警規則,用戶可以自定義監控目標和通知策略,及時了解DWS 運行狀態,從而起到預警作用。
設置DWS 的告警規則包括設置告警規則名稱、監控對象、監控指標、告警閾值、監控周期和是否發送通知等參數。本節介紹設置DWS 規則的具體方法。
1.登錄DWS 管理控制臺。
2.在左側導航欄中選擇“集群管理”。
3.在指定集群所在行的“操作”列中,單擊“查看監控指標”,進入云監控管理控制臺,查看數據倉庫服務監控信息。
確認待查看“監控信息”的集群狀態必須為“可用”,否則不能進行創建告警操作。
4.在云監控管理控制臺的左側導航樹上,選擇“告警 > 告警規則”。
5.在“告警規則”界面,單擊右上方“創建告警規則”。
6.在“創建告警規則”界面,根據界面提示配置參數。
a.配置規則名稱和描述。
b.配置告警內容,根據界面提示配置參數。
配置告警內容
| 參數名稱 | 參數說明 | 取值樣例 |
|---|---|---|
| 資源類型 | 配置告警規則監控的云服務資源名稱。 | 數據倉庫服務 |
| 維度 | 用于指定告警規則對應指標的維度名稱。可以選擇“數據倉庫節點”或“數據倉庫服務”。 | 數據倉庫節點 |
| 監控范圍 | 告警規則適用的資源范圍,選擇“指定資源”,然后勾選具體的監控對象,可以是一個或多個。對于DWS而言,選擇您創建的集群實例ID或節點ID。單擊![]() 將監控對象同步到右側對話框。 |
指定資源 |
| 選擇類型 | 根據需要可選擇從模板導入或自定義創建。 如果當前沒有告警模板,“選擇類型”設置為“自定義創建”,然后根據界面提示配置參數創建自定義告警規則。 如果當前已有告警模板,可以將“選擇類型”設置為“從模板導入”,從而可以使用告警模板快速創建告警規則。 |
自定義創建 |
| 模板 | 當告警內容選擇從模板導入時,該參數有效。 選擇需要導入的模板。如果當前沒有告警模板,可以單擊“創建自定義告警模板”創建一個符合您需求的告警模板。 |
- |
| 告警策略 | 當告警內容選擇從自定義創建時,該參數有效。 設置觸發告警的告警策略。例如,CPU使用率連續三個周期原始值≥80%。 數據倉庫服務支持的監控指標請參見下表。 |
- |
| 告警級別 | 根據告警的嚴重程度不同等級,可選擇緊急、重要、次要、提示。 | 重要 |
c.配置告警通知,根據界面提示配置參數。
配置告警通知
| 參數名稱 | 參數說明 | 取值樣例 |
|---|---|---|
| 發送通知 | 配置是否發送郵件、短信、HTTP和HTTPS通知用戶。 選擇“是”(推薦選擇),會發送通知;選擇“否”,不會發送通知。 |
是 |
| 生效時間 | 該告警規則僅在生效時間內發送通知消息。 如生效時間為00:00-8:00,則該告警規則僅在00:00-8:00發送通知消息。 |
- |
| 通知對象 | 需要發送告警通知的主題名稱。 當發送通知選擇“是”時,需要選擇已有的主題名稱,若此處沒有需要的主題則需先創建主題,該功能會調用消息通知服務(SMN),創建主題請參見《消息通知服務用戶指南》。 |
- |
| 觸發條件 | 可以選擇“出現告警”、“恢復正常”兩種狀態,作為觸發告警通知的條件。 | - |
d.配置完成后,單擊“立即創建”,完成告警規則的創建。
告警規則添加完成后,當監控指標觸發設定的閾值時,云監控會在第一時間通過消息通知服務實時告知您資源異常,以免因此造成業務損失。
配置OBS轉儲
云監控各監控指標的原始數據的保留周期為兩天,超過保留周期后原始數據將不再保存。用戶可以開通對象存儲服務,然后將原始數據同步保存至OBS,以保存更長時間。
關于如何配置OBS轉儲,具體請參見《云監控服務用戶指南》中“查看云服務歷史監控數據配置OBS數據存儲”章節。

將監控對象同步到右側對話框。