集群拓撲圖
更新時間 2024-11-25 11:46:01
最近更新時間: 2024-11-25 11:46:01
分享文章
集群拓撲圖向用戶展示了集群內所有節點的拓撲結構,方便用戶查看節點狀態、節點進程、節點IP地址等信息。
概述
集群拓撲圖向用戶展示了集群內所有節點的拓撲結構,方便用戶查看節點狀態、節點進程、節點IP地址等信息。
說明
集群拓撲圖分為拓撲結構展示與節點進程展示兩個功能。
拓撲結構節點展示僅8.0.0及以上集群版本支持,節點進程展示僅8.2.0及以上集群版本支持。
查看集群拓撲圖
- 登錄DWS管理控制臺。
- 在集群列表中單擊指定集群名稱。
- 進入“集群詳情”頁面,在左導航欄切換至“集群拓撲”頁簽。
- 頁面右上方可選擇“IP地址”或“節點名稱”,在搜索框完成輸入后可查看該“IP地址”或“節點名稱”在集群拓撲圖中的位置。
拓撲展示邏輯
節點拓撲整體示意圖如上所示,其中按照圖中標注的順序解釋如下 :
- 集群所綁定的ELB的公網IP地址(若綁定的ELB沒有綁定彈性IP則顯示為服務地址)。
- 集群所綁定的EIP的IP地址。
- 搜索分類,可以按照“IP地址”或“節點名稱”進行精確搜索。
- 該框表示集群內所有的Ring環。
- 該框表示Ring環,一行為一個Ring環,該Ring環內的每個圖標表示其內的一個節點。
- 節點以圖標的形式進行表示,圖標右上角為該節點的類型,暫只顯示“CN”和“DN”兩種類型(如果節點中有CN進程,則圖標為CN;如果節點內沒有CN進程,則顯示DN圖標)。
- 當鼠標懸停在節點圖標上時,展示節點詳細信息,包括節點名稱、節點狀態、節點的不同IP地址、節點進程。
拓撲圖專業名詞解釋
集群結構描述
| 名稱 | 描述 | 說明 |
|---|---|---|
| ELB | 彈性負載均衡(Elastic Load Balance,簡稱ELB)是將訪問流量根據分配策略分發到后端多臺服務器的流量分發控制服務。 | 用戶使用客戶端連接DWS集群時,如果用戶僅連接一個CN節點地址,通過該CN節點內網IP或彈性公網IP連接時,只能連接到固定的CN節點上,存在CN單點問題。如果通過內網域名連接,域名解析服務會對每個客戶端隨機選擇一個內網/公網IP地址,其解析機制并不能保證負載均衡,同樣也存在CN單點問題。因此引入了彈性負載均衡服務(Elastic Load Balance,下稱ELB)解決集群訪問的單點問題。 |
| EIP | 彈性公網IP(Elastic IP,簡稱EIP)提供獨立的公網IP資源,包括公網IP地址與公網出口帶寬服務。 | 可以與彈性云服務器、裸金屬服務器、虛擬IP、彈性負載均衡、NAT網關等資源靈活地綁定及解綁。 |
| Ring | 安全環,集群內部的故障隔離域,主要作用是故障隔離,環內主機出現故障,故障不會擴散到環外。 | 如果環內某一單節點故障,所有DN節點在環內都有副本,數據不會丟失。 例如Server1發生故障后,DN1的備節點在Server2上,DN2的備節點在Server3上,DN3的備節點在Server3上,每個Server運行4個主DN,環內的各主機性能仍然保證均衡。 整個集群可以承受的主機故障數量范圍為1~安全環的數量。 說明 集群按照安全環節點數量的倍數進行擴容,也就是以環為最小單位進行擴容。 |
節點IP描述
| 名稱 | 描述 | 說明 |
|---|---|---|
| Manage IP | 數據倉庫節點與管理面連接通信的IP。 | 主要用于管理面命令下發,以及節點狀態、監控信息上報。 |
| Traffic IP | 數據倉庫節點對外開放的IP。 | 該IP用于綁定EIP、ELB或直接通過VPC內部進行連接。 |
| Internal IP | 數據倉庫集群內部數據通信IP。 | - |
| Internalmgnt IP | 數據倉庫集群內部管理命令在節點之間通信IP。 | - |
節點進程描述
| 名稱 | 描述 | 說明 |
|---|---|---|
| CMS | 集群管理模塊(Cluster Manager)。管理和監控分布式系統中各個功能單元和物理資源的運行情況,確保整個系統的穩定運行。 CMS為該模塊中的CM Server。 |
CM由CM Agent、OM Monitor和CM Server組成。 CM Agent:負責監控所在主機上主備GTM、CN、主備DN的運行狀態并將狀態上報給CM Server。同時負責執行CM Server下發的仲裁指令。集群的每臺主機上均有CM Agent進程。 OM Monitor:看護CM Agent的定時任務,其唯一的任務是在CM Agent停止的情況下將CM Agent重啟。如果CM Agent重啟不了,則整個主機不可用,需要人工干預。 CM Agent重啟的情況很少發生,如果出現可能是因為系統資源不夠用導致無法啟動新進程。 CM Server:根據CM Agent上報的實例狀態判定當前狀態是否正常,是否需要修復,并下發指令給CM Agent執行。 DWS提供了CM Server的主備實例方案,以保證集群管理系統本身的高可用性。正常情況下,CM Agent連接主CM Server,在主CM Server發生故障的情況下,備CM Server會主動升為主CM Server,避免出現CM Server單點故障。 |
| GTM | 全局事務管理器(Global Transaction Manager),負責生成和維護全局事務ID、事務快照、時間戳等全局唯一的信息。 | 整個集群只有一組GTM:主、備GTM各一個。 |
| CN | 協調節點(Coordinator)。負責接收來自應用的訪問請求,并向客戶端返回執行結果;負責分解任務,并調度任務分片在各DN上并行執行。 | 集群中,CN有多個并且CN的角色是對等的(執行DML語句時連接到任何一個CN都可以得到一致的結果)。只需要在CN和應用程序之間增加一個負載均衡器,使得CN對應用是透明的。CN故障時,由負載均衡自動路由連接到另外一個CN。 當前分布式事務框架下無法避免CN之間的互連,為了減少GTM上線程過多導致負載過大,建議CN配置數目≤10個。 |
| CCN | 中心協調節點(Central Coordinator)。 | DWS通過CCN(Central Coordinator)負責集群內的資源全局負載控制,以實現自適應的動態負載管理。CM在第一次集群啟動時,通過集群部署形式,選擇編號最小的CN作為CCN。若CCN故障之后,由CM選擇新的CCN進行替換。 |
| DN | 數據節點(Datanode)。負責存儲業務數據(支持行存、列存、混合存儲)、執行數據查詢任務以及向CN返回執行結果。 | 在集群中,DN有多個。每個DN存儲了一部分數據。如果DN無高可用方案,則故障時會導致該實例上的數據無法訪問。 |