形態變更概述
ES集群支持形態變更,包括集群擴容、集群規格變更、集群縮容等。當創建的集群規格不能滿足業務需求時,可以通過形態變更,提高集群的使用效率,降低運維成本。
- 擴容: - 當集群數據節點(ess)的寫入與查詢壓力大、響應時間過長時,可以通過擴容數據節點的“節點存儲容量”保證數據的持久性。如果因數據量過大或操作不當導致數據節點狀態異常時,可以擴容“節點數量”保證集群的可用性。 
- 冷數據節點(ess-cold)主要用于分擔ess數據節點的壓力,當發現冷數據有丟失的風險時,可以擴容冷數據節點的“節點存儲容量”保證冷數據的持久性,同時也支持擴容節點個數保證集群的可用性。 
 
- 變更規格 - 當新增索引或分片分配的處理時間過長,或管理集群各個節點的協調、調度不足時,可以變更 Master節點 (ess-master)的“節點規格”保證集群的正常使用。 
- 當數據節點任務分發量、結果匯聚量過大時,需要變更 Client節點 (ess-client)的“節點規格”。 
- 當數據的寫入與查詢突然變得緩慢時,可以變更 數據節點 (ess)的“節點規格”提高數據節點的查詢與寫入效率。 
- 當存在冷數據查詢緩慢時,可以變更冷數據節點(ess-cold)的“節點規格”提高對數據查詢的效率。 
 
- 縮容集群節點數量 
當集群有充足的能力處理當前數據時,為節省資源可以隨機減小集群占用的資源。
- 縮容指定節點 - 當集群有充足的能力處理當前數據時,為節省資源可以指定一個或多個節點進行縮容。 
- 替換指定節點 - 當集群中的節點發生故障,可以通過刪除故障節點,重建一個一樣的新節點,實現指定節點替換。 
- 添加Master/Client節點 - 當集群數據面業務增長,需要動態調整集群形態時,可以增加Master/Client節點。 
- 更改安全模式 - 集群創建完成后,可以通過更改安全模式進行集群模式變更。CSS服務支持如下幾種安全模式更改: - 非安全模式切換為安全模式:“非安全模式”切換為“安全模式+HTTP協議”或“安全模式+HTTPS協議” 
- 安全模式切換為非安全模式:“安全模式+HTTP協議”或“安全模式+HTTPS協議”切換為“非安全模式” 
- 切換安全模式下的協議:“安全模式+HTTP協議”切換為“安全模式+HTTPS協議”、“安全模式+HTTPS協議”切換為“安全模式+HTTP協議” 
 
- 切換可用區 - 切換可用區包含兩大場景:可用區高可用改造和可用區平移切換。 - 可用區高可用改造:適用于單AZ改造成兩AZ、單AZ改造成三AZ或兩AZ改造成三AZ的場景,目的是為了提升集群的高可用性。 
- 可用區平移切換:適用于從一個AZ完全遷移到另一個AZ的場景,目的是為了解決當前可用區資源不足的問題。 
 
擴容
當集群數據面業務變化,需要動態調整集群節點的數量和容量時,可以執行“擴容”任務。擴容集群時,業務不會中斷。
前提條件
- 集群處于“可用”狀態,且無正在進行的任務。 
- 有足夠的配額支持集群擴容。 
約束限制
- 擴容操作不支持修改“節點規格”。修改“節點規格”請執行變更規格操作。 
- 擴容什么節點類型的“節點數量”和“節點存儲容量”,擴容完成后只生效該節點類型的“節點數量”和“節點存儲容量”,其他節點類型的“節點數量”和“節點存儲容量”保持不變。 
- 當集群包含的節點類型不同時,擴容的節點數量區間會有區別,具體情況請參考表1。 
表1 不同節點類型的節點數量說明
| 集群包含的節點類型 | 節點數量的取值范圍 | 
| ess | ess:1~32 | 
| ess、ess-master | ess:1~200 ess-master:3~9的奇數 | 
| ess、ess-client | ess:1~32 ess-client:1~32 | 
| ess、ess-cold | ess:1~32 ess-cold:1~32 | 
| ess、ess-master、ess-client | ess:1~200 ess-master:3~9的奇數 ess-client:1~32 | 
| ess、ess-master、ess-cold | ess:1~200 ess-master:3~9的奇數 ess-cold:1~32 | 
| ess、ess-client、ess-cold | ess:1~32 ess-client:1~32 ess-cold:1~32 | 
| ess、ess-master、ess-client、ess-cold | ess:1~200 ess-master:3~9的奇數 ess-client:1~32 ess-cold:1~32 | 
| 四種節點類型的說明: 
 | |
操作步驟
- 登錄云搜索服務管理控制臺。 
- 在左側菜單欄,選擇對應的集群類型,進入集群管理頁面。 
- 選擇目標集群,單擊操作列的“更多>形態變更”進入更改集群規格頁面。 
- 在更改集群規格頁面,設置擴容參數。 
- “變更類型”:“擴容”。 
- “變更的資源”:資源的變化量。 
- “變更的角色”:此處修改的是默認數據節點類型的節點數量和節點存儲容量。 - “節點數量”支持修改的取值范圍請參考表1。 
- “節點存儲”的容量取值范圍由“節點規格”決定。只支持配置為20的倍數。 
 
- 單擊“下一步”。 
- 確認變更信息后,單擊“提交申請”。 
- 單擊“返回集群列表”跳轉到集群管理頁面。集群的“任務狀態”列顯示為“擴容”,表示集群正在擴容。當集群狀態變為“可用”,則表示擴容成功。 
變更規格
當集群數據面業務變化,需要動態調整集群節點的規格時,可以執行“變更規格”任務。
前提條件
- 集群處于“可用”狀態,且無正在進行的任務。 
- 有足夠的配額支持集群變更規格。 
- 變更規格時,為了不中斷業務,請確認業務數據都有副本。 
- 在Kibana中執行命令 GET _cat/indices?v ,如果回顯的“rep”值大于“0”,則表示有副本;如果“rep”值等于“0”,則表示沒有副本,請先為集群手動創建快照再變更規格。 
- 如果數據量比較大的情況下,更改節點規格耗時會比較長,因此,建議在業務低峰期更改節點規格,利于更快完成規格更改。 
約束限制
- 變更規格不支持修改“節點數量”和“節點存儲容量”。增加“節點數量”和“節點存儲容量”請執行擴容操作。減少“節點數量”請執行縮容集群節點數量操作。 
- 如果將大規格更改為小規格,集群的處理性能將會降低,將會影響業務能力,請謹慎操作。 
- 當集群包含多種節點類型時,一次只支持變更一種類型的節點規格,且變更完成后只生效所選類型的節點規格。 
- 變更規格過程中,Kibana不可用。 
- 變更規格過程中,會依次對節點進行關機,完成更改后依次開機。是一個滾動的變更過程。 
操作步驟
- 登錄云搜索服務管理控制臺。 
- 在左側菜單欄,選擇對應的集群類型,進入集群管理頁面。 
- 選擇目標集群,單擊操作列的“更多>形態變更”進入更改集群規格頁面。 
- 在更改集群規格頁面,設置變更規格的參數。 
“變更類型”:“變更規格”。
- “變更的資源”:顯示資源的變化量。 
- “變更的角色”:此處修改的是默認數據節點類型的節點規格,在對應節點規格下拉框中選擇所需的規格,然后勾選需要變更的節點。 
- 如果集群啟用了Master節點、Client節點或冷數據節點,還可以更改Master節點、Client節點與冷數據節點的“節點規格”。 
- 單擊“下一步”。 
- 確認變更信息后,單擊“提交申請”。 
- 在彈出的窗口確認是否勾選“進行索引副本校驗”和“檢測集群狀態”,單擊“確認”啟動集群規格變更。 
索引副本校驗:
索引副本校驗用于保證索引正常提供服務。如果跳過校驗,變更規格操作將不會要求每一個索引都有副本,變更過程中可能會影響業務。
- 沒有Master節點的集群更改節點規格時,如果選擇進行索引副本校驗,則要求所有索引至少有1個副本,且“節點數量”總和不小于3。 
- 有Master節點的集群更改節點規格時,如果選擇進行索引副本校驗,則要求所有索引至少有1個副本。 
檢測集群狀態:
默認檢測集群狀態,變更規格為滾動變更,變更過程中,為了保證變更成功率以及數據安全,會確保每個節點進程拉起來后繼續后續節點操作。當集群負載過高業務故障,無法正常下發變更請求,依賴更多的資源才能恢復的緊急情況下可忽略檢測集群狀態,忽略后,變更過程中因為忽略集群狀態檢測可能會導致集群故障并中斷業務,請謹慎跳過。
- 單擊“返回集群列表”跳轉到集群管理頁面。集群的“任務狀態”列中顯示為“規格修改”,表示集群正在更改規格。當集群狀態變為“可用”,則表示規格變更成功。 
縮容集群節點數量
當集群有充足的能力處理當前數據時,為節省資源可以執行“縮容”任務,減小集群占用的資源。建議在業務低峰期進行縮容操作。
前提條件
集群處于“可用”狀態,且無正在進行的任務。
約束限制
- 縮容操作僅支持修改“節點數量”,不支持修改“節點規格”和“節點存儲容量”。修改“節點規格”請執行變更規格操作。修改“節點存儲容量”請執行擴容操作。 
- 縮容什么節點類型的“節點數量”,縮容完成后只生效新該節點類型的“節點數量”,其他節點類型的“節點數量”保持不變。 
- 要確保縮容之后的磁盤使用量小于80%,且集群每個節點類型中每個AZ的節點數至少為1。 
- 縮容過程會涉及數據遷移,將要下線的節點數據遷移到其他節點上,數據遷移的超時閾值為5小時。當超過5小時數據還未遷移完成,那么縮容會失敗。建議在集群數據量較大的情況下,分多次進行縮容。 
- 如果集群沒有啟用Master節點,縮容后剩余的數據節點個數(包含冷數據節點和其他類型節點)須大于之前的一半,并大于索引的最大副本個數。 
- 關于有Master節點的集群,每次縮容的Master節點個數要小于當前Master節點總數的一半,縮容后的Master節點個數必須是奇數且不小于3。 
- 兩個節點的集群暫不支持縮容,可使用單節點重新創建集群。 
- 當集群包含的節點類型不同時,縮容的節點數量區間會有區別,具體情況請參考表2。 
表2 不同節點類型的節點數量說明
| 集群包含的節點類型 | 節點數量的取值范圍 | 
| ess | ess:1~32 | 
| ess、ess-master | ess:1~200 ess-master:3~9的奇數 | 
| ess、ess-client | ess:1~32 ess-client:1~32 | 
| ess、ess-cold | ess:1~32 ess-cold:1~32 | 
| ess、ess-master、ess-client | ess:1~200 ess-master:3~9的奇數 ess-client:1~32 | 
| ess、ess-master、ess-cold | ess:1~200 ess-master:3~9的奇數 ess-cold:1~32 | 
| ess、ess-client、ess-cold | ess:1~32 ess-client:1~32 ess-cold:1~32 | 
| ess、ess-master、ess-client、ess-cold | ess:1~200 ess-master:3~9的奇數 ess-client:1~32 ess-cold:1~32 | 
| 四種節點類型的說明: 
 | |
操作步驟
- 登錄云搜索服務管理控制臺。 
- 在左側菜單欄,選擇對應的集群類型,進入集群管理頁面。 
- 選擇目標集群,單擊操作列的“更多>形態變更”進入更改集群規格頁面。 
- 在更改集群規格頁面,設置縮容參數。 
- “變更類型”:“縮容”。 
- “變更的資源”:顯示資源的變化量。 
- “變更的角色”:設置縮容后的節點數量,支持修改的取值范圍請參考表2。 
- 單擊“下一步”。 
- 確認變更信息后,單擊“提交申請”。 
單擊“返回集群列表”跳轉到集群管理頁面。集群的“任務狀態”列中顯示為“縮容中”,表示集群正在縮容。當集群狀態變為“可用”,則表示縮容成功。
縮容指定節點
當集群有充足的能力處理當前數據時,為節省資源可以執行“指定節點縮容”任務,指定一個或多個節點進行縮容。建議在業務低峰期進行縮容操作。
前提條件
集群處于“可用”狀態,且無正在進行的任務。
約束限制
- 要確保縮容之后的磁盤使用量小于80%,且集群每個節點類型中每個AZ的節點數至少為1。 
- 關于跨AZ的集群,在不同AZ中同類型節點個數的差值要小于等于1。 
- 關于沒有Master節點的集群,每次縮容的數據節點和冷數據節點個數之和要小于縮容前數據節點和冷數據節點個數之和的一半,縮容后的數據節點和冷數據節點個數之和要大于索引的最大副本個數。 
- 關于有Master節點的集群,每次縮容的Master節點個數要小于當前Master節點總數的一半,縮容后的Master節點個數必須是奇數且不小于3。 
操作步驟
- 登錄云搜索服務管理控制臺。 
- 在左側菜單欄,選擇對應的集群類型,進入集群管理頁面。 
- 選擇目標集群,單擊操作列的“更多>形態變更”進入更改集群規格頁面。 
- 選擇“縮容指定節點”頁簽。 
- 在縮容指定節點頁面,設置如下參數: 
- 在數據節點表格中勾選待縮容的節點。 
- 單擊“下一步”。 
- 確認變更信息后,單擊“提交申請”,在數據遷移彈窗中確認是否進行數據遷移(建議勾選“進行數據遷移”避免數據丟失),單擊“確認”提交申請。 
數據遷移過程中,系統會把待替換節點中的所有數據分片移動到剩余節點,待數據遷移完成后再進行節點替換操作。當待替換節點上的數據在剩余節點存在副本時,可跳過數據遷移,縮短集群變更時間,減少數據遷移帶來的負載壓力。
- 單擊“返回集群列表”跳轉到集群管理頁面。集群的“任務狀態”列中顯示為“縮容中”,表示集群正在縮容。當集群狀態變為“可用”,則表示縮容成功。 
替換指定節點
當集群中的節點發生故障時,可以執行“指定節點替換”任務。通過刪除故障節點,重建一個一樣的新節點,實現節點替換。替換指定節點過程中會將替換節點的數據提前轉移,不會造成數據丟失。
前提條件
集群處于“可用”狀態,且無正在進行的任務。
約束限制
- 一次只能選擇一個節點進行替換。 
- 節點替換過程會按照原節點的ID、IP地址、規格、AZ等信息重建節點。 
- 節點替換過程中不會保留手動操作。例如被替換的節點手動加過回程路由,那么節點替換完成后,需要重新添加回程路由。 
- 如果替換的是數據節點(ess或ess-cold),需要確認集群/節點是否滿足以下條件: - 替換數據節點或冷數據節點的過程中,會先將被替換節點的數據遷移到其他數據節點,因此集群中每個索引的副本數和主分片數之和的最大值要小于集群的數據節點個數之和(含ess和ess-cold)。替換過程耗時跟數據遷移到其他節點的耗時強相關。 
- 版本號在7.6.2以前的集群,不能有close的索引,否則不支持替換數據節點或冷數據節點。 
- 被替換的數據節點或冷數據節點所在的AZ需要有兩個及以上的數據節點(含ess和ess-cold)。 
- 如果替換的數據節點或冷數據節點所在集群不存在Master節點(ess-master),則集群中可用的數據節點(含ess和ess-cold)個數要大于等于3。 
- 如果替換的是Master節點(ess-master)或Client節點(ess-client),則不受以上四條約束。 
- 如果替換的是故障節點,不管什么類型都不受以上四條約束。因為故障節點不包含在“_cat/nodes”中。 
 
操作步驟
- 登錄云搜索服務管理控制臺。 
- 在左側菜單欄,選擇對應的集群類型,進入集群管理頁面。 
- 選擇目標集群,單擊操作列的“更多>形態變更”進入更改集群規格頁面。 
- 選擇“替換指定節點”頁簽。 
- 在替換指定節點頁面,設置如下參數:在數據節點表格中勾選待替換的節點。 
- 單擊“提交申請”。在數據遷移彈窗中確認是否進行數據遷移(建議勾選“進行數據遷移”避免數據丟失),單擊“確認”提交申請。 - 數據遷移過程中,系統會把待替換節點中的所有數據分片移動到剩余節點,待數據遷移完成后再進行節點替換操作。當待替換節點上的數據在剩余節點存在副本時,可跳過數據遷移,縮短集群變更時間,減少數據遷移帶來的負載壓力。 
- 單擊“返回集群列表”跳轉到集群管理頁面。集群的“任務狀態”列中顯示為“節點替換中”,表示集群正在替換節點。當集群狀態變為“可用”,則表示節點替換成功。 
添加Master/Client節點
當集群數據面業務增長,需要動態調整集群形態,增加Master/Client節點時,可以執行“添加Master/Client節點”任務。添加Master/Client節點時,業務不會中斷。
前提條件
集群處于“可用”狀態,且無正在進行的任務。
約束限制
- 如果集群已經具有Master節點和Client節點,則“形態變更”頁面將不存在“添加Master/Client節點”頁簽。如此時需要添加Master節點和Client節點,可以執行 擴容任務。 
- 添加Master節點或Client節點時,不同節點類型的可配置節點數量不同,具體情況請參考表3。 
表3 不同節點類型的節點數量說明
| 節點類型 | 節點數量的取值范圍 | 
| Master節點 | 3~9的奇數 | 
| Client節點 | 1~32 | 
操作步驟
- 登錄云搜索服務管理控制臺。 
- 在左側菜單欄,選擇對應的集群類型,進入集群管理頁面。 
- 選擇目標集群,單擊操作列的“更多>形態變更”進入更改集群規格頁面。 
- 選擇“添加Master/Client節點”頁簽。 
- 在添加Master/Client節點頁面,勾選需要添加的節點,并配置“節點規格”、“節點數量”和“節點存儲”。 - 一次任務只能添加一種節點類型;如需添加2種,需要執行2次“添加Master/Client節點”任務。 
- 如果集群本身已經有Master節點或Client節點時,則只能添加另一種類型的節點。 
 
- 單擊“下一步”。 
- 確認變更信息后,單擊“提交申請”。返回集群列表頁面,集群的“任務狀態”列中顯示為“擴容中”。 - 如果添加Master節點,當“集群狀態”變為“可用”時表示節點添加成功。 
 
說明
如果集群版本小于7.x,當“集群狀態”變為“可用”時,還需要重啟集群的所有數據節點和冷數據節點,使新增節點的配置生效。如果不重啟使新增節點配置生效,使用集群時因為上報機制問題可能顯示不可用狀態(集群業務并未不可用)。重啟操作請參見 重啟集群。
- 如果添加Client節點,當“集群狀態”變為“可用”時表示節點添加成功。可選擇是否重啟數據節點和冷數據節點,下線數據節點上的Cerebro和Kibana的進程。 
更改安全模式
集群創建完成后,可以通過更改安全模式進行集群模式變更。CSS服務支持如下幾種安全模式更改:
- 非安全模式切換為安全模式:“非安全模式”切換為“安全模式+HTTP協議”或“安全模式+HTTPS協議” 
- 安全模式切換為非安全模式:“安全模式+HTTP協議”或“安全模式+HTTPS協議”切換為“非安全模式” 
- 切換安全模式下的協議:“安全模式+HTTP協議”切換為“安全模式+HTTPS協議”、“安全模式+HTTPS協議”切換為“安全模式+HTTP協議” 
背景信息
ES服務支持創建多種安全模式的集群,不同安全模式的差異請參見表4。
表4 集群安全模式對比
| 集群安全模式 | 適用場景 | 優點 | 缺點 | 
| 非安全模式 | 適合內網業務,用于測試場景。 | 簡單,接入集群容易。 | 安全性差,誰都可以訪問集群。 | 
| 安全模式+HTTP協議 | 可以實現用戶權限隔離,適用于對集群性能敏感的場景。 | 訪問集群需要安全認證,提升了集群安全性,且通過HTTP協議訪問集群能保留集群的高性能。 | 無法公網訪問集群。 | 
| 安全模式+HTTPS協議 | 有非常高的安全要求,且需要公網訪問集群的場景。 | 訪問集群需要安全認證,提升了集群安全性,且HTTPS協議的通訊加密可以實現集群公網訪問功能。 | 通過HTTPS協議訪問集群,集群性能相對HTTP協議來說,會下降20%左右。 | 
前提條件
- 建議更改集群安全模式前,先完成數據備份。 
- 集群必須處于“可用”狀態,且無正在進行的任務。 
約束限制
- 2022年11月之后創建的集群(且集群版本不小于6.5.4)才支持切換安全模式。 
- 在更改集群安全模式的過程中,集群會自動重啟。重啟會導致業務中斷,并且重啟后調用集群的認證方式也會發生改變,客戶端需要做相應調整。 
- 對于已打開過Kibana會話框的集群,在更改集群安全模式后,Kibana會提示Session錯誤,此時需要清理緩存再打開Kibana才能正常訪問。 
非安全模式切換為安全模式
介紹集群從“非安全模式”切換為“安全模式+HTTP協議”或“安全模式+HTTPS協議”的操作。當集群從非安全模式變更為安全模式后,訪問集群將需要進行安全認證。
- 登錄云搜索服務管理控制臺。 
- 在左側菜單欄,選擇“集群管理>Elasticsearch”,進入Elasticsearch集群管理頁面。 
- 選擇目標集群,單擊操作列的“更多>形態變更”進入更改集群規格頁面。 
- 選擇“更改安全模式”頁簽。 
- 在更改安全模式頁面,打開“安全模式”的開關,輸入并確認集群的管理員密碼。 
圖 1 非安全模式切換為安全模式
- 選擇集群是否啟用“HTTPS訪問”。 
- 打開開關:實現“非安全模式”切換為“安全模式+HTTPS協議”。集群通訊使用HTTPS協議,通訊數據將進行加密,且可以啟用集群的公網訪問功能。 
- 關閉開關:實現“非安全模式”切換為“安全模式+HTTP協議”。集群通訊使用HTTP協議,無法啟用集群的公網訪問功能。 
- 單擊“提交申請”,確認后將返回集群列表頁面。 
集群的“任務狀態”列中顯示為“安全模式更改中”,當“集群狀態”變為“可用”表示變更成功。
安全模式切換為非安全模式
介紹集群從“安全模式+HTTP協議”或“安全模式+HTTPS協議”切換為“非安全模式”的操作。當集群從安全模式變更為非安全模式后,訪問集群將不再需要進行安全認證。
說明
- 非安全模式的集群將無需安全認證即可訪問,且采用的是HTTP協議傳輸數據,所以請確保集群訪問環境的安全性,勿將訪問接口暴露到公網環境上。 
- 在安全模式切換為非安全模式的過程中,變更任務會刪除原安全模式的集群用到的索引。切換前請做好數據備份,以免數據丟失。 
- 如果集群已綁定公網IP,則無法將安全模式切換為非安全模式,需要先解綁公網IP,才能切換。 
- 如果集群已啟用Kibana公網訪問,則無法將安全模式切換為非安全模式,需要先關閉Kibana公網訪問功能,才能切換。 
- 登錄云搜索服務管理控制臺。 
- 左側導航欄選擇“集群管理”,進入集群列表頁面,選擇需要更改安全模式的集群,單擊操作列的“更多>形態變更”進入更改集群規格頁面。 
- 選擇“更改安全模式”頁簽。 
- 在更改安全模式頁面,關閉“安全模式”的開關。 
圖2 安全模式切換為非安全模式
- 單擊“提交申請”,確認后將返回集群列表頁面。 - 集群的“任務狀態”列中顯示為“安全模式更改中”,當“集群狀態”變為“可用”表示變更成功。 
切換安全模式下的協議
介紹安全模式的集群切換訪問協議的操作,包括“安全模式+HTTP協議”切換為“安全模式+HTTPS協議”、“安全模式+HTTPS協議”切換為“安全模式+HTTP協議”。
說明
如果集群已綁定公網IP,則無法將協議從HTTPS切換到HTTP,需要先解綁公網IP,才能切換安全模式下的協議。
- 登錄云搜索服務管理控制臺。 
- 左側導航欄選擇“集群管理”,進入集群列表頁面,選擇需要更改安全模式的集群,單擊操作列的“更多>形態變更”進入更改集群規格頁面。 
- 選擇“更改安全模式”頁簽。 
- 在更改安全模式頁面,修改“HTTPS訪問”的開關切換安全模式下的集群訪問協議。 
圖3 切換協議
- 打開開關:實現“安全模式+HTTP協議”切換為“安全模式+HTTPS協議”。 
切換為HTTPS協議后,集群通訊將進行加密,且可以啟用集群的公網訪問功能。
- 關閉開關:實現“安全模式+HTTPS協議”切換為“安全模式+HTTP協議”。關閉開關會彈出告警提示,單擊“確定”后關閉開關。 
切換為HTTP協議后,集群通訊將不再加密,且無法啟用集群的公網訪問功能。
- 單擊“提交申請”,確認后將返回集群列表頁面。 
集群的“任務狀態”列中顯示為“安全模式更改中”,當“集群狀態”變為“可用”表示變更成功。
切換可用區
CSS服務支持跨可用區的能力,在集群使用過程中遇到可用區資源不足或需要提升集群的高可用性時,可以通過切換可用區進行升配。本文介紹如何切換可用區。
場景描述
切換可用區包含兩大場景:可用區高可用改造和可用區平移切換。
- 可用區高可用改造:適用于單AZ改造成兩AZ、單AZ改造成三AZ或兩AZ改造成三AZ的場景,目的是為了提升集群的高可用性。 
- 可用區平移切換:適用于從一個AZ完全遷移到另一個AZ的場景,目的是為了解決當前可用區資源不足的問題。 
前提條件
- 確保存在資源充足的可用區。 
- 集群處于“可用”狀態,且無正在進行的任務。 
- 確認集群不存在非標操作。當集群進行過修改回程路由、系統參數、Kibana配置等這些非標操作時,這些操作無法被記錄到系統中,因此在切換過程中將無法繼承,切換后可能會影響業務。 
約束限制
- 為了保證業務的連續性,集群中數據節點和冷數據節點的個數之和要不小于3。 
- 切換過程中會逐一下線節點再新建節點,需要保證單節點下線后,其余節點的磁盤容量能夠接納該節點的所有數據。 
- 集群中索引的最大主備分片數能夠被分配到剩余數據節點和冷數據節點中,防止切換過程中出現節點下線后副本無法分配的情況。即“索引的主備分片數的最大值+1 ≤ 切換前的數據節點數和冷數據節點之和”。 
- 切換前建議做好數據備份,防止升級故障數據丟失。 
- 當集群處于切換可用區過程中,部分節點的AZ屬性可能已經更改,此時節點的可用區可能會顯示出中間狀態,等待任務結束后,集群的可用區顯示將恢復正常狀態。 
- 可用區高可用改造是基于原可用區進行擴展,切換時必須保留原可用區。如果是單AZ改造成兩AZ或單AZ改造成三AZ的場景,必須所有節點一起改造;如果是兩AZ改造成三AZ的場景,則既支持同時操作集群中所有類型的節點,也支持單獨操作集群中某一類型的節點(例如,在已有兩AZ的集群中,可以只對Master節點進行切換可用區,將Master節點形變為三AZ,而其他節點依舊是兩AZ)。高可用改造會盡可能挪動最小的節點重建集群,改造完成后,因未挪動節點的yml配置更新,需要重啟集群才能生效。 
- 可用區平移切換一次只能遷移一個可用區,切換時選擇的可用區只能有一個不同。平移切換支持同時操作集群中所有類型的節點,或者單獨操作集群中某一類型的節點(例如,在已有兩AZ的集群中,可以只對Master節點進行平移切換,將Master節點從當前AZ遷移到另一個AZ,而其他節點依舊在當前AZ)。除了單AZ平移切換場景,其他的多AZ平移切換場景均需要重啟集群生效。 
操作步驟
- 登錄云搜索服務管理控制臺。 
- 在左側菜單欄,選擇對應的集群類型,進入集群管理頁面。 
- 選擇目標集群,單擊操作列的“更多>形態變更”進入更改集群規格頁面。 
- 選擇“切換可用區”頁簽。 
- 在切換可用區頁面,配置切換參數。 
表5 切換可用區的參數說明
| 參數 | 描述 | 
| 切換類型 | 
 高可用改造會盡可能挪動最小的節點重建集群,改造完成后,因未挪動節點的yml配置更新,需要重啟集群才能生效。 
 除了單AZ平移切換場景,其他的多AZ平移切換場景均需要重啟集群生效。 | 
| 當前節點類型 | 選擇進行AZ切換的節點類型。每次可選擇一種節點類型進行操作,當集群有多種節點類型時,可選擇“所有節點”進行全部切換。 說明 如果是單AZ改造成兩AZ或單AZ改造成三AZ的場景,只支持所有節點一起改造,因此只能選擇“所有節點”。 | 
| 當前AZ集合 | 顯示當前集群所在的可用區。 | 
| 目標AZ集合 | 選擇需要切換的目標可用區。 
 | 
| 配置委托 | 選擇IAM委托,授權當前賬號切換可用區的操作權限。 如果沒有合適的委托,可以單擊“創建委托”跳轉到IAM控制臺新建委托。 說明 選擇的委托必須授權了“Tenant Administrator”或“VPC Administrator”策略。 | 
- 配置完成后,單擊“提交申請”。確認是否進行全量索引快照備份檢測,單擊“確定”啟動切換任務。 
- 在“任務記錄”列表,顯示當前切換任務。當“任務狀態”為“運行中”時,可以展開任務列表,單擊“查看進度”查看詳細的切換進度。 
當“任務狀態”為“失敗”時,可以重試任務或者直接終止任務。
- 重試切換任務:在任務列表的操作列,單擊“重試”,重新切換可用區。 
- 終止切換任務:在任務列表的操作列,單擊“終止”,結束切換可用區。 
當任務終止后,如果原節點還未切換成功,可以通過 替換指定節點嘗試恢復節點。
說明
如果存在部分節點已經完成切換,此時集群的AZ形態已經發生變化,此時終止切換任務,可能無法再次按照上一次的切換請求進行命令下發,請謹慎執行終止切換任務。
