概述
主機高可用提供應用級的高可用保護軟件。數據層基于磁盤鏡像方式實時捕獲生產數據并復制到災備服務器;應用層實時監控運行狀態,若出現異常(如服務異常停止、網絡異常、硬件故障、系統宕機)導致業務不可達時,將應用切換到災備服務器上,通過應用接管實現業務的連續性。
前提條件
按照網絡配置與drnode安裝部署流程完成網絡環境配置、模塊化安裝部署、許可授權管理及同步節點創建等四項標準化前置流程。
環境要求
高可用規則需要一些環境要求,分別如下:
裝有drnode節點的工作機,并以節點(容災主機角色)的形式添加進控制臺,工作機節點需要有主機高可用許可。
裝有drnode節點的災備機,并以節點(容災主機角色)的形式添加進控制臺,災備機節點需要有主機高可用許可。
災備機需要部署工作機被保護的相同應用。
(可選)用戶若配置共享IP,需要準備一個可使用的IP地址,作為應用服務端對外提供業務訪問的IP地址。
(可選)用戶若配置基于共享存儲的集群,需要準備具有iSCSI功能的存儲,參與集群的節點需要配置iSCSI發起者程序連接iSCSI目標并掛載共享磁盤。
新建規則
登錄天翼云,進入。
單擊管理控制臺左上角的

,選擇區域。在服務列表選擇“計算”-“多活容災服務”,進入。
點擊左側菜單欄-“資源同步”-“資源同步管理”,進入資源同步管理頁面。
點擊左側菜單欄-“主機高可用”,點擊“高可用”,進入高可用頁面。
點擊“新建”按鈕,進入新建高可用規則頁面。
基本設置頁面的配置項如下:
| 參數 | 配置說明 |
|---|---|
規則名稱 | 用戶自定義的高可用規則名稱,便于管理,支持中文和英文字符,區分和識別當前任務的名稱。 |
自動切換 | 若勾選自動切換時;當高可用規則滿足切換條件時,原從節點會變為主節點,原主節點變為從節點; 若不勾選自動切換時,當高可用規則滿足切換條件時,規則狀態會提示警告,用戶需要手動執行切換。 |
重啟接管 | 此配置僅在高可用規則的主、從節點中僅有單節點存活并發生重啟時生效;不開啟重啟接管(也不開啟自動切換)時,單節點重啟后,角色為游離,不加載相關資源,需要人工手動“強制切換”后變為主節點,并加載相關資源;開啟重啟接管時,單節點重啟后,如果是原主節點重啟,則重啟后繼續成為主節點;如果是原從節點重啟,則重啟后可能是主節點或者游離(不勾選“進入復制狀態才允許切換”時,角色變為主節點;勾選“進入復制狀態才允許切換”時,角色變為游離狀態)。 注意:此配置與“自動切換”互斥。 |
節點設置 | 兩個節點之間不允許是同一個主機,可添加兩個節點加入主機高可用規則,當定義優先級相同的時候,在規則啟動后設置為初始主節點的主機將扮演主節點提供應用服務;否則優先級賦值更高的主機會成為初始主節點。 |
仲裁設置 | 不設置:用戶可以根據自己的環境選擇使用仲裁設置,默認為不使用; |
心跳線 | 主機高可用節點間的通訊模塊,負責主機高可用節點間的信息通訊,心跳的檢測,出現故障時備端將自動切換。主機高可用節點非網卡IP地址可手動輸入(現版本使用的通訊類型都為TCP,選擇其他類型暫不可用)。 |
配置完“基本設置”后,單擊“下一步”,進行“數據同步”的配置。
數據同步頁面的配置項如下:
| 參數 | 配置說明 |
|---|---|
| 路徑映射 | 用戶選擇主節點的文件系統目錄和從節點的文件系統目錄實現數據同步,后續可以在復制規則列表頁面查詢。 |
| 創建時啟動復制規則 | 若啟用,提交規則后自動啟動主節點到從節點的復制規則。 若不啟用,提交規則后用戶需手動啟動主節點到從節點的復制規則。默認不啟用。 |
| 進入復制狀態才允許切換 | 默認為啟用。應用切換的前提是兩端數據的同步,如果當前狀態下的主節點數據文件尚未完全同步到從節點,那么在這個時間點如果進行應用切換讓從節點接管服務,會導致兩端的數據不一致。不論是前一頁配置“自動切換”是否勾選,僅當所配置的數據復制規則處于復制狀態,主機高可用切換才會運行執行。但極端情況下,比如生產中心遭受自然災害整體被摧毀,而且同時假設剛好有生產數據因為網絡因素尚未完成到異地的同步,那么這種小概率事件發生的情況下,生產數據無法從生產中心恢復,用戶就需要在頁面上單擊“強制切換”操作,觸發異地的應用服務執行接管。頁面會彈出警告信息要求用戶再次確認后才會執行切換。 |
| 反向規則 | 若勾選,提交規則后會自動創建由從節點到主節點的復制規則,若不勾選,則不會創建。默認不勾選。 |
自動啟動復制規則 | 若勾選時,規則發生切換后,會自動啟動相應的復制規則; 若不勾選,規則發生切換后,用戶需手動啟動相應的復制規則。 |
單擊“確定”完成數據同步的配置,單擊“下一步”,進行監控對象的配置。
監控對象頁面的配置項如下:
| 參數 | 配置說明 |
|---|---|
類型 | 服務監控:指定Windows系統的服務名稱作為監控對象。服務運行時監控正常,服務停止時監控失敗。 |
| 檢測間隔(秒) | 選擇任何一種監控類型,用戶都需要配置檢測間隔,默認為2秒;用戶根據業務系統RPO要求和環境因素進行調整。 |
| 最大失敗次數 | 默認為5次,監控請求但未成功獲取對象的運行狀態的次數,累積達到5次,drnode程序判定被監控節點對象(服務、進程、內存、CPU、自定義腳本、磁盤)失敗。 |
| 失敗后僅記日志 | 勾選時,如果監控的對象出現異常,drnode程序只會在日志中產生警告信息,但不進行切換;默認不勾選。 |
| 監控角色 | 用戶可以選擇監控的角色,分為:主節點、從節點、主從節點,共三個選項:當監控的角色滿足監控條件后,高可用規則默認會變為告警狀態,如果規則開啟了自動切換,則會執行角色切換動作。 |
| 服務名稱 | 用戶自行填寫需要保護的應用對應的服務名。 |
配置完“監控對象”后,單擊“下一步”,進行“資源切換”的配置。
資源切換頁面的配置項如下:
| 參數 | 配置說明 |
|---|---|
| 類型 | 腳本切換資源:高可用規則發生切換的過程中執行,從節點變為主節點時執行獲取資源執行腳本,主節點變為從節點時執行釋放資源執行腳本。 |
完成上述配置后,點擊“確定”按鈕,完成高可用規則創建。
上述內容詳情可參見多活容災服務用戶幫助手冊-主機高可用。
最佳實踐
災備機:1臺災備機可接管1臺生產機;災備機建議配置:與生產機對等。
災備機與生產機1:1對應。
災備機CPU、內存硬盤等與生產機相同。
網絡要求:與增量數據相關。