操作場景
為了確保HBase元數據(主要包括tableinfo文件和HFile)安全,防止因HBase的系統表目錄或者文件損壞導致HBase服務不可用,或者系統管理員需要對HBase系統表進行重大操作(如升級或遷移等)時,需要對HBase元數據進行備份,從而保證系統在出現異常或未達到預期結果時可以及時進行數據恢復,將對業務的影響降到最低。
系統管理員可以通過FusionInsight Manager創建備份HBase任務并備份元數據。支持創建任務自動或手動備份數據。
前提條件
- 如果數據要備份至遠端HDFS中,需要準備一個用于備份數據的備集群,認證模式需要與主集群相同。其他備份方式不需要準備備集群。
- 如果主集群部署為安全模式,且主備集群不是由同一個FusionInsight Manager管理,則必須配置系統互信,請參見配置跨Manager集群互信。如果主集群部署為普通模式,則不需要配置互信。
- 主備集群必須已配置跨集群拷貝,請參見啟用集群間拷貝功能。
- 主備集群上的時間必須一致,而且主備集群上的NTP服務必須使用同一個時間源。
- 根據業務需要,規劃備份的類型、周期和策略等規格,并檢查主備管理節點“ 數據存放路徑 /LocalBackup/”是否有充足的空間。
- 如果數據要備份至NAS中,需要提前部署好NAS服務端。
- HBase的“fs.defaultFS”配置參數需要與Yarn、HDFS的配置保持一致。
- 如果HBase數據存儲在本地HDFS,支持將HBase元數據備份到OBS。如果HBase數據存儲在OBS,則不支持數據備份。
- 如果數據要備份至OBS中,需要當前集群已對接OBS,并具有訪問OBS的權限。
操作步驟
1.在FusionInsight Manager,選擇“運維 > 備份恢復 > 備份管理”。
2.單擊“創建”。
3.在“任務名稱”填寫備份任務的名稱。
4.在“備份對象”選擇待操作的集群。
5.在“備份類型”選擇備份任務的運行類型。
“周期備份”表示按周期自動執行備份,“手動備份”表示由手工執行備份。
周期備份參數
| 參數名稱 | 描述 |
|---|---|
| 開始時間 | 任務第一次啟動的時間。 |
| 周期 | 任務下次啟動,與上一次運行的時間間隔,支持按“小時”或按“天”。 |
| 備份策略 | 首次全量備份,后續增量備份 每次都全量備份 每n次進行一次全量備份 說明 備份Manager數據和組件元數據時不支持增量備份,僅支持“每次都全量備份”。 如果“路徑類型”要使用NFS或CIFS,不能使用增量備份功能。因為在NFS或CIFS備份時使用增量備份時,每次增量備份都會刷新最近一次全量備份的備份數據,所以不會產生新的恢復點。 |
6.在“備份配置”,勾選“元數據和其它數據”下的“HBase”。
說明若安裝了多個HBase服務,默認備份所有HBase服務,可單擊“指定服務”指定需要備份的HBase服務。
7.在“HBase”的“路徑類型”,選擇一個備份目錄的類型。
備份目錄支持以下類型:
- “LocalDir”:表示將備份文件保存在主管理節點的本地磁盤上,備管理節點將自動同步備份文件。
默認保存目錄為“ 數據存放路徑 /LocalBackup/”,例如“/srv/BigData/LocalBackup”。
選擇此參數值,還需要配置“最大備份數”,表示備份目錄中可保留的備份文件集數量。
- “RemoteHDFS”:表示將備份文件保存在備集群的HDFS目錄。
選擇此參數值,還需要配置以下參數:
“目的端NameService名稱”:填寫備集群的NameService名稱。可以輸入集群內置的遠端集群的NameService名稱(haclusterX,haclusterX1,haclusterX2,haclusterX3,haclusterX4),也可輸入其他已配置的遠端集群NameService名稱。
“IP 模式”:目標IP的IP地址模式。系統會根據集群網絡類型自動選擇對應的IP模式,如IPv4或者IPv6。
“目的端NameNode IP地址”:填寫備集群NameNode業務平面IP地址,支持主節點或備節點。
“目的端路徑”:填寫備集群保存備份數據的HDFS目錄。不支持填寫HDFS中的隱藏目錄,例如快照或回收站目錄;也不支持默認的系統目錄,例如“/hbase”或“/user/hbase/backup”。
“最大備份數”:填寫備份目錄中可保留的備份文件集數量。
“隊列名稱”:填寫備份任務執行時使用的Yarn隊列的名稱。需和源集群中已存在且狀態正常的隊列名稱相同。
- “NFS”:表示將備份文件通過NFS協議保存在NAS中。
選擇此參數值,還需要配置以下參數:
“IP 模式”:目標IP的IP地址模式。系統會根據集群網絡類型自動選擇對應的IP模式,如IPv4或者IPv6。
“服務器IP地址”:填寫NAS服務器IP地址。
“服務器共享路徑”:填寫用戶配置的NAS服務器共享目錄。
“最大備份數”:填寫備份目錄中可保留的備份文件集數量。
- “CIFS”:表示將備份文件通過CIFS協議保存在NAS中。
選擇此參數值,還需要配置以下參數:
“IP 模式”:目標IP的IP地址模式。系統會根據集群網絡類型自動選擇對應的IP模式,如IPv4或者IPv6。
“服務器IP地址”:填寫NAS服務器IP地址。
“端口號”:填寫CIFS協議連接NAS服務器使用的端口號,默認值為“445”。
“用戶名”:填寫配置CIFS協議時設置的用戶名。
“密碼”:填寫配置CIFS協議時設置的密碼。
“服務器共享路徑”:填寫用戶配置的NAS服務器共享目錄。
“最大備份數”:填寫備份目錄中可保留的備份文件集數量。
- “SFTP”:表示將備份文件通過SFTP協議保存到服務器中。
選擇此參數值,還需要配置以下參數:
“IP 模式”:目標IP的IP地址模式。系統會根據集群網絡類型自動選擇對應的IP模式,如IPv4或者IPv6。
“服務器IP地址”:填寫備份數據的服務器IP地址。
“端口號”:填寫SFTP協議連接備份服務器使用的端口號,默認值為“22”。
“用戶名”:填寫使用SFTP協議連接服務器時的用戶名。
“密碼”:填寫使用SFTP協議連接服務器時的密碼。
“服務器共享路徑”:SFTP服務器上的備份路徑。
“最大備份數”:填寫備份目錄中可保留的備份文件集數量。
- “OBS”:表示將備份文件保存在OBS中。
選擇此參數值,還需要配置以下參數:
“目的端路徑”:填寫保存備份數據的OBS目錄。
“最大備份數”:填寫備份目錄中可保留的備份文件集數量。
說明MRS 3.1.0及之后版本才支持備份數據到OBS。
8.單擊“確定”保存。
9.在備份任務列表中已創建任務的“操作”列,選擇“更多 > 即時備份”,開始執行備份任務。
備份任務執行完成后,系統自動在備份目錄中為每個備份任務創建子目錄,目錄名為 “備份任務名_任務創建時間” ,用于保存數據源的備份文件。備份文件的名稱為 版本號_數據源_任務執行時間.tar.gz 。