MRS Spark
更新時間 2023-07-18 18:39:35
最近更新時間: 2023-07-18 18:39:35
分享文章
本章節主要介紹節點參考的MRS Spark。
功能
通過MRS Spark節點實現在MRS中執行預先定義的Spark作業。
參數
用戶可參考下表配置MRS Spark節點的參數。
屬性參數
| 參數 | 是否必選 | 說明 |
|---|---|---|
| 節點名稱 | 是 | 節點名稱,可以包含中文、英文字母、數字、“_”、“-”、“/”、“<”、“>”等各類特殊字符,長度為1~128個字符。 |
| MRS集群名 | 是 | 選擇MRS集群。如需新建集群,請參考以下方法: 單擊 ,進入“集群列表”頁面新建MRS集群。前往MRS管理控制臺進行新建。 |
| Spark作業名稱 | 是 | MRS作業名稱,只能包含英文字母、數字、“_”,且長度為1~64個字符。 說明 作業名稱不得包含中文字符、超出長度限制等。如果作業名稱不符合規則,將導致提交MRS作業失敗。 |
| Jar包資源 | 是 | 選擇Jar包。在選擇Jar包之前,您需要先將Jar包上傳至OBS桶中,并在“資源管理”頁面中新建資源將Jar包添加到資源管理列表中,具體操作請參考管理資源章節中的“新建資源”。 |
| Jar包參數 | 否 | Jar包的參數。 |
| 運行程序參數 | 否 | 為本次執行的作業配置相關優化參數(例如線程、內存、CPU核數等),用于優化資源使用效率,提升作業的執行性能。 說明 若集群為MRS 1.8.7版本或MRS 2.0.1之后版本,需要配置此參數。MRS Spark作業的運行程序參數,請參見《MapReduce服務用戶指南》“管理集群 >作業管理> 運行Spark作業”章節。 |
| 輸入數據路徑 | 否 | 選擇輸入數據所在的路徑。 |
| 輸出數據路徑 | 否 | 選擇輸出數據存儲的路徑。 |
高級參數
| 參數 | 是否必選 | 說明 |
|---|---|---|
| 節點狀態輪詢時間(秒) | 是 | 設置輪詢時間(1~60秒),每隔x秒查詢一次節點是否執行完成。 |
| 節點執行的最長時間 | 是 | 設置節點執行的超時時間,如果節點配置了重試,在超時時間內未執行完成,該節點將不會再重試,直接置為失敗狀態。 |
| 失敗重試 | 是 | 節點執行失敗后,是否重新執行節點。 是:重新執行節點,請配置以下參數。 ? 最大重試次數 ? 重試間隔時間(秒) 否:默認值,不重新執行節點。 說明 如果作業節點配置了重試,并且配置了超時時間,該節點執行超時后將不會再重試,直接置為失敗狀態。 |
| 失敗策略 | 是 | 節點執行失敗后的操作: 終止當前作業執行計劃:停止當前作業運行,當前作業實例狀態顯示為“失敗”。 繼續執行下一節點:忽略當前節點失敗,當前作業實例狀態顯示為“忽略失敗成功”。 掛起當前作業執行計劃:暫停當前作業運行,當前作業實例狀態顯示為“等待運行”。 終止后續節點執行計劃:停止后續節點的運行,當前作業實例狀態顯示為“失敗”。 |
| 空跑 | 否 | 如果勾選了空跑,該節點不會實際執行,將直接返回成功。 |
血緣關系
| 參數 | 說明 |
|---|---|
| 輸入 | |
| 新建 | 單擊“新建”,在“類型”的下拉選項中選擇要新建的類型。可以選擇DWS,OBS,CSS,HIVE,CUSTOM和DLI類型。 DWS ? 連接名稱(必選):單擊 ![]() ,在彈出的“連接名稱”窗口選擇DWS的數據連接。? 數據庫(必選):單擊 ![]() ,在彈出的“數據庫”窗口選擇DWS的數據庫。? schema(必選):單擊 ![]() ,在彈出的“schema”窗口選擇DWS的數據庫模式。? 表名(必選):單擊 ![]() ,在彈出的“表名”窗口選擇DWS的數據表。OBS ? 路徑(必選):單擊 ![]() ,在彈出的“OBS文件瀏覽”窗口選擇OBS路徑。CSS ? 集群名稱(必選):單擊 ![]() ,在彈出的“CloudSearch集群”窗口選擇CloudSearch集群。? 索引名稱(必選):輸入CSS類型的索引名稱。 HIVE ? 連接名稱(必選):單擊 ![]() ,在彈出的“連接名稱”窗口選擇HIVE的數據連接。? 數據庫(必選):單擊 ![]() ,在彈出的“數據庫”窗口選擇HIVE的數據庫。? 表名(必選):單擊 ![]() ,在彈出的“表名”窗口選擇HIVE的數據表。CUSTOM ? 名稱(必選):輸入CUSTOM類型的名稱。 ? 屬性(必選):輸入CUSTOM類型的屬性,可新增不止一條。 DLI ? 連接名稱(必選):單擊 ![]() ,在彈出的“連接名稱”窗口選擇DLI的數據連接。? 數據庫(必選):單擊 ![]() ,在彈出的“數據庫”窗口選擇DLI的數據庫。? 表名(必選):單擊 ,在彈出的“表名”窗口選擇DLI的數據表。 |
| 確定 | 單擊“確認”,保存節點輸入功能的參數配置。 |
| 取消 | 單擊“取消”,取消節點輸入功能的參數配置。 |
| 編輯 | 單擊![]() ,修改節點輸入功能的參數配置,修改完成后,請保存。 |
| 刪除 | 單擊![]() ,刪除節點輸入功能的參數配置。 |
| 查看表詳情 | 單擊![]() ,查看節點輸入血緣關系創建數據表的詳細信息。 |
| 輸出 | |
| 新建 | 單擊“新建”,在“類型”的下拉選項中選擇要新建的類型。可以選擇DWS,OBS,CSS,HIVE,CUSTOM和DLI類型。 DWS ? 連接名稱(必選):單擊 ![]() ,在彈出的“連接名稱”窗口選擇DWS的數據連接。? 數據庫(必選):單擊 ![]() ,在彈出的“數據庫”窗口選擇DWS的數據庫。? schema(必選):單擊 ![]() ,在彈出的“schema”窗口選擇DWS的數據庫模式。? 表名(必選):單擊 ![]() ,在彈出的“表名”窗口選擇DWS的數據表。OBS ? 路徑(必選):單擊 ![]() ,在彈出的“OBS文件瀏覽”窗口選擇OBS路徑。CSS ? 集群名稱(必選):單擊 ![]() ,在彈出的“CloudSearch集群”窗口選擇CloudSearch集群。? 索引名稱(必選):輸入CSS類型的索引名稱。 HIVE ? 連接名稱(必選):單擊 ![]() ,在彈出的“連接名稱”窗口選擇HIVE的數據連接。? 數據庫(必選):單擊 ![]() ,在彈出的“數據庫”窗口選擇HIVE的數據庫。? 表名(必選):單擊 ![]() ,在彈出的“表名”窗口選擇HIVE的數據表。CUSTOM ? 名稱(必選):輸入CUSTOM類型的名稱。 ? 屬性(必選):輸入CUSTOM類型的屬性,可新增不止一條。 DLI ? 連接名稱(必選):單擊 ![]() ,在彈出的“連接名稱”窗口選擇DLI的數據連接。? 數據庫(必選):單擊 ![]() ,在彈出的“數據庫”窗口選擇DLI的數據庫。? 表名(必選):單擊 ,在彈出的“表名”窗口選擇DLI的數據表。 |
| 確定 | 單擊“確認”,保存節點輸出功能的參數配置。 |
| 取消 | 單擊“取消”,取消節點輸出功能的參數配置。 |
| 編輯 | 單擊![]() ,修改節點輸出功能的參數配置,修改完成后,請保存。 |
| 刪除 | 單擊![]() ,刪除節點輸出功能的參數配置。 |
| 查看表詳情 | 單擊![]() ,查看節點輸出血緣關系創建數據表的詳細信息。 |
,進入“集群列表”頁面新建MRS集群。
,在彈出的“連接名稱”窗口選擇DWS的數據連接。
,在彈出的“數據庫”窗口選擇DWS的數據庫。
,在彈出的“schema”窗口選擇DWS的數據庫模式。
,在彈出的“表名”窗口選擇DWS的數據表。
,在彈出的“OBS文件瀏覽”窗口選擇OBS路徑。
,在彈出的“CloudSearch集群”窗口選擇CloudSearch集群。
,在彈出的“連接名稱”窗口選擇HIVE的數據連接。
,在彈出的“數據庫”窗口選擇HIVE的數據庫。
,在彈出的“表名”窗口選擇HIVE的數據表。
,在彈出的“連接名稱”窗口選擇DLI的數據連接。
,在彈出的“數據庫”窗口選擇DLI的數據庫。
,在彈出的“表名”窗口選擇DLI的數據表。
,修改節點輸入功能的參數配置,修改完成后,請保存。
,刪除節點輸入功能的參數配置。
,查看節點輸入血緣關系創建數據表的詳細信息。
,在彈出的“連接名稱”窗口選擇DWS的數據連接。
,在彈出的“數據庫”窗口選擇DWS的數據庫。
,在彈出的“schema”窗口選擇DWS的數據庫模式。
,在彈出的“表名”窗口選擇DWS的數據表。
,在彈出的“OBS文件瀏覽”窗口選擇OBS路徑。
,在彈出的“CloudSearch集群”窗口選擇CloudSearch集群。
,在彈出的“連接名稱”窗口選擇HIVE的數據連接。
,在彈出的“數據庫”窗口選擇HIVE的數據庫。
,在彈出的“表名”窗口選擇HIVE的數據表。
,在彈出的“連接名稱”窗口選擇DLI的數據連接。
,在彈出的“數據庫”窗口選擇DLI的數據庫。
,在彈出的“表名”窗口選擇DLI的數據表。
,修改節點輸出功能的參數配置,修改完成后,請保存。
,刪除節點輸出功能的參數配置。
,查看節點輸出血緣關系創建數據表的詳細信息。