實例監控
更新時間 2023-07-21 00:35:15
最近更新時間: 2023-07-21 00:35:15
分享文章
本章節主要介紹運維調度的實例監控。
作業每次運行,都會對應產生一次作業實例記錄。在數據開發模塊控制臺的左側導航欄,選擇“運維調度”,進入實例監控列表頁面,用戶可以在該頁面中查看作業的實例信息,并根據需要對實例進行更多操作。
實例監控支持從“作業名稱”、“創建人”、“CDM作業”和“節點類型”等維度搜索實例。其中按照“CDM作業”搜索,是從節點的維度搜索,搜索包含該節點的作業實例列表。
作業實例操作
- 登錄DataArts Studio控制臺。選擇實例,點擊“進入控制臺”,選擇對應工作空間的“數據開發”模塊,進入數據開發頁面。
詳見下圖:選擇數據開發


- 在數據開發主界面的左側導航欄,選擇“運維調度 > 實例監控”。
- 當前支持批量停止、重跑、繼續執行、強制成功多個實例,使用說明參見下表。
其中,批量重跑多個實例時,重跑的順序如下:
? 如果作業不依賴上一調度周期,多個實例并行重跑。
? 如果作業自依賴,多個實例串行重跑,以上一調度周期中實例執行完成的先后順序為準,先執行完成的先重跑。
- 在實例列表中,提供如下表所示的操作。
實例監控操作
| 操作項 | 說明 |
|---|---|
| 根據“作業名稱”或“創建人”搜索作業 | 如果勾選了“作業名稱”前的“精確搜索”,可支持作業名稱的精確匹配搜索。 如果未勾選“作業名稱”前的“精確搜索”,可支持作業名稱的模糊匹配搜索。 |
| 根據“CDM作業”或“節點類型”篩選作業 | - |
| 停止 | 停止運行狀態為“待運行”、“運行中”或“運行異常”的實例。 |
| 重跑 | 重新運行狀態為“成功”或“取消”的實例。詳細操作請參見下方“重跑作業實例”。 |
| 查看等待作業實例 | 實例的狀態為“等待運行”時,支持查看等待的作業實例。 |
| 更多> 繼續執行 | 實例的狀態為“運行異常”時,支持繼續運行實例中的后續節點。 說明 只有節點的“節點屬性>高級 > 失敗策略”設置為“掛起當前作業執行計劃”時,才可以執行該操作。 |
| 更多> 強制成功 | 強制將狀態為“運行異常”、“取消”、“失敗”的實例變更為“成功”狀態,當前實例狀態顯示為“強制成功”。 |
| 更多> 查看 | 跳轉至作業開發頁面,查看作業信息。 |
- 單擊實例前方的

,顯示該實例所有節點的運行記錄。 - 在節點的“操作”列,提供如下表所示的操作。
操作(節點)
| 操作項 | 說明 |
|---|---|
| 查看日志 | 查看節點的日志信息。 |
| 更多> 手工重試 | 節點的狀態為“失敗”時,支持重新運行節點。 說明 只有節點的“節點屬性>高級 > 失敗策略”設置為“掛起當前作業執行計劃”時,才可以執行該操作。 |
| 更多> 強制成功 | 節點的狀態為“失敗”時,支持將該節點強制變更為“成功”狀態,且實例監控中作業實例的狀態顯示為“強制成功”。 說明 只有節點的“節點屬性>高級 > 失敗策略”設置為“掛起當前作業執行計劃”時,才可以執行該操作。 |
| 更多> 跳過 | 節點的狀態為“待運行”或“已暫停節點”時,支持跳過該節點。 |
| 更多> 暫停 | 節點的狀態為“待運行”時,支持暫停運行該節點,該暫停節點的后續節點將會被阻塞。 |
| 更多> 恢復 | 節點的狀態為“已暫停”時,支持恢復運行該節點。 |
重跑作業實例
您可以對運行成功或失敗的作業實例設置重跑,配置重跑開始位置。
- 登錄DataArts Studio控制臺。選擇實例,點擊“進入控制臺”,選擇對應工作空間的“數據開發”模塊,進入數據開發頁面。
詳見下圖:選擇數據開發


- 在數據開發主界面的左側導航欄,選擇“運維調度 > 實例監控”。
- 選擇作業名稱,在作業的“操作”列,單擊“重跑”設置重跑作業實例;或單擊作業名稱左邊的復選框,再選擇“重跑”按鈕設置作業實例重跑。
詳見下圖:設置作業重跑


參數說明
| 參數 | 說明 |
|---|---|
| 重跑類型 | 選擇需要重跑的實例。 重跑當前實例 重跑當前作業以及上下游作業實例: |
| 開始時間 | 重跑用戶設置的時間段內的實例。 |
| 重跑作業實例列表 | 選擇需要重跑的上下游作業,支持多選。 |
| 重跑開始位置 | 選擇作業實例重跑的開始位置: 從錯誤節點開始重跑:作業實例執行失敗時,從實例執行失敗的錯誤節點開始重跑。 從第一個節點開始重跑:從作業實例的第一個節點開始重跑。 從指定的節點開始重跑:從作業實例中指定的節點開始重跑。僅當“重跑類型”為“重跑當前實例”時有此選項。 說明 以下兩種情況,系統運行會從第一個節點開始重跑。 如果作業中節點個數或者名稱發生變化,從第一個節點開始重跑。 如果重跑成功狀態的作業實例,從第一個節點開始重跑。 |
| 處理并發數 | 選擇作業實例并行處理的數量。 |