配置、運行采集任務是構建數據資產的前提,下面舉例說明如何通過配置采集任務達到靈活采集元數據的目的。
場景一:僅添加新元數據
用戶的數據庫中新增的數據表,采集任務僅采集新增的表。
例如新增table4的情況下:
- 采集前的數據表元數據:table1,table2,table3
- 采集后的數據表元數據:table1,table2,table3,table4
按照下面的配置,采集任務僅會采集table4。(前提:table1-table3已經在數據目錄中)
1.進入DataArts Studio控制臺首頁的數據目錄模塊。
2.單擊左側導航的“任務管理”。
3.單擊“新建”。
4.配置任務信息,如下圖所示。

5.單擊“下一步”,配置調度屬性如下圖所示。

6.單擊“提交”,完成采集任務的創建。
7.單擊任務管理列表中的“運行”或“啟動調度”,跳轉到任務監控頁面并查看任務狀態。
場景二:更新數據目錄中的元數據,添加新元數據
用戶的數據庫中新增了數據表,采集數據源中指定的所有表。
例如新增table4的情況下:
- 采集前的數據表元數據:table1,table2,table3
- 采集后的數據表元數據: table1 , table2 , table3 ,table4
按照如下配置,采集任務會采集default下所有的表(table1-table4)。
1.進入DataArts Studio控制臺首頁的數據目錄模塊。
2.單擊左側導航的“任務管理”。
3.單擊“新建”。
4.配置任務信息,如下圖所示。

5.單擊“下一步”,配置調度屬性如下圖所示。

6.單擊“提交”,完成采集任務的創建。
7.單擊任務管理列表中的“運行”或“啟動調度”,跳轉到任務監控頁面并查看任務狀態。
場景三:僅更新數據目錄中的元數據
用戶的數據庫中數據表有新增的情況,采集任務僅采集數據目錄中已經存在的表。
例如新增table4的情況下:
- 采集前的數據表元數據:table1,table2,table3
- 采集后的數據表元數據: table1 , table2 ,table3
按照如下配置,采集任務僅采集table1,table2和table3。
1.進入DataArts Studio控制臺首頁的數據目錄模塊。
2.單擊左側導航的“任務管理”。
3.單擊“新建”。
4.配置任務信息,如下圖所示。

5.單擊“下一步”,配置調度屬性如下圖所示。

6.單擊“提交”,完成采集任務的創建。
7.單擊任務管理列表中的“運行”或“啟動調度”,跳轉到任務監控頁面并查看任務狀態。
場景四:更新數據目錄中的元數據,添加新元數據 ,并從數據目錄中刪除元數據
用戶的數據庫中數據表有刪除的情況,采集任務能夠刪除數據目錄中對應的數據表。
例如數據庫刪除table1的情況下:
- 采集前的數據表元數據:table1,table2,table3
- 采集后的數據表元數據: table2 ,table3
按照如下配置,采集任務會刪除數據目錄中的table1。
1.進入DataArts Studio控制臺首頁的數據目錄模塊。
2.單擊左側導航的“任務管理”。
3.單擊“新建”。
4.配置任務信息,如下圖所示。

5.單擊“下一步”,配置調度屬性如下圖所示。

6.單擊“提交”,完成采集任務的創建。
7.單擊任務管理列表中的“運行”或“啟動調度”,跳轉到任務監控頁面并查看任務狀態。