數據治理中心DataArts Studio實例
DataArts Studio實例是數據治理中心給用戶提供的最小計算資源單位。數據治理中心以DataArts Studio實例的方式提供給用戶,用戶可以同時創建多個DataArts Studio實例,并分別管理和訪問每個DataArts Studio實例。每個DataArts Studio實例具有用戶指定的基礎計算資源,包含管理中心、規范設計、數據集成、數據開發、數據質量、數據資產和數據服務七個模塊。用戶可根據業務需要申請相應規格的DataArts Studio實例。
工作空間
工作空間是從系統層面為管理者提供對使用DataArts Studio的用戶(成員)權限、資源、DataArts Studio底層計算引擎配置的管理能力。
工作空間作為成員管理、角色和權限分配的基本單元,每個團隊都可具有獨立的工作空間。
您只有在加入工作空間并被分配權限后,才可具備管理中心、數據資產、數據質量、業務指標、數據規范、數據服務、數據開發、數據遷移和數據接入模塊的系列操作權限。
成員和角色
成員是被授予工作空間訪問或使用權限的云賬號。在添加工作空間成員時,您需要同時為添加的成員設置相應的角色。
角色是一組操作權限的集合。不同的角色擁有不同的操作權限,把角色授予成員后,成員即具有了角色的所有權限。每位成員至少要擁有一個角色,并且可以同時擁有多種角色。
工作空間有四種角色,包括:管理員、開發者、運維者和訪客。
批量數據遷移集群
批量數據遷移給用戶提供的最小資源單位,一個批量數據遷移集群運行在一個彈性云主機之上,用戶可以在集群中創建數據遷移作業,在云上和云下的同構/異構數據源之間批量遷移數據。
數據連接
定義訪問數據實體存儲(計算)空間所需的信息的集合,包括連接類型、名稱和登錄信息等。
作業(數據開發)
在數據開發中,作業由一個或多個節點組成,共同執行以完成對數據的一系列操作。
節點
節點用于定義對數據執行的操作。例如,使用“MRS Spark”節點可以實現在MRS中執行預先定義的Spark作業。
資源
用戶可以上傳自定義的代碼或文本文件作為資源,并在節點運行時調用。
函數
函數可以作為腳本/作業參數的值,所有函數都以“$”符號開頭,后面接函數名和參數序列。
表達式
數據開發作業中的節點參數可以使用表達式語言(Expression Language,簡稱EL),根據運行環境動態生成參數值。數據開發 EL表達式使用簡單的算術和邏輯計算,引用內嵌對象,包括作業對象和一些工具類對象。
環境變量
環境變量是在操作系統中一個具有特定名字的對象,它包含了一個或者多個應用程序所將使用到的信息。
補數據
手工觸發周期方式調度的作業任務,生成過去某時間段內的實例。