租戶
數據湖探索支持多個組織、部門或應用共享使用資源。通過提供一個邏輯實體來統一使用不同資源和服務,這個邏輯實體就是租戶。多個不同的租戶統稱多租戶。租戶對應公司。一個租戶可以創建多個子用戶,并可以對不同用戶授予不同權限。
項目
各個服務中的一些可以訪問的資源集合稱為項目。一個賬號可以在一個區域下創建多個項目,并基于項目進行授權。不同項目下的資源相互隔離。項目可以是一個部門或者一個項目組。
數據庫
數據湖探索中數據庫的概念、基本用法與Oracle數據庫基本相同,它還是數據湖探索管理權限的基礎單元,賦權以數據庫為單位。
在數據湖探索中,表和數據庫是定義底層數據的元數據容器。表中的元數據讓數據湖探索知道數據所在的位置,并指定了數據的結構,例如列名稱、數據類型和表名稱。數據庫是表的邏輯分組。
元數據
元數據(Metadata)是用來定義數據類型的數據。主要是描述數據自身信息,包含源、大小、格式或其它數據特征。數據庫字段中,元數據用于詮釋數據倉庫的內容。
計算資源
數據湖探索服務中的隊列即為計算資源,計算資源是使用數據湖探索服務的基礎,用戶執行的SQL作業和Spark作業都需要使用計算資源。
存儲資源
存儲資源是數據湖探索服務內部存儲的資源,用于存儲數據庫和數據湖探索表,是向數據湖探索導入數據的必備條件,體現用戶數據存儲在數據湖探索中的數據量。
SQL作業
在SQL作業編輯器執行的SQL語句、導入數據和導出數據等操作,在系統中對應的執行實體,稱之為SQL作業。
Spark作業
Spark作業是指用戶通過可視化界面和RESTful API提交的作業,支持提交Spark Core/DataSet/Streaming/MLlib/GraphX等Spark全棧作業。
CU
CU是隊列的計價單位。 1CU= 1Core 4GMem。不同規格的隊列對應的計算能力不一樣,規格越高計算能力越好。
OBS表、數據湖探索表、CloudTable表
不同表類型表示不同的數據存儲位置。
? OBS表表示數據存儲在OBS服務的桶中。
? 數據湖探索表表示數據存儲在本服務內部的表中。
? CloudTable表表示數據儲存在CloudTable服務的表中。
可通過數據湖探索創建表,與其他服務的數據進行關聯,以此來實現不同數據源的聯合查詢分析。
常量與變量
環境變量中,常量與變量的區別如下:
? 常量在程序運行過程中,所表示的值是無法被改變的。
? 變量是“可讀、可寫”,而常量是“只讀”的。變量是在程序運行過程中,內部存儲的值,隨時可以被改變的一段內存地址。比如:int a = 123,這里的a就是一個整型變量。