DataArts Studio數據架構的流程如下:

1.準備工作 :
?添加審核人 :在數據架構中,業務流程中的步驟都需要經過審批,因此,需要先添加審核人。只有工作空間管理員角色的用戶才具有添加審核人的權限。
?管理配置中心 :數據架構中提供了豐富的自定義選項,統一通過配置中心提供,您需要根據自己的業務需要進行自定義配置。
2.數據調研 :基于現有業務數據、行業現狀進行數據調查、需求梳理、業務調研,輸出企業業務流程以及數據主題劃分。
?主題設計 :通過分層架構表達對數據的分類和定義,幫助厘清數據資產,明確業務領域和業務對象的關聯關系。
- 主題域分組 :基于業務場景對主題域進行分組。
- 主題域 :互不重疊數據的高層面的數據分類,用于管理其下一級的業務對象。
- 業務對象 :指企業運作和管理中不可缺少的重要人、事、物信息。
?流程設計 :針對流程的一個結構化的整體框架,描述了企業流程的分類、層級以及邊界、范圍、輸入/輸出關系等,反映了企業的商業模式及業務特點。
3.標準設計 :新建碼表&數據標準。
?新建碼表 :通常只包括一系列允許的值和附加文本描述,與數據標準關聯用于生成值域校驗質量監控。
?新建數據標準 :用于描述公司層面需共同遵守的屬性層數據含義和業務規則。其描述了公司層面對某個數據的共同理解,這些理解一旦確定下來,就應作為企業層面的標準在企業內被共同遵守。
4.模型設計: 應用關系建模和維度建模的方法,進行分層建模。
?關系建模 :基于關系建模,新建SDI層和DWI層兩個模型。
- SDI :Source Data Integration,又稱貼源數據層。SDI是源系統數據的簡單落地。
- DWI :Data Warehouse Integration,又稱數據整合層。DWI整合多個源系統數據,對源系統進來的數據進行整合、清洗,并基于三范式進行關系建模。
?維度建模 :基于維度建模,新建DWR層模型并發布維度和事實表。
- DWR :Data Warehouse Report,又稱數據報告層。DWR基于多維模型,和DWI層數據粒度保持一致。
- 維度 :維度是用于觀察和分析業務數據的視角,支撐對數據進行匯聚、鉆取、切片分析,用于SQL中的GROUP BY條件。
- 事實表 :歸屬于某個業務過程的事實邏輯表,可以豐富具體業務過程所對應事務的詳細信息。
5.指標設計 :新建業務指標和技術指標,技術指標又分為原子指標、衍生指標和復合指標。
?指標 :指標一般由指標名稱和指標數值兩部分組成,指標名稱及其涵義體現了指標質的規定性和量的規定性兩個方面的特點,指標數值反映了指標在具體時間、地點、條件下的數量表現。
業務指標用于指導技術指標,而技術指標是對業務指標的具體實現。
?原子指標 :原子指標中的度量和屬性來源于多維模型中的維度表和事實表,與多維模型所屬的業務對象保持一致,與多維模型中的最細數據粒度保持一致。
原子指標中僅含有唯一度量,所含其它所有與該度量、該業務對象相關的屬性,旨在用于支撐指標的敏捷自助消費。
?衍生指標 :是原子指標通過添加限定、維度卷積而成,限定、維度均來源于原子指標關聯表的屬性。
?復合指標 :由一個或多個衍生指標疊加計算而成,其中的維度、限定均繼承于衍生指標。
注意,不能脫離衍生指標、維度和限定的范圍,去產生新的維度和限定。
6.數據集市建設 :新建DM層并發布匯總表。
?DM (Data Mart) :又稱數據集市。DM面向展現層,數據有多級匯總。
?匯總表 :匯總表是由一個特定的分析對象(如會員)及其相關的統計指標組成的。組成一個匯總邏輯表的統計指標都具有相同的統計粒度(如會員),匯總邏輯表面向用戶提供了以統計粒度(如會員)為主題的所有統計數據(如會員主題集市)。