碼表和數據標準有什么關系?
碼表的組成:碼表由多條表字段的名稱+編碼+數據類型組成。
碼表與數據標準的關系:碼表的表字段可以關聯到數據標準上,數據標準會應用到某張模型表的字段上。
關系建模和維度建模的區別?
- 關系建模為事務性模型,對應三范式建模。
- 維度建模為分析性模型,主要包括事實表、維度表的設計,多用于實現多角度、多層次的數據查詢和分析。
DataArts Studio是基于數據湖的數據運營平臺,維度建模使用的場景比較多。
數據架構支持哪些數據建模方法?
DataArts Studio數據架構支持的建模方法有以下兩種:
- 關系建模
關系建模是用實體關系(Entity Relationship,ER)模型描述企業業務,它在范式理論上符合3NF,出發點是整合數據,將各個系統中的數據以整個企業角度按主題進行相似性組合和合并,并進行一致性處理,為數據分析決策服務,但是并不能直接用于分析決策。
用戶在關系建模過程中,可以從以下三個層次去設計關系模型,這三個層次是逐層遞進的,先設計概念模型,再進一步細化設計出邏輯模型,最后設計物理模型。
a.概念模型:是從用戶的視角,主要從業務流程、活動中涉及的主要業務數據出發,抽象出關鍵的業務實體,并描述這些實體間的關系。
b.邏輯模型:是概念模型的進一步細化,通過實體、屬性和關系勾勒出企業的業務信息藍圖,是IT和業務人員溝通的橋梁。邏輯數據模型是一組規范化的邏輯表結構,邏輯數據模型是根據業務規則確定的,關于業務對象、業務對象的數據項及業務對象之間關系的基本藍圖。
c.物理模型:是在邏輯數據模型的基礎上,考慮各種具體的技術實現因素,進行數據庫體系結構設計,真正實現數據在數據庫中的存放,例如:所選的數據倉庫是DWS。
- 維度建模
維度建模是從分析決策的需求出發構建模型,它主要是為分析需求服務,因此它重點關注用戶如何更快速地完成需求分析,同時具有較好的大規模復雜查詢的響應性能。
多維模型是由數字型度量值組成的一張事實表連接到一組包含描述屬性的多張維度表,事實表與維度表通過主/外鍵實現關聯。
典型的維度模型有星形模型,以及在一些特殊場景下使用的雪花模型。
在DataArts Studio數據架構中,維度建模是以維度建模理論為基礎,構建總線矩陣、抽象出事實和維度,構建維度模型和事實模型,同時對報表需求進行抽象整理出相關指標體系,構建出匯總模型。
規范化的數據如何使用?
規范化的數據可以作為BI的基本信息,也可以作為上層應用的源數據,也可以接入各類數據可視化報表等。
數據架構支持逆向數據庫嗎?
數據架構支持逆向數據庫。
目前數據架構支持基于數據倉庫服務(DWS)、MapReduce服務(MRS Hive)的數據庫逆向。
數據架構中的指標與數據質量的指標的區別?
數據架構中指標側重業務維度,用來衡量目標總體特征的統計數值;數據質量中指標側重監控維度,用來管理所有業務指標,包括指標的來源、定義等。
注意,數據質量模塊的指標與數據架構模塊的業務指標、技術指標當前是相互獨立的,不支持交互。
為什么數據架構更新表后無變化?
用戶在數據架構中更新了表,但實際上表數據并無變化,這是因為在更新前未對數據表更新方式做配置。配置數據表更新方式操作如下:
- 單擊“數據架構 > 配置中心”。
- 單擊“功能配置”頁簽。
- “數據表更新方式”選擇“重建數據表”。
- 單擊“確定”,完成配置。
表是否可配置生命周期管理?
目前暫不支持表生命周期管理的配置。