什么是數據血緣

大數據時代，數據爆發性增長，海量的、各種類型的數據在快速產生。這些龐大復雜的數據信息，通過聯姻融合、轉換變換、流轉流通，又生成新的數據，匯聚成數據的海洋。

數據的產生、加工融合、流轉流通，到最終消亡，數據之間自然會形成一種關系。我們借鑒人類社會中類似的一種關系來表達數據之間的這種關系，稱之為數據的血緣關系。與人類社會中的血緣關系不同，數據的血緣關系還包含了一些特有的特征：

詳見下圖：數據血緣關系示例

圖3-606 數據血緣關系示例.png

DataArts Studio數據血緣實現方案

在DataArtsStudio平臺，自動分析血緣是通過在數據開發模塊中配置數據處理遷移類型的節點產生的，當前支持采集節點靜態配置產生的血緣和部分節點實例上的血緣。詳情請參見配置數據血緣章節中的自動分析血緣。

另外，DataArtsStudio平臺還支持手動配置血緣方式，當用戶手動配置血緣時，自動分析血緣將不生效。詳情請參見配置數據血緣章節中的手動配置血緣。

當數據開發模塊中的作業已完成血緣關系配置后，啟動作業調度，并在數據目錄模塊進行元數據采集任務，則可以在數據目錄模塊可視化查看數據血緣關系。