使用統一的目錄作為統一metastore磚我們能夠跟蹤表的數據沿襲。
血統是保持30天-這是官方文檔中描述:
- - - - - -因為血統是計算一個30天的滾動窗口,血統不顯示表,在過去30天內沒有被修改。
如果一個表沒有更新30天,這意味著數據沿襲針對特定表將不再可見。家族將會再次出現,一旦表更新。
我試圖找到可能避免這種限製的用例需要更長時間保留(如季度或年度報告)。
我已經嚐試了什麼:
我如何改變“更新”加州大學在優化操作,得到以下結果:
——操作表中創建一個新版本的表的曆史
——然而“更新”的“詳細信息”選項卡統一目錄不會改變
我認為這是有關:優化和類似的操作改變文件而不是數據的結構。
這些特定情況的最佳解決方案是使用API來收集數據和可視化的統一目錄。然而,統一目錄不允許手動插入血統統一目錄。