你好,
我創建了一個三角洲表表使用SQL和指定分區和zorder策略。然後我首次加載數據到它通過寫δ的添加方式和另存為表。但是,我不知道來驗證其zordering三角洲表中,看不到任何顯著的曆史。有一個快速的命令,確認現有表zordered zordered是以及它如何?添加一些更多的信息:
我尋找的是知道任何版本的表的狀態。如果我把一些當前的信息表應該告訴我表分區和某某的zordered這樣和任何其他信息。這是我所做的:
如果不存在mydb創建表。mybronze(設備名稱字符串,tagName字符串,字符串的deviceID,成功布爾數據類型字符串,時間戳戳,值字符串,registerId字符串,字符串描述,INT, INT, INT)用δ分區(年、月、日)位置“abfss: / /(電子郵件保護)/ path1 / path2 /表”;ALTER TABLE mydb。mybronze TBLPROPERTIES (delta.autoOptimize。delta.autoOptimize optimizeWrite = true。autoCompact = true);優化mydb。tagName mybronze ZORDER由設備名稱;
然後我在Python中首次加載到表:
df.write.format(“δ”).mode(“追加”).saveAsTable (f“mydb.mybronze”)
所以我怎麼知道它成功zordered數據?或者我需要運行一個優化命令zordering後第一個加載?我沒有看到這條信息後曆史上最初的負載。
如果沒有數據行10和11不會有任何影響。我假設(1 - 5行)創建一個空表,但實際的負載發生當你df。寫操作。
也delta.autoOptimize。autoCompact不會觸發下麵的z值請醫生。
https://docs.m.eheci.com/delta/optimizations/auto-optimize.html does-auto-optimize-z-order-files