你好,
我有幾個三角洲表在Azure adls gen 2存儲賬戶運行磚運行時的7.3。隻有δ表上寫/讀操作,沒有更新/刪除。
作為釋放管道的一部分,執行下麵的命令在一個新的筆記本在工作區中一個新的集群
火花。sql(設置spark.databricks.delta.properties.defaults.autoOptimize.optimizeWrite = true;)火花。sql(“設置spark.databricks.delta.properties.defaults.autoOptimize.autoCompact = true;”)
我的應用程序的工作都觸發不同的筆記本和不同的集群。
問題:
自動優化是充分的,除非你遇到性能問題。
然後我將觸發一個優化。這將生成的文件1 gb(大於標準尺寸的自動優化)。當然,在必要時z值。
運行優化的建議可能會提議應用z值,因為你在你的筆記本使用高度選擇性濾波器。
z值是一個非常有趣的優化技術,但應該檢查什麼是最好的排序。所以根據情況下這可能是有趣的。
自動最優化並不適用於z值。
https://docs.microsoft.com/en-us/azure/databricks/delta/optimizations/auto-optimize