你好@Venkatesh Kottapalli
真空從表中刪除所有文件目錄,並不是由三角洲,以及數據文件,不再在最新狀態的事務日誌表,保留閾值以上。
真空將跳過所有的目錄開始一個下劃線(_),其中包括_delta_log。
真空。默認間隔1周。當你刪除三角洲表或刪除數據文件,它們從底層_delta_log刪除(就像一個蜂巢metastore),而不是從實際文件係統。他們從文件係統中刪除隻運行真空命令時,或者當停留時間到期。這個屬性決定了數據文件保留多久後會被刪除掉。
%的sql
改變表的表名
設置TBLPROPERTIES (' delta.deletedFileRetentionDuration =“7天”,)
您可以刪除文件不再引用的三角洲表和保留閾值以上的運行真空命令放在桌子上。
裁判:
https://docs.m.eheci.com/delta/vacuum.html
https://docs.m.eheci.com/sql/language-manual/delta-vacuum.html