03-06-2023上午08:27
在三角洲格式與我有一個蜂巢表1 b行,當我檢查磚的數據瀏覽在SQL部分指出,表的大小是139.3直布羅陀401文件,但是當我檢查文件所在的S3 bucket (dbfs: / user /蜂巢/倉庫/ large_table)超過110 tb,包含超過100 k的文件。
有可能減少S3 bucket的大小而不會丟失任何數據表中?
03-06-202301:52點
當您運行更新,刪除等三角洲表,創建新文件。然而,舊的文件不會自動刪除。這是用來允許時間旅行在三角洲等功能表。
為了為δ表刪除舊文件,您可以使用真空命令。
https://docs.m.eheci.com/sql/language-manual/delta-vacuum.html
在原帖子查看解決方案
03-07-202311點
太好了,謝謝。它減少了桶的大小從110年結核病7結核病
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。