取消
顯示的結果
而不是尋找
你的意思是:

如何減少大小的蜂巢S3 bucket是表

dotan
新的貢獻者二世

在三角洲格式與我有一個蜂巢表1 b行,當我檢查磚的數據瀏覽在SQL部分指出,表的大小是139.3直布羅陀401文件,但是當我檢查文件所在的S3 bucket (dbfs: / user /蜂巢/倉庫/ large_table)超過110 tb,包含超過100 k的文件。

有可能減少S3 bucket的大小而不會丟失任何數據表中?

1接受解決方案

接受的解決方案

apingle
貢獻者

當您運行更新,刪除等三角洲表,創建新文件。然而,舊的文件不會自動刪除。這是用來允許時間旅行在三角洲等功能表。

為了為δ表刪除舊文件,您可以使用真空命令。

https://docs.m.eheci.com/sql/language-manual/delta-vacuum.html

在原帖子查看解決方案

2回答2

apingle
貢獻者

當您運行更新,刪除等三角洲表,創建新文件。然而,舊的文件不會自動刪除。這是用來允許時間旅行在三角洲等功能表。

為了為δ表刪除舊文件,您可以使用真空命令。

https://docs.m.eheci.com/sql/language-manual/delta-vacuum.html

dotan
新的貢獻者二世

太好了,謝謝。它減少了桶的大小從110年結核病7結核病

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map