最佳實踐管理三角洲湖表

學習的最佳實踐管理三角洲湖表。

寫的亞當Pavlacka

去年發表在:2022年5月10日

無論你如何刪除管理表,它可以花大量的時間,這取決於數據大小。三角洲湖管理表中特定的元數據包含許多事務日誌的形式,和它們可以包含重複數據文件。如果δ表已經使用了很長時間,它可以積累大量的數據。

在磚環境中,有兩種方法可以降低表(AWS|Azure|GCP):

  • 運行刪除表筆記本電池。
  • 點擊刪除在UI中。

即使你在後台可以刪除表而不影響工作負載,它總是好的,以確保你運行刪除從(AWS|Azure|GCP),真空(AWS|Azure|GCP)在你開始下降之前命令在任何表。這確保元數據和文件大小是清理之前啟動實際的數據刪除。

例如,如果你想刪除三角洲表事件在你開始之前,請運行以下命令刪除表命令:

  1. 刪除從運行:刪除事件
  2. 真空運行的時間間隔為零:真空事件保持0小時

這兩個步驟減少未提交文件的元數據和數量,否則增加的數據刪除。

這篇文章有用嗎?