取消
顯示的結果
而不是尋找
你的意思是:

我怎麼得到清理的文件的大小三角洲的真空表。

User16826987838
貢獻者
2回答2

Ryan_Chynoweth
尊敬的貢獻者三世

優化命令生成的輸出以下指標:

  • 文件數量增加了
  • 數量的文件刪除
  • 最小、最大、avg、總文件和文件的總大小
  • 最小、最大、avg、總文件和總大小的文件刪除
  • 分區數量優化
  • z順序統計數據
  • 的批次數量
  • 總文件被認為是
  • 總文件跳過

如果這些信息沒有提供所需的細節你需要掃描文件係統之前和之後運行命令來收集和分析你的數據。

sajith_appukutt
尊敬的貢獻者二世
def getVaccumSize(表:字符串):長= {val listFiles =火花。sql (s“真空表幹運行”美元).select(“路徑”).collect () . map (_ (0))。toList var = 0 l listFiles求和。foreach (x = >和+ = dbutils.fs.ls (x.toString) (0) .size)總和}getVaccumSize (“< your-table-name >”)

你可以使用這個函數來獲取文件大小的清理

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map