取消
顯示的結果
而不是尋找
你的意思是:

什麼是最佳大小文件分區使用鑲花?

__Databricks_Su
貢獻者
3回複3

__Databricks_Su
貢獻者

這完全取決於數據集規模和特定的用例,但是,總的來說,我們已經見過拚花大約1 gb是最佳的分區。然而,對於較小的數據集,這個大分區大小可能會限製個人並行分區並行任務操作,所以請記住這一點。

msj50
新的貢獻者三世

嗨,我是使用獸人的文件格式,而不是拚花,你會推薦類似的大小,或者更大?

richard1_558848
新的貢獻者二世

你如何設置這個尺寸嗎?

Baidu
map