02-18-201501:26點
這完全取決於數據集規模和特定的用例,但是,總的來說,我們已經見過拚花大約1 gb是最佳的分區。然而,對於較小的數據集,這個大分區大小可能會限製個人並行分區並行任務操作,所以請記住這一點。
05-18-2015上午11:07
嗨,我是使用獸人的文件格式,而不是拚花,你會推薦類似的大小,或者更大?
05-20-201504:59我
你如何設置這個尺寸嗎?
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。