__rake -磚

__rake · 06-30-2015

試試這個(1.4.0):val blockSize = 1024 * 1024 * 16 / / 16 mb sc.hadoopConfiguration。setInt (“dfs。sc.hadoopConfiguration blocksize”, blocksize)。setInt (“parquet.block。大小”,blockSize), sc是你SparkContext(不是SQLContext)。不是說……

__rake · 06-25-2015

我想我遇到類似的事情。沒有使用S3。但拚花表解讀DataFrames,戰術喜歡堅持,從鋪合並,重新分區後閱讀。使用HiveContext,如果這很重要。但我的印象那…

磚

用戶數據

用戶活動

Re:如何設置拚花輸出文件的大小?

再保險:我的火花SQL join速度非常緩慢——我能做些什麼來呢?