瀏覽
磚
幫助
登錄
開始使用磚
開始討論
開始資源
磚平台Beplay体育安卓版本
技術博客
磚平台的討論Beplay体育安卓版本
工程數據
機器學習
倉庫&分析
數據治理
管理和架構
學習
學習討論
培訓產品
認證
學習路徑
認證
組
地區和利益集團
美洲
亞太地區
利益集團
事件
社區灣
社區討論
社區新聞&成員認可
__rake
新的貢獻者二世
自
08-27-2021
06-26-2023
用戶數據
2
的帖子
0
解決方案
0
榮譽給
0
榮譽收到
磚
關於__rake
用戶活動
的帖子
回複
沒有顯示的文章。
Re:如何設置拚花輸出文件的大小?
06-30-2015
試試這個(1.4.0):val blockSize = 1024 * 1024 * 16 / / 16 mb sc.hadoopConfiguration。setInt (“dfs。sc.hadoopConfiguration blocksize”, blocksize)。setInt (“parquet.block。大小”,blockSize), sc是你SparkContext(不是SQLContext)。不是說……
再保險:我的火花SQL join速度非常緩慢——我能做些什麼來呢?
06-25-2015
我想我遇到類似的事情。沒有使用S3。但拚花表解讀DataFrames,戰術喜歡堅持,從鋪合並,重新分區後閱讀。使用HiveContext,如果這很重要。但我的印象那…
map