瀏覽
磚
幫助
登錄
開始使用磚
開始討論
開始資源
磚平台Beplay体育安卓版本
技術博客
磚平台的討論Beplay体育安卓版本
工程數據
機器學習
倉庫&分析
數據治理
管理和架構
學習
學習討論
培訓產品
認證
學習路徑
認證
組
地區和利益集團
美洲
亞太地區
利益集團
事件
社區灣
社區討論
社區新聞&成員認可
User16301467532
新的貢獻者二世
自
08-28-2021
06-26-2023
用戶數據
4
的帖子
0
解決方案
0
榮譽給
0
榮譽收到
磚
關於User16301467532
用戶活動
的帖子
回複
我怎麼能改變拚花從gzip壓縮算法到別的嗎?
07-15-2015
火花,默認情況下,使用gzip存儲鑲花的文件。我想換時髦或lz4從gzip壓縮算法。
再保險:Dataframe寫追加拚花表——分區問題
09-04-2015
這似乎是一個角落案件沒有人報道。如果你可以發送一個鏈接到你的筆記本和口頭授權我視圖/運行它,我可以看一看這個問題。
Re:拚花文件合並或其他優化技巧
07-24-2015
擁有一個大的#小文件或文件夾可以顯著惡化加載數據的性能。最好的方法是保持文件夾/文件合並,這樣每個文件大約是64 mb的大小。有不同的方法來實現這一目標:你的命令……
Re:我怎麼能改變拚花從gzip壓縮算法到別的嗎?
07-15-2015
你可以設置以下sql財產spark.sql.parquet.compression.codec火花。在sql: % sql設置spark.sql.parquet.compression.codec =時髦的你也可以直接設置在sqlContext: sqlContext.setConf (“spark.sql.parquet.compression.codec。”、“sn……
map