取消
顯示的結果
而不是尋找
你的意思是:

小/大文件的問題,你怎麼解決它?

William_Scardua
貢獻者三世

如何解決小/大文件問題?你什麼建議?

1接受解決方案

接受的解決方案

jose_gonzalez
主持人
主持人

嗨@William Scardua,

我將推薦使用δ來避免小/大文件的問題。例如,汽車自動優化是一個可選的特性,緊湊的小文件在個人寫一個三角洲表。支付一個小成本在寫積極為表查詢提供了顯著的好處。更多細節,請檢查下麵的例子鏈接

自動優化將創造128 MB的文件。如果你想進一步壓縮和優化,然後我將推薦使用“優化”命令在三角洲表。它將壓縮和創建文件的1 GB大小,默認情況下。為更多的細節在這個優化功能,請檢查以下鏈接

謝謝你!

在原帖子查看解決方案

5回複5

Kaniz
社區經理
社區經理

你好@威廉Scardua!我的名字叫Kaniz,我這裏的技術主持人。很高興認識你,謝謝你的問題!看看你的同行在社區中有一個回答你的問題。否則我將盡快給你回電。謝謝。

jose_gonzalez
主持人
主持人

嗨@William Scardua,

我將推薦使用δ來避免小/大文件的問題。例如,汽車自動優化是一個可選的特性,緊湊的小文件在個人寫一個三角洲表。支付一個小成本在寫積極為表查詢提供了顯著的好處。更多細節,請檢查下麵的例子鏈接

自動優化將創造128 MB的文件。如果你想進一步壓縮和優化,然後我將推薦使用“優化”命令在三角洲表。它將壓縮和創建文件的1 GB大小,默認情況下。為更多的細節在這個優化功能,請檢查以下鏈接

謝謝你!

好的@Jose岡薩雷斯,我明白. .謝謝你的人

werners1
尊敬的貢獻者三世

何塞說了什麼。

如果你不能使用三角洲或不想:

使用合並和重新分配/分區的方式定義文件的大小。

沒有一個理想的文件大小。這一切都取決於可用的用例中,集群大小,數據流下遊等。

什麼是你想要避免大量小文件(認為隻有幾兆字節或字節)。

但並沒有錯2 MB的文件。

那就是說:三角洲湖讓這個練習的方式更容易。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map