取消
顯示的結果
而不是尋找
你的意思是:

火花司機崩潰大型文本寫作

黃鸝
新的貢獻者三世

我使用一個大型文本變量,工作成單行JSON,火花可以美麗的過程。使用單個節點256 GB 32核心Standard_E32d_v4“集群”,這應該足夠內存數據集(沒見過集群內存使用超過130 GB)。但是我越來越崩潰”火花驅動程序意外停止並重新啟動……”There is no further info on the failure. This happens when writing an intermediate step to text file using:

str_variable dbutils.fs.put(“路徑/ filename.txt”,真的)

我試著寫/ tmp /以及Azure blob,相同的結果。

我開始向下一個gc調優路但還沒有算出了集群配置增加最大的堆大小,目前30 gb

任何有關這可能會導致什麼?不知道還能怎樣解決這個限製,因為我已經打破了管道分成intermediate-step-write,垃圾收集/重置內存狀態,繼續從中間,流

5回複5

pvignesh92
尊敬的貢獻者

@David宅地嗨,你能粘貼一個* * * * *的內容,你想以什麼格式存儲在一個變量中,你想要的輸出路徑。也許我可以重現這個,看看我可以看看一些作品給我嗎

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map