取消
顯示的結果
而不是尋找
你的意思是:

火花司機內存不足的問題

chandan_a_v
價值貢獻

你好,

在磚我執行一個簡單的工作,我得到以下錯誤。我增加了司機的大小仍然麵臨著同樣的問題。

火花配置:

從pyspark。sql進口SparkSession

spark_session = SparkSession.builder。瀏覽器名稱(“需求預測”). config (“spark.yarn.executor。memoryOverhead ", 2048) .getOrCreate ()

司機和工人-r5.2xlarge節點類型

10個工作節點。

錯誤日誌:

引起的:org.apache.spark.sql.execution。OutOfMemorySparkException:播放表的大小遠遠超過預期,超過極限spark.driver.maxResultSize = 4294967296。

7回複7

werners1
尊敬的貢獻者三世

休伯特說過:你不應該創建一個火花會話在磚上,它提供了。

事實上你不手動廣播使我認為使用broadcastjoin火花。

有一個KB的問題:

https://kb.m.eheci.com/sql/bchashjoin-exceeds-bcjointhreshold-oom.html

你能檢查它是否適用嗎?

Kaniz
社區經理
社區經理

嗨@Chandan Angadi,隻是一個友好的後續。你還需要幫助,還是@Hubert杜德克(客戶)和@Werner Stinckens的反應幫助你找到解決方案了嗎?請讓我們知道。

嗨@Kaniz開羅,

切換運行時版本10.4固定這個問題對我來說。

謝謝,

的孩子叫

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map