工作失敗典型錯誤消息

工作運行壓製和失敗是由於觀察到典型的錯誤消息。

寫的亞當Pavlacka

去年發表在:2022年5月11日

問題

你的工作運行失敗的扼殺了由於觀察典型錯誤錯誤消息。

集群成為遙不可及的在運行原因:xxx-xxxxxx-xxxxxxx壓製是由於觀察典型錯誤

導致

返回的工作在這個集群太多大結果Apache火花司機節點。

結果,司機服務耗盡內存,和集群變得遙不可及的。

這可能發生在調用.collect,告訴API。

解決方案

你可以減少工作負載集群或增加的價值spark.memory.chauffeur.size

司機服務引發司機在同一主機上運行。當你司機服務分配更多的內存,那麼總體內存都可以引發司機。

設定的值spark.memory.chauffeur.size:

  1. 在您的工作區中打開集群配置頁麵。
  2. 點擊編輯
  3. 擴大高級選項
  4. 輸入的值spark.memory.chauffeur.size在mb火花配置字段。
  5. 點擊確認並重新啟動
刪除

信息

的默認值spark.memory.chauffeur.size是1024字節。這是寫成spark.memory.chauffeur.size1024mb在火花配置。最大值是16 GB的較小或司機節點的總內存的20%。


這篇文章有用嗎?