取消
顯示的結果
而不是尋找
你的意思是:

函數在JVM並不存在錯誤

Orianh
重視貢獻二世

你好,

我建立一個python包,返回1行從一次DF內部數據磚塊環境。

改善這個包我使用多處理庫的性能在python中,

我有後台進程,他的整個目的是準備的數據塊(過濾大火花df和轉換為熊貓或列表使用收集),推動他們多進程隊列的主要過程。

在我使用pypsark.sql子流程。功能模塊來過濾、指數和洗牌大火花df,轉換為大熊貓並把它發送到隊列中。

當我寫的所有對象在一個筆記本,運行所有單元測試和我對象去好每件事。

在下載一個輪子文件和包我創建了pip和從車輪跑一個函數文件,用我的包拋出錯誤,我不能理解為什麼。

從我的角度來看,由於某種原因子流程運行的環境,不知道pyspark.sql.functions。

附加錯誤我從集群stderr日誌:

在JVM誤差函數不存在。

希望你們知道如何克服這個錯誤。

這將幫助很多。

謝謝。

* *如果缺少任何信息請讓我知道,我會編輯問題* *

  • 更多的嚐試和測試後,我跑我的對象雖然從種子下載包,但是當我發送我的對象子過程不能找到pyspark.sql.functions keras配合方法
4回複4

Orianh
重視貢獻二世

仍然沒有管理,如果有人知道如何修複它將非常有用。

Vickyster
新的貢獻者二世

嗨@Orianh,你設法解決它嗎?我麵臨著同樣的問題。

Orianh
重視貢獻二世

嘿@Vigneshwaran拉馬納坦,不。

經過一些努力和性能問題我隻是放棄了這種方法:grinning_face_with_sweat:

我不知道磚運行一個筆記本電池,我認為使用火花,火花以來多處理導致這個錯誤使用java

dineshreddy
新的貢獻者二世

使用線程,而不是流程為我解決了這個問題

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map