取消
顯示的結果
而不是尋找
你的意思是:

磚的問題:-斷言失敗:無效的洗牌分區規格:

KumarShiv
新的貢獻者三世

我高壓複雜腳本消費超過100 gb的數據,有聚合,最後我隻是嚐試簡單的寫/顯示數據從數據幀。然後我的問題(斷言失敗:規格:無效的洗牌分區)。

請幫我在這裏,如果任何一個有主意。

DB_Issue

1接受解決方案

接受的解決方案

KumarShiv
新的貢獻者三世

由於杜德克,終於我發現有問題的查詢。你建議我一步一步調試和運行每一個每一個細胞。並添加(spark.conf.set (“spark.sql.shuffle.partitions”, 100年))細胞。它解決了:grinning_face:

在原帖子查看解決方案

5回複5

Hubert_Dudek1
尊敬的貢獻者三世

很難幫助在這種情況下沒有看到整個代碼。

KumarShiv
新的貢獻者三世

添加”。py”文件在附件,請看看。

Hubert_Dudek1
尊敬的貢獻者三世

請使用

顯示器(df_FinalAction)

火花是懶惰的評估但“顯示”,所以你可以調試通過顯示每個月底dataframe每個細胞。

KumarShiv
新的貢獻者三世

由於杜德克,終於我發現有問題的查詢。你建議我一步一步調試和運行每一個每一個細胞。並添加(spark.conf.set (“spark.sql.shuffle.partitions”, 100年))細胞。它解決了:grinning_face:

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map