07-27-202241我
我高壓複雜腳本消費超過100 gb的數據,有聚合,最後我隻是嚐試簡單的寫/顯示數據從數據幀。然後我的問題(斷言失敗:規格:無效的洗牌分區)。
請幫我在這裏,如果任何一個有主意。
07-28-202207:54我
由於杜德克,終於我發現有問題的查詢。你建議我一步一步調試和運行每一個每一個細胞。並添加(spark.conf.set (“spark.sql.shuffle.partitions”, 100年))細胞。它解決了
在原帖子查看解決方案
07-27-202203:42我
很難幫助在這種情況下沒有看到整個代碼。
07-27-202204:02我
添加”。py”文件在附件,請看看。
07-27-202206:10我
請使用
顯示器(df_FinalAction)
火花是懶惰的評估但“顯示”,所以你可以調試通過顯示每個月底dataframe每個細胞。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。