10-08-2021上午10:04
我有一個dataframe用下麵的列:
關鍵的元組(Key1 Key2),我已經和Y_N_Col行= " Y "和Y_N_Col =“N”。
我需要一個新的dataframe與所有行Y_N_Col = " Y "(不管關鍵元組),加上所有Y_N_Col =“N”沒有Y_N_Col = " Y "相同的元組的關鍵。
Scala dataframe已經計算在一個筆記本上。
提前謝謝,
蒂亞戈R。
10-20-202102:47點
是的——火花催化劑優化器是智能。兩個查詢計劃可能會有相同的計劃之後,優化器完成。你可以計劃使用:
dfNoDups.explain ()
10-21-202101:06我
謝謝你的回答,我不知道的解釋。
我做了一些測試和執行在相似的時期。
我最終使用沃納建議的解決方案,因為在未來會更容易理解和維護。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。