取消
顯示的結果
而不是尋找
你的意思是:

比較兩個dataframes

SiddarthaPaturu
新的貢獻者二世

我們如何比較兩個數據幀使用pyspark

我需要驗證輸出與另一個數據集

8回答說8

jagannathsahoo
新的貢獻者二世

最近我也堅持這種情況。有人能幫助我如何比較列在這個場景中。@Siddartha Paturu請幫幫我這如果已經找到了解決方案。提前謝謝。

ShashishekharDe
新的貢獻者二世

我堅持同樣的問題. .任何新的更新嗎?

,

有沒有解決這個問題? ?

amandaphy
新的貢獻者二世

試著用

all.equal
函數。

它不dataframes但它檢查每個細胞

數據幀
對相同的細胞在另一個。您還可以使用
相同的()
函數。

我想分享一個鏈接可以幫助解決你的問題https://goo.gl/pgLaEd

sbharti
新的貢獻者二世

我認為在這種情況下最好的辦法是采取內連接(相當於路口)給那些列條件dataframes一定需要有相同的值。例如,

讓df1 df2是兩個dataframes。df1已列(A, B, C)和df2列(D、C、B),那麼您可以創建一個新的dataframe df1的交集,df2條件列B和C。

df3 = df1。加入(df2 [df1。B = = df2。B, df1。C = = df2。C], =“內在”)

df3隻包含那些行從df1和df2滿足上述條件。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map