03-31-201601:53點
我們如何比較兩個數據幀使用pyspark
我需要驗證輸出與另一個數據集
07-20-201608:21我
最近我也堅持這種情況。有人能幫助我如何比較列在這個場景中。@Siddartha Paturu請幫幫我這如果已經找到了解決方案。提前謝謝。
09-20-201603:29點
我堅持同樣的問題. .任何新的更新嗎?
有沒有解決這個問題? ?
09-24-2016與我
試著用
all.equal
它不dataframes但它檢查每個細胞
數據幀
相同的()
我想分享一個鏈接可以幫助解決你的問題https://goo.gl/pgLaEd
06-28-201806:53我
我認為在這種情況下最好的辦法是采取內連接(相當於路口)給那些列條件dataframes一定需要有相同的值。例如,
讓df1 df2是兩個dataframes。df1已列(A, B, C)和df2列(D、C、B),那麼您可以創建一個新的dataframe df1的交集,df2條件列B和C。
df3 = df1。加入(df2 [df1。B = = df2。B, df1。C = = df2。C], =“內在”)
df3隻包含那些行從df1和df2滿足上述條件。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。