取消
顯示的結果
而不是尋找
你的意思是:

如何結合多個dataframe pyspark磚內筆記本嗎

RaymondXie
新的因素

我有4個DFs: Avg_開放By_Year, AvgBy_Year, AvgBy_Year和Avg關閉_By_Year,他們都有一個共同的列的一年”。

我想加入這三個在一起最後df:

開放,高,低,關閉的

目前我必須用醜陋的方式加入他們在列“年”:
finalDF = Avg_Open_By_Year . join (Avg_High_By_Year =(“年”),如何= ' left_outer ') . join (Avg_Low_By_Year, =(“年”),如何= ' left_outer ') . join (Avg_Close_By_Year, =(“年”),如何=“left_outer”)

我認為應該有一個優雅的方式做到這一點,像UnionAll SQL。

這裏有一個可能的解決方案https://datascience.stackexchange.com/questions/11356/merging-multiple-data-frames-row-wise-in-pyspa..。下麵描述,所選擇的答案是:從functools進口減少對Python 3 #。從pyspark x。sql進口DataFrame

def unionAll (dfs):返回減少(DataFrame。unionAll dfs)

unionAll (td2、td3 td4、td5 td6, td7, td8, td9, td10)

然而,我在磚筆記本,我拋出錯誤:

NameError:名字“functools”沒有定義

0693年f000007ooi6aak

它會很感激如果有人可以擺脫我更多的光。非常感謝。

1回複1

thiago_matos
新的貢獻者二世

以這種方式導入reduce函數:

從functools進口減少

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map