取消
顯示的結果
而不是尋找
你的意思是:

未能將火花。sql熊貓Dataframe使用.toPandas ()

小禮帽
價值貢獻

我寫了下麵的代碼:

data =火花。sql(“選擇A_adjClose、AA_adjClose AAL_adjClose, AAP_adjClose, AAPL_adjClose deltabase。a_30min_delta deltabase。aa_30min_delta deltabase。aal_30min_delta deltabase。aap_30min_delta deltabase。aapl_30min_delta”) spark.conf.set (“spark.sql.execution.arrow。啟用”、“真實”)#這部分保持運行命令data_pd = data.toPandas () df_pct = data_pd.pct_change (1)

困在.toPandas()的代碼這部分。

1接受解決方案

接受的解決方案

小禮帽
價值貢獻

我隻是發現了一個解決方案。

今天,我打開Azure磚。當我導入的python庫。磚告訴我,toPandas()棄用,我建議使用toPandas。

下麵的解決方案工作原理:使用toPandas而不是toPandas ()

data =火花。sql(“選擇A_adjClose、AA_adjClose AAL_adjClose, AAP_adjClose, AAPL_adjClose deltabase。a_30min_delta deltabase。aa_30min_delta deltabase。aal_30min_delta deltabase。aap_30min_delta deltabase。aapl_30min_delta”)顯示(數據)spark.conf.set (“spark.sql.execution.arrow。啟用”、“真實”)data_pd = data.toPandas

然而,當我試圖計算百分比變化使用pct_change(),它不工作。還沒有投入pyspark.pandas pct_change ()

#這失敗因為pct_change()函數尚未投入pyspark。熊貓df_pct = data_pd.pct_change (1)

另一個解決方案是使用:pandas_api ()轉換的火花dataframe pandas-spark dataframe。

這允許我使用pct_change()轉換後引發dataframe pandas-spark dataframe

data_pd.pct_change data_pd = data.pandas_api () ()

來源:https://stackoverflow.com/questions/73061556/does-pyspark-pandas-support-pandas-pct-change-function/..。

在原帖子查看解決方案

13日回複13

小禮帽
價值貢獻

順便說一句,這是Azure磚

Hubert_Dudek1
尊敬的貢獻者三世

與.to_pandas_on_spark試圖取代.to_pandas () ()。通過這種方式,您將確保dataframe處理分布在工人。

我試圖取代.to_pandas與.to_pandas_on_spark()(),但是有一個警告消息和一個錯誤信息:

/磚/火花/ python / pyspark / sql /dataframe.py:3407:FutureWarning: DataFrame。to_pandas_on_spark棄用。使用DataFrame。pandas_api代替。

warnings.warn (

SparkException:工作階段失敗而終止:任務0階段21.0失敗了4次,最近的失敗:在舞台上失去了任務0.3 21.0 (TID 24)(10.139.64.4執行人3):ExecutorLostFailure(執行人3退出正在運行的任務之一所致)原因:遺囑執行人心跳176959毫秒後超時

User16753725469
因素二世

嗨@Cheuk欣克利斯朵夫Poon你能請增加執行人是否對你有幫助

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map