解決:Re:失敗將火花。sql熊貓Datafram……-磚- 15089

小禮帽 · ‎07-02-2022

我寫了下麵的代碼:

data =火花。sql(“選擇A_adjClose、AA_adjClose AAL_adjClose, AAP_adjClose, AAPL_adjClose deltabase。a_30min_delta deltabase。aa_30min_delta deltabase。aal_30min_delta deltabase。aap_30min_delta deltabase。aapl_30min_delta”) spark.conf.set (“spark.sql.execution.arrow。啟用”、“真實”)#這部分保持運行命令data_pd = data.toPandas () df_pct = data_pd.pct_change (1)

困在.toPandas()的代碼這部分。

小禮帽 · ‎07-18-2022

我隻是發現了一個解決方案。

今天,我打開Azure磚。當我導入的python庫。磚告訴我,toPandas()棄用,我建議使用toPandas。

下麵的解決方案工作原理:使用toPandas而不是toPandas ()

data =火花。sql(“選擇A_adjClose、AA_adjClose AAL_adjClose, AAP_adjClose, AAPL_adjClose deltabase。a_30min_delta deltabase。aa_30min_delta deltabase。aal_30min_delta deltabase。aap_30min_delta deltabase。aapl_30min_delta”)顯示(數據)spark.conf.set (“spark.sql.execution.arrow。啟用”、“真實”)data_pd = data.toPandas

然而,當我試圖計算百分比變化使用pct_change(),它不工作。還沒有投入pyspark.pandas pct_change ()

#這失敗因為pct_change()函數尚未投入pyspark。熊貓df_pct = data_pd.pct_change (1)

另一個解決方案是使用:pandas_api ()轉換的火花dataframe pandas-spark dataframe。

這允許我使用pct_change()轉換後引發dataframe pandas-spark dataframe

data_pd.pct_change data_pd = data.pandas_api () ()

來源:https://stackoverflow.com/questions/73061556/does-pyspark-pandas-support-pandas-pct-change-function/..。

在原帖子查看解決方案

小禮帽 · ‎07-02-2022

順便說一句,這是Azure磚

Hubert_Dudek1 · ‎07-03-2022

與.to_pandas_on_spark試圖取代.to_pandas () ()。通過這種方式,您將確保dataframe處理分布在工人。

小禮帽 · ‎07-04-2022

我試圖取代.to_pandas與.to_pandas_on_spark()(),但是有一個警告消息和一個錯誤信息:

/磚/火花/ python / pyspark / sql /dataframe.py:3407:FutureWarning: DataFrame。to_pandas_on_spark棄用。使用DataFrame。pandas_api代替。

warnings.warn (

SparkException:工作階段失敗而終止:任務0階段21.0失敗了4次,最近的失敗:在舞台上失去了任務0.3 21.0 (TID 24)(10.139.64.4執行人3):ExecutorLostFailure(執行人3退出正在運行的任務之一所致)原因:遺囑執行人心跳176959毫秒後超時

User16753725469 · ‎07-07-2022

嗨@Cheuk欣克利斯朵夫Poon你能請增加執行人是否對你有幫助

磚

未能將火花。sql熊貓Dataframe使用.toPandas ()