取消
顯示的結果
而不是尋找
你的意思是:

日期字段當讀取excel文件dataframe得到改變

sreedata
新的貢獻者三世

日期字段同時發生變化的情況下,讀取數據從源dataframe xls文件。xl源文件中的所有列都是字符串,但我不知道為什麼日期列單獨表現不同

在源文件日期是1/24/2022。

在dataframe 1/24/22

代碼使用:

從pyspark.sql。功能導入*

進口pyspark.sql。作為科幻小說

進口pyspark.sql.types

熊貓作為pd導入

進口操作係統

進口一滴

文件名=水珠。一團(PathSource +“/ * xls”)

dfs = []

df的dfs:

xl_file = pd.ExcelFile(文件名)

df = xl_file.parse (“Sheet1”)

dfs。concat (df ignore_index = True)

顯示器(df)

提前感謝任何幫助或指導。

5回複5

Pradeep_Namani
新的貢獻者三世

嗨,團隊,@Merca Ovnerud

我也麵臨同樣的問題,下麵是我用的代碼片段

df = spark.read.format (com.crealytics.spark.excel) .option .load(“標題”、“true”) (“/ mnt / dBeplay体育安卓版本ataplatform / Tenant_PK / Results.xlsx”)

我有幾個日期列,都是顯示dd / mm / yy格式,但它必須是dd / mm / yyyy格式

源文件有:26-03-1950

Dataframe有:26-03-50

我已經使用parse_dates = False但它不是工作,任何一個能幫助

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map