@vikram sinhha:這個答案有幫助嗎?
將“法律”格式的日期列在PySpark“dd-mm-yyyy”格式,你可以遵循以下步驟:
這裏有一個例子如何修改代碼來實現所需的輸出:
從pyspark.sql。進口concat函數,點燃,to_date date_format df2 = input_df。withColumn (“mon-yr-day concat(坳(“mon-yr”),點燃(" -01 ")))df2 = df2。withColumn(“日期”,to_date(坳(“mon-yr-day”)、“MMM-yyyy-dd”)) df2 = df2。withColumn (formatted_date date_format(坳(“日期”),“dd / MM / yyyy”)) df2.show ()
在上麵的代碼中,我們首先添加一天組件(“01”)法律價值觀使用concat()和點燃(“-01”)。然後,我們使用to_date()來解析“MMM-yyyy-dd”的修改日期格式。最後,我們使用date_format()來解析日期轉換成“dd / MM / yyyy”格式。這應該給你預期的輸出:
+ - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - + | mon-yr | |日期formatted_date | + - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - + jan - 2019 | 2019-01-01 | | 01/01/2019 | | 2月- 2020 | 2020-02-01 | 01/02/2020 | | mar - 2020 | 2020-03-01 | 01/03/2020 | + - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - +
@vikram sinhha:這個答案有幫助嗎?
將“法律”格式的日期列在PySpark“dd-mm-yyyy”格式,你可以遵循以下步驟:
這裏有一個例子如何修改代碼來實現所需的輸出:
從pyspark.sql。進口concat函數,點燃,to_date date_format df2 = input_df。withColumn (“mon-yr-day concat(坳(“mon-yr”),點燃(" -01 ")))df2 = df2。withColumn(“日期”,to_date(坳(“mon-yr-day”)、“MMM-yyyy-dd”)) df2 = df2。withColumn (formatted_date date_format(坳(“日期”),“dd / MM / yyyy”)) df2.show ()
在上麵的代碼中,我們首先添加一天組件(“01”)法律價值觀使用concat()和點燃(“-01”)。然後,我們使用to_date()來解析“MMM-yyyy-dd”的修改日期格式。最後,我們使用date_format()來解析日期轉換成“dd / MM / yyyy”格式。這應該給你預期的輸出:
+ - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - + | mon-yr | |日期formatted_date | + - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - + jan - 2019 | 2019-01-01 | | 01/01/2019 | | 2月- 2020 | 2020-02-01 | 01/02/2020 | | mar - 2020 | 2020-03-01 | 01/03/2020 | + - - - - - - - - - - - - - - - - - - - - - + - - - - - - - - - - - - - - - - +