取消
顯示的結果
而不是尋找
你的意思是:

分裂日期為年、月、日,不一致的分隔符

PranjalThapar
新的因素

我試圖把我的日期列現在這是一個字符串類型為3列,月和日期。我使用(PySpark):

<代碼> split_date = pyspark.sql.functions。split (df(“日期”),“-”)df = df。withColumn(‘年’,split_date.getItem (0)) df = df。withColumn(‘月’,split_date.getItem (1) df = df。withColumn(‘天’,split_date.getItem (2) < br >

我遇到一個問題,因為我一半的日期由“-”,另一半由“/”。我怎麼能使用或操作將日期通過‘-’或‘/’根據用例。另外,當其由“/”分隔,格式是mm / dd / yyyy由“-”分隔,yyyy-mm-dd格式。

我想要日期列分為天、月、年。

4回複4

夏娃
新的貢獻者三世

試試這個:slightly_smiling_face:它適合我在字符串類型的日期列,持有這樣的內部:2016 - 05 - 02 - t18:28:15.790 + 0000

df = df1。選擇(“some_id”,年(df1["日期"]).alias(“年”),月(df1["日期"]).alias(月),dayofmonth (df1["日期"]).alias(“天”)小時(df1["日期"]).alias(小時)),告訴()

夏娃
新的貢獻者三世

在SCALA中,假設df1有“日期”列:

進口org.apache.spark.sql.functions。_進口org.apache.spark.sql.types。_進口org.apache.spark.sql._

val df2 = df1。withColumn(“年”,一年(col(“日期”))).withColumn(“月”,月(col(“日期”))).withColumn(“天”,dayofmonth (col(“日期”))).withColumn(“小時”,小時(col(“日期”)))

df2.show (Int.MaxValue)

youssefassouli
新的貢獻者二世

非常感謝halpful

夏娃
新的貢獻者三世

你能將其標記為一個答案,如果是有用嗎?:slightly_smiling_face:

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map