pyspark.sql.functions.split¶

pyspark.sql.functions。 分裂 ( str:ColumnOrName,模式:str,限製:int=- 1 )→pyspark.sql.column.Column¶

分裂str在給定模式的匹配。

參數

str 列或str

一個字符串表達式

模式 str

一個字符串代表一個正則表達式。正則表達式的字符串應該是一個Java正則表達式。

限製 int,可選

一個整數控製的次數模式應用。

限製>0:結果數組的長度不會超過限製,

結果數組的最後一個條目將包含所有輸入超出了最後的匹配模式。
限製< =0:模式將盡可能多地應用,以及由此產生的嗎

數組可以是任何大小。

分裂現在需要一個可選的限製字段。如果沒有提供,默認限製值是1。

例子

           > > >df=火花。createDataFrame(((“oneAtwoBthreeC”),(“年代”,)> > >df。選擇(分裂(df。年代,“(美國廣播公司)”,2)。別名(“年代”))。收集()行(s =['一',' twoBthreeC ']))> > >df。選擇(分裂(df。年代,“(美國廣播公司)”,- - - - - -1)。別名(“年代”))。收集()行(s =['一',' 2 ',' 3 ',"])
          

以前的

pyspark.sql.functions.soundex

下一個

pyspark.sql.functions.substring