pyspark.sql.functions.split¶
-
pyspark.sql.functions。
分裂
( str:ColumnOrName,模式:str,限製:int=- 1 )→pyspark.sql.column.Column¶ -
分裂str在給定模式的匹配。
- 參數
-
-
str
列
或str -
一個字符串表達式
- 模式 str
-
一個字符串代表一個正則表達式。正則表達式的字符串應該是一個Java正則表達式。
- 限製 int,可選
-
一個整數控製的次數模式應用。
-
-
限製>0
:結果數組的長度不會超過限製, -
結果數組的最後一個條目將包含所有輸入超出了最後的匹配模式。
-
-
-
限製< =0
:模式將盡可能多地應用,以及由此產生的嗎 -
數組可以是任何大小。
分裂現在需要一個可選的限製字段。如果沒有提供,默認限製值是1。
-
-
-
str
例子
> > >df=火花。createDataFrame(((“oneAtwoBthreeC”),(“年代”,)> > >df。選擇(分裂(df。年代,“(美國廣播公司)”,2)。別名(“年代”))。收集()行(s =['一',' twoBthreeC ']))> > >df。選擇(分裂(df。年代,“(美國廣播公司)”,- - - - - -1)。別名(“年代”))。收集()行(s =['一',' 2 ',' 3 ',"])