pyspark.pandas.Series.apply¶
-
係列。
應用
( 函數:可調用的,arg遊戲:序列(任何]=(),* *kwds:任何 )→pyspark.pandas.series.Series¶ -
調用函數的值。
隻能作用於一個Python函數。
請注意
這個API函數執行一次來推斷的類型可能是非常昂貴的,例如,當聚合或排序後創建的數據集。
為了避免這種情況,指定返回類型
函數
例如,如下:> > >def廣場(x)- >np。int32:…返回x* *2
pandas-on-Spark使用返回類型提示,不試圖推斷類型。
- 參數
-
- 函數 函數
-
Python函數應用。注意,類型提示返回類型是必需的。
- arg遊戲 元組
-
係列值後位置參數傳遞給函數。
- * * kwds
-
額外的關鍵字參數傳遞給函數。
- 返回
-
- 係列
另請參閱
-
Series.aggregate
-
隻有執行聚合類型操作。
-
Series.transform
-
隻有執行類型轉換操作。
-
DataFrame.apply
-
DataFrame的等效功能。
例子
創建一係列與典型的夏季氣溫為每個城市。
> > >年代=ps。係列([20.,21,12),…指數=(“倫敦”,“紐約”,“赫爾辛基”])> > >年代倫敦20紐約21赫爾辛基12dtype: int64
平方值通過定義一個函數,將它作為參數傳遞給
應用()
。> > >def廣場(x)- >np。int64:…返回x* *2> > >年代。應用(廣場)400年倫敦奧運會紐約441144年赫爾辛基dtype: int64
定義一個自定義函數,需要額外的位置參數,通過使用這些額外的參數
arg遊戲
關鍵字> > >defsubtract_custom_value(x,custom_value)- >np。int64:…返回x- - - - - -custom_value
> > >年代。應用(subtract_custom_value,arg遊戲=(5,))倫敦15紐約16赫爾辛基7dtype: int64
定義一個自定義函數,將關鍵字參數,通過這些參數
應用
> > >defadd_custom_values(x,* *kwargs)- >np。int64:…為月在kwargs:…x+ =kwargs(月]…返回x
> > >年代。應用(add_custom_values,6月=30.,7月=20.,8月=25)95年倫敦奧運會紐約9687年赫爾辛基dtype: int64
使用一個函數從Numpy庫
> > >defnumpy_log(上校)- >np。float64:…返回np。日誌(上校)> > >年代。應用(numpy_log)倫敦2.995732紐約3.044522赫爾辛基2.484907dtype: float64
你可以省略類型提示,讓pandas-on-Spark推斷它的類型。
> > >年代。應用(np。日誌)倫敦2.995732紐約3.044522赫爾辛基2.484907dtype: float64