pyspark.pandas.Series.apply¶

係列。 應用 ( 函數:可調用的,arg遊戲:序列(任何]=(),* *kwds:任何 )→pyspark.pandas.series.Series¶

調用函數的值。

隻能作用於一個Python函數。

請注意

這個API函數執行一次來推斷的類型可能是非常昂貴的,例如,當聚合或排序後創建的數據集。

為了避免這種情況,指定返回類型函數例如,如下:

            > > >def廣場(x)- >np。int32:…返回x* *2
           

pandas-on-Spark使用返回類型提示,不試圖推斷類型。

參數

返回

另請參閱

例子

創建一係列與典型的夏季氣溫為每個城市。

           > > >年代=ps。係列([20.,21,12),…指數=(“倫敦”,“紐約”,“赫爾辛基”])> > >年代倫敦20紐約21赫爾辛基12dtype: int64
          

平方值通過定義一個函數,將它作為參數傳遞給應用()。

           > > >def廣場(x)- >np。int64:…返回x* *2> > >年代。應用(廣場)400年倫敦奧運會紐約441144年赫爾辛基dtype: int64
          

定義一個自定義函數,需要額外的位置參數,通過使用這些額外的參數arg遊戲關鍵字

           > > >defsubtract_custom_value(x,custom_value)- >np。int64:…返回x- - - - - -custom_value
          

           > > >年代。應用(subtract_custom_value,arg遊戲=(5,))倫敦15紐約16赫爾辛基7dtype: int64
          

定義一個自定義函數,將關鍵字參數,通過這些參數應用

           > > >defadd_custom_values(x,* *kwargs)- >np。int64:…為月在kwargs:…x+ =kwargs(月]…返回x
          

           > > >年代。應用(add_custom_values,6月=30.,7月=20.,8月=25)95年倫敦奧運會紐約9687年赫爾辛基dtype: int64
          

使用一個函數從Numpy庫

           > > >defnumpy_log(上校)- >np。float64:…返回np。日誌(上校)> > >年代。應用(numpy_log)倫敦2.995732紐約3.044522赫爾辛基2.484907dtype: float64
          

你可以省略類型提示,讓pandas-on-Spark推斷它的類型。

           > > >年代。應用(np。日誌)倫敦2.995732紐約3.044522赫爾辛基2.484907dtype: float64
          

以前的

pyspark.pandas.Series.dot

下一個

pyspark.pandas.Series.agg