pyspark.RDDBarrier.mapPartitions

RDDBarrier。 mapPartitions ( f:可調用的((Iterable(T]],Iterable(U]],preservesPartitioning:bool= )→pyspark.rdd.RDD(U]

通過應用一個函數返回一個新的抽樣的每個分區包裝抽樣,在任務啟動在舞台上的障礙。接口是一樣的RDD.mapPartitions ()。請查看API文檔。

筆記

這個API是實驗