pyspark.RDD.fold¶
-
抽樣。
褶皺
( zeroValue:T,人事處:可調用的((T,T],T] )→T¶ -
聚合每個分區的元素,然後所有的分區結果,使用給定的關聯函數和一個中立的“零價值。”
這個函數
op (t1,t2)
允許修改t1
並返回它的結果值,以避免對象分配;然而,它不應該修改t2
。這行為有點不同折疊操作實現運作在函數語言像Scala集合。這種折疊操作可能適用於單獨分區,然後折疊這些結果為最終結果,而不是對每個元素應用折疊在一些定義的排序順序。函數不交換,結果可能不同於褶皺應用於運作的集合。
例子
> > >從操作符進口添加> > >sc。並行化([1,2,3,4,5])。褶皺(0,添加)15