pyspark.RDD.glom

抽樣。 ( )→pyspark.rdd.RDD(列表(T] ]

返回一個抽樣由合並每個分區內的所有元素列表。

例子

> > >抽樣=sc並行化([1,2,3,4),2)> > >排序(抽樣()收集())[[1、2],[3,4]]