SparkContext。
並行化
分配一個本地Python集合形成一個抽樣。使用範圍建議如果輸入代表一個範圍的性能。
例子
> > >sc。並行化([0,2,3,4,6),5)。偷()。收集()[[0],[2],[3],[4],[6]]> > >sc。並行化(範圍(0,6,2),5)。偷()。收集()[[],[0],[],[2],[4]]
以前的
pyspark.SparkContext.newAPIHadoopRDD
下一個
pyspark.SparkContext.pickleFile