pyspark.RDD.saveAsPickleFile¶
-
抽樣。
saveAsPickleFile
( 路徑:str,batchSize:int=10 )→沒有¶ -
保存這個抽樣的SequenceFile序列化的對象。使用的序列化器是
pyspark.serializers.CPickleSerializer
、默認批大小是10。例子
> > >從tempfile進口NamedTemporaryFile> > >臨時文件=NamedTemporaryFile(刪除=真正的)> > >臨時文件。關閉()> > >sc。並行化([1,2,“火花”,“抽樣”])。saveAsPickleFile(臨時文件。的名字,3)> > >排序(sc。pickleFile(臨時文件。的名字,5)。地圖(str)。收集())[' 1 ',' 2 ',“抽樣”,“火花”)