pyspark.RDD.cogroup¶
-
抽樣。
cogroup
( 其他:pyspark.rdd.RDD(元組(K,U]],numPartitions:可選(int]=沒有一個 )→pyspark.rdd.RDD(元組(K,元組(pyspark.resultiterable.ResultIterable(V] ,pyspark.resultiterable.ResultIterable(U] ] ] ] ¶ -
為每個關鍵k自我或其他,返回一個抽樣結果,其中包含的元組的值列表的關鍵自我以及其他。
例子
> > >x=sc。並行化(((“一個”,1),(“b”,4)))> > >y=sc。並行化(((“一個”,2)))> > >((x,元組(地圖(列表,y)))為x,y在排序(列表(x。cogroup(y)。收集())))[(“a”([1], [2])), (“b”, ([4], [])))