pyspark.RDD.subtractByKey¶
-
抽樣。
subtractByKey
( 其他:pyspark.rdd.RDD(元組(K,任何]],numPartitions:可選(int]=沒有一個 )→pyspark.rdd.RDD(元組(K,V] ] ¶ -
返回每個(關鍵字,值)對自我沒有一對匹配的關鍵其他。
例子
> > >x=sc。並行化(((“一個”,1),(“b”,4),(“b”,5),(“一個”,2)))> > >y=sc。並行化(((“一個”,3),(“c”,沒有一個)))> > >排序(x。subtractByKey(y)。收集())((" b ", 4), (' b ', 5)]