pyspark.RDD.saveAsNewAPIHadoopDataset

抽樣。 saveAsNewAPIHadoopDataset ( 相依:Dict(str,str],keyConverter:可選(str]=沒有一個,valueConverter:可選(str]=沒有一個 )→沒有

輸出一個Python抽樣的鍵-值對的形式抽樣[(K,V)))任何Hadoop文件係統,使用新的Hadoop OutputFormat API (mapreduce包)。鍵/值轉換為輸出使用用戶指定的轉換器或,默認情況下,“org.apache.spark.api.python.JavaToWritableConverter”。

參數
相依 dict

Hadoop任務配置

keyConverter str,可選

完全限定類名關鍵的轉換器(默認情況下沒有一個)

valueConverter str,可選

默認值轉換器的完全限定類名(沒有)