@yuvesh kotiala:
錯誤消息顯示,您需要使用格式(“δ”)而不是格式(csv)在閱讀和寫作差值表。在你的代碼中,你要編寫一個三角洲文件作為一個CSV文件,這是導致錯誤。如果你想寫數據到一個CSV文件,你可以先閱讀Delta文件作為dataframe然後把它寫成一個CSV文件。這裏有一個例子:
從pyspark。sql導入SparkSession #創建SparkSession火花= SparkSession.builder.appName (DeltaToCSV) .getOrCreate() #讀Delta文件作為dataframe delta_df = spark.read.format .load(“δ”)(“s3: / /道路/ abc /”) #寫dataframe delta_df.write.format作為一個CSV文件(CSV) .mode(“覆蓋”).options(分隔符=“|”).save (destinationBucketPath)
請注意,當你讀Delta文件,您需要使用格式(“δ”)和負載csv()()而不是在你的原始代碼。這將Delta文件讀取dataframe,然後可以寫成一個CSV文件使用格式(CSV)並保存()。