你好,
我練習與磚。在樣本的筆記本,我看到不同的使用writeStream有或沒有“.start()方法。樣品如下:
沒有.start ()
火花。readStream .format .option (“cloudFiles (“cloudFiles”)。格式”,source_format) .option (“cloudFiles。schemaLocation”, checkpoint_directory) .load (data_source) .writeStream .option (“checkpointLocation”, checkpoint_directory) .option (“mergeSchema”、“true”) .table (table_name)
用.start ()
(myDF .writeStream .format .option(“δ”)(“checkpointLocation”, checkpointPath) .outputMode(“追加”).start(路徑))
用.start ()
查詢= (streaming_df。writeStream .foreachBatch (streaming_merge.upsert_to_delta) .outputMode .option(“更新”)(“checkpointLocation”, f“{DA.paths.checkpoints} /錄音”).trigger (availableNow = True) .start ()) query.awaitTermination ()
1)我不明白應該/不應該用“.start()方法。我很感激如果你能指導我。
2)如果我不通過“路徑”到“開始”(),數據文件會寫嗎?
謝謝你的幫助。