解決:Re:獲取文件信息而使用“觸發工作……頁2 -磚- 5127

nikhil1991 · ‎04-27-2023

我目前想使用此功能的“觸發工作新文件到達時”我的一個項目。我有一個s3 bucket中,隨機文件到達天。所以我創建了一個工作,並設置觸發“文件到來”類型。在s3的筆記本我試圖讀取位置如下:

df = (spark.read.format (csv) .option (“inferSchema”,真的).option(“標題”,真的).option .load (“9”, ", ") (" s3: / < bucket_name > / <子文件夾> / "))

工作時觸發一個新文件的到來。但是當新文件到它讀取以前的文件。我隻是想讀取新文件,並將它附加到任何現有的表。

有什麼辦法文件名,這樣我可以使用下麵的代碼隻讀取新文件:

file_name = dbutils.widgets.get (“file_name”) df = (spark.read.format (csv) .option (“inferSchema”,真的).option(“標題”,真的).option .load (“9”, ", ") (" s3: / / < bucket_name > / < folder_name > / < file_1.csv >”))

或者有其他方法來解決它。嗎?

裏克 · 一個星期前

這個解決方案不回答這個問題……

似乎沒有額外的參數被傳遞到工作文件到達這裏描述(https://learn.microsoft.com/en-us/azure/databricks/workflows/jobs/file-arrival-triggers)。

在未來的任何計劃添加@Vidula_Khanna嗎?

磚

獲取文件信息在使用“觸發工作當得到新的文件”https://docs.m.eheci.com/workflows/jobs/file-arrival-triggers.html