取消
顯示的結果
而不是尋找
你的意思是:

反複執行並返回空DF三角洲生活表

FD_MR
新的貢獻者二世

仍然相對較新的火花,更因此δ生活表道歉如果我錯過了一些基本的但這裏。

我們試圖通過三角洲住表運行一個筆記本,其中包含2的dlt裝飾的功能。表的裝飾和每個返回一個火花DataFrame是必需的。第一個裝飾函數將從外部數據庫,做一些處理函數,然後返回內下遊消費函數。然而,當我們開始DLT運行看看日誌,似乎筆記本4倍執行,並在最後3次火花DataFrame被下遊函數0行。

# DLT似乎執行這個至少4次,一個@dlt運行。表()def load_from_external (): input_df = spark.read(…) #包含500行#做一些轉換返回out_df # @dlt總是包含500行。表()def downstream_etl (): input_df = dlt.read (load_from_external) #包含500行第一次執行時,返回out_df 0 2 - 4 #做一些轉換

這是預期的行為嗎?如果是這樣,有什麼辦法可以禁用它,隻有筆記本執行一次?

提前謝謝你的幫助。

0回答0
歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map