取消
顯示的結果
而不是尋找
你的意思是:

磚自動裝載機cloudFiles.backfillInterval

therealchainman
新的貢獻者二世

你好,

我一直在閱讀關於cloudFiles磚自動加載程序的文檔。backfillIntervalconfiguration, and have a question about a specific detail on how it works still. I was only able to find examples of it being set to 1 day or 1 week. So I'm assuming you can enter any time in there such as x hours, x days, x weeks, x months. My question is how does it uses that 1 week to backfill.

它看起來在lastModified時間抵達的文件嗎輸入目錄沒有被處理和計算currentTime lastModified < = backfillInterval。

還是每周運行一次回填,所以如果我上周跑磚自動裝卸機的管道,它會執行一個回填?在這種情況下,回填可能隻是通過輸入目錄中所有的文件和cloud_file_state確保所有被處理嗎?

我沒有得到一個好照片到底backfillInterval呢?但它似乎不錯,說它保證100%的文件要處理。

1接受解決方案

接受的解決方案

saipujari_spark
價值貢獻
價值貢獻

@therealchainman

最後一個回填(lastBackfillFinishTimeMs)將記錄作為檢查點- >抵消文件的一部分,這有助於自動裝卸機知道當最後回填觸發和觸發下一個周期回填。

希望這回答了你的問題。

謝謝,
Saikrishna Pujari
老引發技術解決方案工程師,磚

在原帖子查看解決方案

2回答2

Lakshay
尊敬的貢獻者三世
尊敬的貢獻者三世

@therealchainman

backFillInterval選項提供,以確保最終的所有文件都被插入。當你創建一個新的流,某些文件可能會錯過了不消化。回填是一個異步的過程,最終引發基於定義的間隔backFillInterval選項。這個檢查所有文件已經錯過了和消化掉這些文件

saipujari_spark
價值貢獻
價值貢獻

@therealchainman

最後一個回填(lastBackfillFinishTimeMs)將記錄作為檢查點- >抵消文件的一部分,這有助於自動裝卸機知道當最後回填觸發和觸發下一個周期回填。

希望這回答了你的問題。

謝謝,
Saikrishna Pujari
老引發技術解決方案工程師,磚
歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map