取消
顯示的結果
而不是尋找
你的意思是:

三角洲日誌創建檢查點沒有?

442027年
新的貢獻者二世

中提到的三角洲協議創建檢查點的三角洲表每10後提交,但是當我修改一個表> 10獨立操作(生產> 10 _delta_log目錄中的單獨的json文件),沒有創建檢查點文件。有特定的條件創建檢查點文件(而不是每10提交);即某些操作,數據大小等。

我擔心的是,如果檢查點沒有創建,然後三角洲日誌不清理,如果發生這是否意味著我的表的元數據隨著時間的推移會變得無限大?

三角洲表我創建了由執行(s3存儲位置的):

' ' '

df.write。 格式 ( “δ” ).saveAsTable (name = "表> < " 路徑= “< s3_path >” 模式= “覆蓋” overwriteSchema = 真正的 )

' ' '

1接受解決方案

接受的解決方案

Vinay_M_R
重視貢獻二世
重視貢獻二世

現在最新的更新檢查點δ為每100創建表提交。這樣做是為了一些改進的目的。

如果你想有一個檢查點文件為三角洲表每10後提交或任意提交。你可以定製它使用以下配置:

“delta.checkpointInterval”

語法:

alter table < table_name >設置TBLPROPERTIES(“三角洲。checkpointInterval”=“10”)

你可以設置所需的檢查點間隔,你需要改變的表和設置檢查點間隔設置表屬性下如上所示“delta.checkpointInterval”= "10"

在原帖子查看解決方案

2回答2

Vinay_M_R
重視貢獻二世
重視貢獻二世

現在最新的更新檢查點δ為每100創建表提交。這樣做是為了一些改進的目的。

如果你想有一個檢查點文件為三角洲表每10後提交或任意提交。你可以定製它使用以下配置:

“delta.checkpointInterval”

語法:

alter table < table_name >設置TBLPROPERTIES(“三角洲。checkpointInterval”=“10”)

你可以設置所需的檢查點間隔,你需要改變的表和設置檢查點間隔設置表屬性下如上所示“delta.checkpointInterval”= "10"

442027年
新的貢獻者二世

測試和確認,它是每隔100默認提交。謝謝,很有意義!

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map