取消
顯示的結果
而不是尋找
你的意思是:

什麼覆蓋在編寫覆蓋三角洲湖表嗎?

rami-lv
新的貢獻者二世

我隻是試著寫一個三角洲湖表使用覆蓋模式,我發現曆史保留。我不清楚如何覆蓋數據,以及曆史可以保存多久。

正如他們所說,一個代碼比一千字:

mytable.write.mode .saveAsTable(“覆蓋”)(“軟件”)% sql SELECT id, display_name從應用程序id = 3;id名稱| 3 |舊# mytabl更新mytable.write.mode .saveAsTable(“覆蓋”)(“軟件”)% sql SELECT id, display_name從應用程序id = 3;id | 3 |新% sql SELECT id, display_name從應用程序版本為0的id = 3;id | 3 |舊名稱

同時,有許多的性能和成本含義是什麼版本的一個表嗎?

3回複3

Geeta1
價值貢獻

嗨@Rami ALZEBAK,您可以使用描述曆史table_name命令表的曆史。表所有更新你的版本和拚花的形式存儲文件。默認情況下,表曆史保留30天。據我所知,沒有成本含義與保護曆史有關。性能也是基於代碼的複雜性而不是與版本有關。希望它可以幫助!

LandanG
尊敬的貢獻者
尊敬的貢獻者

嗨@Rami ALZEBAK,

正如@Geeta提到的,您可以使用描述曆史命令查看的曆史表,但你也可以看看底層數據生成. json文件在提交更改數據時,這個文檔是很好的理解曆史和三角洲的版本控製表https://github.com/delta-io/delta/blob/master/PROTOCOL.md delta-table-specification

在性能和成本,維護許多版本的差值表可以影響性能和成本(盡管相當最小)這就是為什麼你可以使用真空命令刪除舊版本和降低成本和延遲。這個博客有利於進入更多的細節:https://mungingdata.com/delta-lake/vacuum-command/

ajaypanday6781
尊敬的貢獻者二世

嗨@Rami ALZEBAK覆蓋意味著首先,它將刪除數據,再將編寫整個數據。

如果你想看曆史使用可以使用描述曆史命令

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map