取消
顯示的結果
而不是尋找
你的意思是:

刪除重複的表

ChristianHofste
新的貢獻者二世

你好,

有一個從δ函數來刪除數據表:

deltaTable = deltaTable。forPath(火花,“/數據/事件/”)deltaTable.delete(坳(“日期”)<“2017-01-01”)

但也有一種減少重複嗎?像deltaTable.dropDuplicates ()……

我不想讀dataframe整個表,把副本,並將它寫入存儲一次

1回複1

shyam_9
價值貢獻
價值貢獻

嗨@Christian Hofstetter,

你可以在這裏檢查對於相同的信息,

https://docs.delta.io/0.4.0/delta-update.html data-deduplication-when-writing-into-delta-tables
歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map