09-23-202103:06點
你好,
我每天有一個火花工作讀和加入3 - 4源表寫的df鑲花的格式。這個數據幀由100 +列。這份工作的日常運行,我們重複數據刪除邏輯標識的最新記錄每個源表,連接它們,最後覆蓋現有的鑲花文件。
問題就來了,有辦法實現增量寫隻在新記錄或更改的文件的現有記錄中的值。
09-27-202104:09我
三角洲湖的合並功能是你正在尋找的。
https://docs.m.eheci.com/spark/latest/spark-sql/language-manual/delta-merge-into.html
https://docs.microsoft.com/en-us/azure/databricks/spark/latest/spark-sql/language-manual/delta-merge..。
在原帖子查看解決方案
09-23-202138點
你好@Nazar!我的名字叫Kaniz,我這裏的技術主持人。很高興認識你,謝謝你的問題!看看你的同行在社區有一個先回答你的問題。否則我將與我的團隊跟進,回到你soon.Thanks。
09-24-2021上午11:19
謝謝,欣賞快速反應。
09-24-202109:12點
你是最受歡迎的@Nazar Shaik。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。