05-26-2022上午08:06
你好,
我處理更新主數據。我會做對三角洲湖UPCERT操作表。但是我的UPCERT完成後我喜歡在RDBMS表更新主數據。有磚的支持以高性能方式從情感上執行這個操作。有pyspark sql方法如下所示,但我不認為合並選項。
感謝任何幫助。
謝謝
克利須那神
05-30-202206:22我
有沒有人有任何解決方案。等待你的有價值的輸入
05-31-2022上午04:35
這取決於哪個數據庫,如果磚+數據庫供應商有一個優化的作家如果合並是在數據庫的支持。
我不知道一個允許一個merge語句優化的作家。
05-31-202204:40我
你好維爾納,
謝謝你的回應。但是磚API, delta.tables。Deltatable,支持直接操作與外部RDBMS表嗎?
我感到一些驚訝這是不可能的。與傳統pysql不是高性能情感方式。
05-31-202204:57我
我懷疑,因為三角洲湖是一種文件格式。一個優化文件格式但文件格式。
優化寫入一個RDBMS你還需要一個計算係統,打開一個連接和運行一個司機。這就是優化可能發生。
這個應該驅動程序可以利用三角洲湖優化。
但我懷疑,這是一個高優先級的磚。他們是促進lakehouse架構。
可能他們正在優化司機某些數據庫,但是發展中優化的司機對許多rdbms係統?對此表示懷疑。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。