取消
顯示的結果
而不是尋找
你的意思是:

三角洲添加一個新的分區使舊分區不可讀

User16826994223
尊敬的貢獻者三世

在筆記本,我的代碼讀取和寫入數據到三角洲,δ是由calendar_date分區。初始加載後我能讀delta文件和數據很好。但在第二次加載數據為6個月,前麵partitons不加載通常使用三角洲格式。這樣的閱讀我的源三角洲文件扔我錯誤說文件不存在。

spark.read.format(“δ”)。負載(“/ mnt / kgaurav /表/ calendar_date = 2018-10-04 /”)

然而閱讀下麵就沒問題任何知道可能是錯的

spark.conf.set spark.read.format (“spark.databricks.delta.formatCheck.enabled”,“假”)(“鋪”).load (“/ mnt / kgaurav /表/ calendar_date = 2018 -

1接受解決方案

接受的解決方案

User16826994223
尊敬的貢獻者三世

我認為你寫的數據覆蓋模式。在三角洲甚至幾天不刪除數據覆蓋模式寫的版本,你隻可以查詢最新的數據,

但在格式拚花如果你閱讀使用刪除文件還這就是為什麼你可以得到這些數據。

v =火花。sql (f”描述曆史三角洲。“{path}”限製2”)version = v.take (2) [1] [0] df = spark.read.format(“δ”)。選項(“versionAsOf”版本).load(路徑))

在原帖子查看解決方案

1回複1

User16826994223
尊敬的貢獻者三世

我認為你寫的數據覆蓋模式。在三角洲甚至幾天不刪除數據覆蓋模式寫的版本,你隻可以查詢最新的數據,

但在格式拚花如果你閱讀使用刪除文件還這就是為什麼你可以得到這些數據。

v =火花。sql (f”描述曆史三角洲。“{path}”限製2”)version = v.take (2) [1] [0] df = spark.read.format(“δ”)。選項(“versionAsOf”版本).load(路徑))

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map