取消
顯示的結果
而不是尋找
你的意思是:

Pyspark insertinto蜂巢外部表不工作如果覆蓋是正確的

匿名
不適用

得到一個蜂巢例外

2回答2

pvignesh92
尊敬的貢獻者

你能分享您使用的命令,除了截圖嗎?

匿名
不適用

@ppatel:

如果您使用的是與覆蓋= True insertInto PySpark蜂巢外部表,它可能不會像預期的那樣工作。這是因為外部表上的蜂巢由蜂巢和表數據存儲在外部。當你使用覆蓋= True,它試圖覆蓋表數據,這是不可能的蜂巢外的數據存儲。相反,你可以試著用insertInto覆蓋= False。這將數據附加到現有的外部表中的數據。如果你想完全取代外部表中的數據,你可以試著刪除數據從外部位置,然後使用

insertInto加載新數據覆蓋= False。

或者,您可以創建一個管理表與覆蓋= True蜂巢和使用insertInto覆蓋表中的數據。然而,這將在HDFS中創建一個新目錄,將數據複製到該目錄,這可能不是理想的如果您有大量的數據。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map