取消
顯示的結果
而不是尋找
你的意思是:

什麼是最好的方法來優化曆史數據表數據磚嗎?

Ruby8376
貢獻者

你好,

尋找建議如何優化曆史數據表數據磚嗎?

1回複1

Kaniz
社區經理
社區經理

@Ruby8376,

——用表曆史和時間旅行:

•每個操作創建一個新表的版本
•可用於審計、回滾和查詢在一個特定的時間點
•不推薦長期備份
•使用過去的七天時間旅行,除非保留配置設置為更大的值
•代碼:

deltaTable.history(),告訴()

分區表:


•有利於大型表(> 1 TB)
•所有的分區都應該至少有一個字節的數據
•更少,更大的分區執行比許多較小的分區
•不分區表不到1 tb的數據- - - - - -

定期運行真空:
•減少多餘的雲數據存儲成本
•默認保留閾值是7天
•代碼:

deltaTable.vacuum ()

使用優化命令:
•增強壓縮小數據文件查詢性能
•推薦日常運行和調整頻率權衡成本和性能
•代碼:

deltaTable.optimize ()

使用集群:
•調度優化每一個或兩個小時的工作和許多更新或插入表

來源:
(文檔:曆史)(https://docs.m.eheci.com/delta/history.html)
(文檔:分區)(https://docs.m.eheci.com/tables/partitions.html)
(文檔:真空)(https://docs.m.eheci.com/delta/vacuum.html)
(文檔:優化)(https://docs.m.eheci.com/delta/optimize.html)
- - - - - -[文檔聚類):https://docs.m.eheci.com/delta/clustering.html)

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map