你好,
我遇到了這個磚演示從下麵的鏈接。
請fastforwar時間下午16或視頻,看幾分鍾的視頻相關的成本。我的理解是湖和磚的數據進行計算的。
問題1:他稱之為“湖”?他的意思是一個集裝箱在azure或aws和文件存儲位置?我知道磚可以讀取任何存儲位置。
問題2:
糾正我如果我錯了,下麵是我對最佳實踐的理解正確的最小成本做下麵的步驟?
1)提供數據文件的存儲賬戶(可能拚花格式)
2)創建筆記本計算一切,
3)編寫處理輸出文件或文件存儲位置,
4)筆記本或書籍添加到管道和管道運行
5)自動關閉所有集群。
少走這條路磚的成本?是這樣嗎?請糾正我如果我錯了。
問題3:
現在上麵做同樣的方法也適用於三角洲湖嗎?δ住表等。或三角洲是一個適用的特性,隻要裏麵的數據是磚和容器在azure存儲位置或aws。
問題4:
感激如果你能分享任何文章或視頻一步一步分享最佳實踐,降低成本在磚所以我可以做一個小的PoC和和我的客戶分享(攝取數據api, 30-50gb存儲的數據,這些數據是如何處理管道,自動關閉所有數據庫集群,現在報道的數據是可用的容器)。
作為我的技能,我有很長一段曆史數據倉庫工作,暫存表,事實,維度,增量加載分區,索引,等等……我隻是想讓我的客戶進入磚。
任何最佳實踐的文章你可以分享會有幫助。
謝謝