嗨Carsten,
在這種情況下,也許你可以創建多個目錄的一個metastore:
dev.source_system_name_1.table_1
dev.source_system_name_2.table_1
…
test.source_system_name_1.table_1
test.source_system_name_2.table_1
…
prod.source_system_name_1.table_1
prod.source_system_name_2.table_1
有一個有趣的視頻從今年的峰會:https://youtu.be/ibvG-pYKl8U?t=852
“那你隻允許有一個加州大學/地區”<——我認為這是推薦的方法,但您應該能夠創建多個metastores在一個地區。我想測試這種方法,開發和刺激在同一地區,不同的桶。另一個選項可以創建開發在不同的地區。
我認為這裏的限製使用這種方法,您將不得不創建的所有管理表隻有一個水桶,分配給加州大學。
“既然現在所有數據在工作區是可見的。”- this can be limited by creating multiple roles.
你可以dev-data-eng、test-data-eng prod-data-eng角色創建賬戶層麵然後你給你的開發帶來隻有dev-data-eng工作區,等等。
這裏的限製是,超級用戶仍然能夠訪問所有數據,除非你不允許統一目錄管理進入工作區(不知道這是可能的,我現在檢查)。
我有一點困惑,我混合工作區帳戶權限和數據權限。
我也調查統一。我認為這是偉大的和有限的,但比偉大更有限。
好,因為你有一些非常有趣的功能,如列/基於行的訪問,和血統。
但它仍然是非常有限的,因為沉重的關注表和三角洲湖。
他們似乎有點忘記了,大量的數據仍然駐留在常見的鑲花的文件。
初版
覆蓋模式DataFrame寫操作為三角洲隻支持統一目錄表,不為其他文件格式。
這個獨自一人讓我想知道我們應該使用它,或看著DataHub /阿蒙森。
這仍然是一個新產品,新功能可能會增加,但現在我可能不會使用它。