創建一個Unity Catalog metastore
這篇文章展示了如何在Unity Catalog中創建一個metastore,並將其鏈接到工作區。metastore是Unity Catalog中對象的頂級容器。它存儲關於數據資產(表和視圖)的元數據以及控製對它們的訪問權限。必須為組織運行的每個區域創建一個metastore。
請注意
除了本文中描述的方法外,還可以使用Databricks Terraform提供商,特別是databricks_metastore資源。要使Unity Catalog能夠訪問metastore,請使用databricks_metastore_data_access。要將工作區鏈接到metastore,請使用databricks_metastore_assignment。
需求
您必須是Databricks帳戶admin。
您的Databricks帳戶必須在優質計劃或以上。
在AWS中,您必須能夠創建S3桶、IAM角色、IAM策略和跨帳戶信任關係。
創建亞轉移
要創建一個Unity Catalog metastore:
在AWS中配置存儲桶和IAM角色。
這個桶會儲存所有的亞穩態管理表,除了那些在編目或模式中具有自己的托管存儲位置的對象。
創建桶時:
將其創建在與您將用於訪問數據的工作區相同的區域中。
為您創建的每個metastore使用一個專用的S3桶。
不允許用戶直接訪問桶。
有關說明,請參見在AWS中配置存儲桶和IAM角色。
登錄數據庫賬戶控製台。
點擊數據。
點擊創建Metastore。
輸入metastore的名稱。
進入將部署亞轉移瘤的區域。
這必須與要用於訪問數據的工作區相同。確保它與前麵創建的雲存儲桶的區域相匹配。
輸入S3桶路徑(可以省略
s3: / /
)和步驟1中創建的IAM角色名。
點擊創建。
當出現提示時,選擇要鏈接到metastore的工作區。
有關將工作區鏈接到亞metastore的更多信息,請參見為Unity Catalog啟用一個工作區。
創建metastore的用戶是其原始的metastore管理員。Databricks建議將原來的metastore管理員重新分配給一個組。看到(推薦)轉移你的metastore的所有權到一個組。
為個人暫存位置啟用Databricks管理
Databricks使用跨源資源共享(CORS)將數據上傳到Unity Catalog中的個人暫存位置。看到為CORS配置Unity Catalog存儲帳戶。
刪除一個metastore
如果您正在關閉Databricks帳戶或有其他原因要刪除對Unity Catalog metastore管理的數據的訪問權限,您可以刪除該metastore。
警告
通過使用Databricks工作空間,metastore管理的所有對象都將變得不可訪問。此操作無法撤消。
管理表數據和元數據將在30天後自動刪除。雲存儲中的外部表數據不受metastore刪除的影響。
刪除一個metastore:
以metastore管理員身份登錄賬戶控製台。
點擊數據。
單擊metastore名稱。
在配置選項卡,單擊右上方的三鍵菜單,選擇刪除。
在確認對話框中,輸入metastore的名稱並單擊刪除。