創建一個Unity Catalog metastore

這篇文章展示了如何在Unity Catalog中創建一個metastore,並將其鏈接到工作區。metastore是Unity Catalog中對象的頂級容器。它存儲關於數據資產(表和視圖)的元數據以及控製對它們的訪問權限。必須為組織運行的每個區域創建一個metastore。

請注意

除了本文中描述的方法外,還可以使用Databricks Terraform提供商,特別是databricks_metastore資源。要使Unity Catalog能夠訪問metastore,請使用databricks_metastore_data_access。要將工作區鏈接到metastore,請使用databricks_metastore_assignment

需求

  • 您必須是Databricks帳戶admin。

  • 您的Databricks帳戶必須在優質計劃或以上

  • 在AWS中,您必須能夠創建S3桶、IAM角色、IAM策略和跨帳戶信任關係。

創建亞轉移

要創建一個Unity Catalog metastore:

  1. 在AWS中配置存儲桶和IAM角色。

    這個桶會儲存所有的亞穩態管理表,除了那些在編目或模式中具有自己的托管存儲位置的對象。

    創建桶時:

    • 將其創建在與您將用於訪問數據的工作區相同的區域中。

    • 為您創建的每個metastore使用一個專用的S3桶。

    • 不允許用戶直接訪問桶。

    有關說明,請參見在AWS中配置存儲桶和IAM角色

  2. 登錄數據庫賬戶控製台

  3. 點擊數據圖標數據

  4. 點擊創建Metastore

    1. 輸入metastore的名稱。

    2. 進入將部署亞轉移瘤的區域。

      這必須與要用於訪問數據的工作區相同。確保它與前麵創建的雲存儲桶的區域相匹配。

    3. 輸入S3桶路徑(可以省略s3: / /)和步驟1中創建的IAM角色名。

  5. 點擊創建

  6. 當出現提示時,選擇要鏈接到metastore的工作區。

    有關將工作區鏈接到亞metastore的更多信息,請參見為Unity Catalog啟用一個工作區

創建metastore的用戶是其原始的metastore管理員。Databricks建議將原來的metastore管理員重新分配給一個組。看到(推薦)轉移你的metastore的所有權到一個組

為個人暫存位置啟用Databricks管理

Databricks使用跨源資源共享(CORS)將數據上傳到Unity Catalog中的個人暫存位置。看到為CORS配置Unity Catalog存儲帳戶

刪除一個metastore

如果您正在關閉Databricks帳戶或有其他原因要刪除對Unity Catalog metastore管理的數據的訪問權限,您可以刪除該metastore。

警告

通過使用Databricks工作空間,metastore管理的所有對象都將變得不可訪問。此操作無法撤消。

管理表數據和元數據將在30天後自動刪除。雲存儲中的外部表數據不受metastore刪除的影響。

刪除一個metastore:

  1. 以metastore管理員身份登錄賬戶控製台

  2. 點擊數據圖標數據

  3. 單擊metastore名稱。

  4. 配置選項卡,單擊右上方的三鍵菜單,選擇刪除

  5. 在確認對話框中,輸入metastore的名稱並單擊刪除