集群庫
集群庫可以被運行在集群上的所有筆記本使用。您可以使用先前安裝的工作空間庫,或者使用初始化腳本,直接從PyPI或Maven等公共存儲庫安裝集群庫。
在集群上安裝庫
在集群上安裝庫主要有兩種方式:
安裝一個工作區圖書館它已經被上傳到工作區。
安裝僅用於特定集群的庫。
此外,如果您的庫需要自定義配置,您可能無法使用上麵列出的方法安裝它。相反,您可以使用init腳本它在集群創建時運行。
除了本文介紹的方法外,還可以使用Databricks Terraform提供商和databricks_library。
在本節中:
工作區圖書館
請注意
Databricks按照在集群上安裝的順序處理所有工作空間庫。如果庫之間存在依賴關係,您可能需要注意集群上的安裝順序。
要安裝工作空間中已經存在的庫,可以從集群UI或庫UI開始:
Cluster-installed圖書館
可以在特定集群上安裝庫,而不將其作為工作空間庫使用。
在集群上安裝庫。
點擊計算在側邊欄中。
單擊集群名稱。
單擊庫選項卡。
點擊安裝新。
按照其中一種方法創建工作區圖書館。點擊之後創建,庫已經安裝在集群上。
查看集群上安裝的庫
點擊計算在側邊欄中。
單擊集群名稱。
單擊庫選項卡。對於每個庫,選項卡顯示名稱和版本、類型、安裝狀態,如果已上傳,則提供源文件。