什麼是工作空間文件?

預覽

支持工作區文件公共預覽.回購中的文件通常是可用的。

工作區文件是Databricks工作區中不是Databricks筆記本的任何文件。工作區文件可以是任何文件類型。常見的例子包括:

  • . py自定義模塊中使用的文件。

  • 。海事文件,例如README.md

  • . csv或其他小數據文件。

  • . txt文件。

  • 日誌文件。

Databricks為許多工作空間文件類型提供了類似於本地開發的功能,包括一個內置的文件編輯器。並非支持所有文件類型的所有用例。例如,雖然可以在導入的目錄或存儲庫中包含圖像,但不能在筆記本中嵌入圖像。

您可以使用筆記本交互中熟悉的模式創建、編輯和管理對工作區文件的訪問。可以使用相對路徑從工作空間文件導入庫,類似於本地開發。詳情請參見:

對於Databricks Runtime 11.2及以上版本,默認情況下所有地方都啟用了工作區文件。在Databricks Runtime 11.0及以上版本中,Repos中的Files默認是啟用的,可以手動禁用或啟用。看到配置支持文件在回購

在Databricks Runtime 8.4及以上版本中,您可以在Databricks repo中同步、導入和讀取非筆記本文件。您還可以在“Databricks”界麵查看和編輯文件。

在Databricks Runtime 11.2及以上版本中,您可以通過編程方式在Databricks repo中寫入或刪除工作區文件。

重要的

雖然啟用“回購中的文件”會將驅動程序操作的當前工作目錄更改為包含執行代碼的筆記本的目錄,但回購之外的筆記本在與工作區文件交互時表現不同,當前工作目錄默認為驅動程序塊存儲卷。看到如何處理數據庫上的文件

配置支持文件在回購

要在Databricks Repos中處理非筆記本文件,必須運行Databricks Runtime 8.4或以上版本。必須運行Databricks Runtime 11.2或更高版本才能以編程方式創建或刪除工作空間文件。

如果沒有啟用“回購中的文件”支持,您仍然會在Databricks回購中看到非筆記本文件,但不能使用它們。

管理員可以按照如下方式配置該特性:

  1. 管理控製台

  2. 單擊工作空間設置選項卡。

  3. 回購控件中選擇一個選項repo中的文件下拉。

要確保已應用所有配置,必須刷新瀏覽器並重新啟動計算集群。

請注意

當您第一次啟用Repos中的文件時,您可能需要打開Git對話框並執行拉操作來同步回購中的非筆記本文件。如果存在任何合並衝突,則會出現一個對話框,讓您選擇放棄衝突的更改或將更改推到新的分支。

已啟用“在repo中確認文件”

您可以使用該命令% sh鬆材線蟲病在一個筆記本內的回購,以檢查文件中的回購是否啟用。

  • 如果“Files in Repos”未啟用,則響應為/磚/驅動程序

  • 如果啟用了“Files in Repos”,則響應為/ Workspace /回購/ <路徑筆記本目錄>

從使用Databricks容器服務的集群中訪問Repos中的文件

在運行Databricks Runtime 11.3及以上版本的集群上,您可以默認使用Databricks Container Services (DCS)在Repos中使用Files。

在Databricks Runtime 10.4 LTS和9.1 LTS版本中,可以通過配置dockerfile訪問DCS集群的Repos中的文件。Databricks Runtime版本參考以下dockerfiles:

看到使用Databricks Container Services定製容器