數據源

本節介紹了您可以在數據映中使用的Apache Spark數據源。許多人包括一個筆記本,該筆記本演示了如何使用數據源讀取和寫數據。

以下數據源直接支持Databricks運行時,或者需要簡單的Shell命令才能啟用訪問:

此外,Databricks支持三角洲湖並使得從多個數據格式創建三角洲表變得容易。

有關Apache Spark數據源的更多信息,請參閱通用負載/保存功能通用文件源選項

要了解如何訪問基於文件的數據源的元數據,請參見文件元數據列

以下存儲數據源要求您配置連接到存儲。有些還要求您創建一個數據鏈圖書館並將其安裝在集群中: