數據源
本節介紹了您可以在數據映中使用的Apache Spark數據源。許多人包括一個筆記本,該筆記本演示了如何使用數據源讀取和寫數據。
以下數據源直接支持Databricks運行時,或者需要簡單的Shell命令才能啟用訪問:
此外,Databricks支持三角洲湖並使得從多個數據格式創建三角洲表變得容易。
有關Apache Spark數據源的更多信息,請參閱通用負載/保存功能和通用文件源選項。
要了解如何訪問基於文件的數據源的元數據,請參見文件元數據列。
以下存儲數據源要求您配置連接到存儲。有些還要求您創建一個數據鏈圖書館並將其安裝在集群中: