在Databricks SQL中上傳數據並創建表
Databricks SQL創建表UI允許您快速上傳CSV或TSV文件並創建Delta表。
請注意
要從雲存儲(如Azure Data Lake storage Gen2、AWS S3或穀歌雲存儲)加載文件,請查看COPY INTO教程.
使用文件上傳創建表
您可以使用UI從本地機器導入小型CSV或TSV文件到Databricks SQL來創建Delta表。
上傳UI支持在100mb以下的時間上傳單個文件。
文件必須是CSV或TSV,並且擴展名為“。CSV”或“。TSV”。
壓縮文件,例如
郵政編碼
而且焦油
不支持文件。
上傳文件
使用角色切換器導航到SQL角色。
要更改角色,請單擊Databricks徽標下麵的圖標,並選擇一個角色。
點擊創建在側欄中選擇表格菜單上的。
彈出“在Databricks SQL中創建表”頁麵。
要開始上傳,請單擊文件瀏覽器按鈕或直接在拖放區域上拖放文件。
請注意
導入的文件被上傳到一個安全的內部位置,在您的帳戶,這是垃圾收集每天。
表名選擇
上傳完成後,您可以選擇數據的目的地。
對於分配給Unity Catalog亞礦的工作區,您可以選擇一個目錄。如果你的工作空間沒有被分配給Unity Catalog metastore,目標目錄將被隱藏,模式將從Hive metastore中加載。
要在已分配給Unity Catalog metastore的工作空間中使用Hive metastore,請選擇
hive_metastore
在目錄選擇器中。
選擇模式。
默認情況下,UI將文件名轉換為有效的表名。您可以編輯表名。
數據預覽
上傳完成後,可以預覽數據(限製50行)。
上傳完成後,UI嚐試啟動右上方選擇的端點。您可以在任何時候切換端點,但是預覽和表創建需要一個活動端點。如果端點尚未激活,則自動啟動。這可能需要一些時間。預覽開始時,您的端點正在運行。
有兩種方法可以預覽數據,垂直或水平。要在預覽選項之間切換,請單擊表上方的切換按鈕.
格式選項
根據上傳的文件格式,可以使用不同的選項。常用格式選項出現在標題欄中,而不太常用的選項可在先進的屬性模態。
對於CSV,可以使用以下選項。
第一行包含標題(默認啟用):該選項指定CSV/TSV文件是否包含頭文件。
列分隔符:列之間的分隔符。隻允許使用單個字符,不支持反斜杠。對於CSV文件,默認為逗號。
自動檢測列類型(默認啟用):自動從文件內容檢測列類型。您可以在預覽表中編輯類型。如果將其設置為false,則所有列類型都推斷為
字符串
.行跨多行(默認禁用):一個列的值是否可以跨越文件中的多行。
當您編輯格式選項時,數據預覽會自動更新。
列標題和類型
您可以編輯列標題名稱和類型。
若要編輯類型,請單擊該類型的圖標。
若要編輯列名,請單擊列頂部的輸入框。
列名不支持逗號、反斜杠或unicode字符(例如表情符號)。
對於CSV文件,默認情況下推斷列數據類型。您可以將所有列解釋為字符串
通過禁用輸入先進的屬性>自動檢測列類型.
請注意
支持的數據類型
CSV上傳創建表支持以下數據類型。有關各個數據類型的詳細信息,請參見SQL數據類型.
數據類型 |
描述 |
---|---|
|
8字節有符號整數。 |
|
布爾( |
|
包含年、月和日字段的值,不帶時區。 |
|
8字節雙精度浮點數。 |
|
字符串值。 |
|
由年、月、日、小時、分和秒字段的值和會話本地時區組成。 |