上傳數據到數據磚
上傳數據的UI允許你上傳CSV或TSV文件來創建或覆蓋一個三角洲湖管理表。
您可以創建管理三角洲表統一目錄或蜂巢Metastore。
請注意
學習如何加載文件等雲存儲Azure數據存儲Gen2湖,AWS S3,或穀歌雲存儲,查看教程複製到。
重要的
你必須能夠訪問正在運行的計算資源和權限創建表的目標模式。
工作空間管理員可以禁用上傳數據的UI。
創建一個表使用文件上傳
您可以使用UI創建一個增量表通過導入小CSV或TSV文件從您的本地機器上。
上傳的UI支持上傳10個文件。
上傳文件的總大小必須在100字節。
該文件必須是一個CSV或TSV和擴展”。csv”或“. tsv。”
壓縮文件等
郵政編碼
和焦油
不支持文件。
預覽、配置和創建一個表
你可以上傳數據到暫存區域沒有連接到計算資源,但你必須選擇一個活躍的計算資源預覽和配置表。
你可以預覽你的50行數據上傳表的配置選項。點擊網格或開關按鈕下的文件名列表數據的表示。
磚存儲數據文件管理表中包含的位置配置模式。你需要適當的權限來創建一個表在一個模式。
選擇所需的模式中創建一個表,執行以下操作:
(僅供統一Catalog-enabled工作區)您可以選擇一個目錄或者遺產
hive_metastore
。選擇一個模式。
(可選)編輯表名。
請注意
你可以使用下拉選擇覆蓋現有表或創建新表。操作試圖創建新表的名稱衝突顯示一條錯誤消息。
要創建表,單擊創建在頁麵的底部。
格式選項
格式選項取決於您上傳的文件格式。通用格式選項出現在標題欄,更少的常用的選項是可用的先進的屬性對話框。
CSV,以下選項是可用的。
第一行包含了標題(默認啟用):這個選項指定CSV / TSV文件是否包含一個頭。
列分隔符:列之間的分隔符。隻允許一個字符,不支持反斜杠。這為CSV文件默認為逗號。
自動檢測列類型(默認啟用):從文件內容自動檢測列類型。您可以編輯預覽表類型。如果這是設置為false,所有列類型推斷
字符串
。行跨多個線(默認情況下禁用):一個列的值是否能跨越多個文件中。
數據更新時自動預覽編輯格式選項。
請注意
當你上傳多個文件,以下規則適用:
上傳數據的模式是所有檢測模式合並的結果。這不能被禁用。
標題設置適用於所有文件。確保頭一直缺失或出現在所有上傳的文件,以避免數據丟失。
上傳的文件將通過添加所有目標表中的數據行。加入或合並記錄期間不支持文件上傳。
列名稱和類型
您可以編輯列名稱和類型。
編輯類型,單擊圖標類型。
編輯列名稱,點擊輸入框頂部的列。
列名不支持逗號,反斜杠或者unicode字符(如emojis)。
列數據類型的默認為CSV文件。你可以解釋所有列字符串
類型通過禁用先進的屬性>自動檢測列類型。
請注意
支持的數據類型
上傳數據的UI支持以下數據類型。關於個人數據類型的更多信息SQL數據類型。
數據類型 |
描述 |
---|---|
|
8字節整數數字簽名。 |
|
布爾( |
|
字段的值組成的值年、月和天,沒有一個時區。 |
|
8字節雙精度浮點數。 |
|
字符串值。 |
|
字段的值組成的值年,月,日,小時,分鍾,第二,當地時區與會話。 |