上傳數據到數據磚

上傳數據的UI允許你上傳CSV或TSV文件來創建或覆蓋一個三角洲湖管理表。

您可以創建管理三角洲表統一目錄或蜂巢Metastore。

請注意

學習如何加載文件等雲存儲Azure數據存儲Gen2湖,AWS S3,或穀歌雲存儲,查看教程複製到

重要的

  • 你必須能夠訪問正在運行的計算資源和權限創建表的目標模式。

  • 工作空間管理員可以禁用上傳數據的UI

創建一個表使用文件上傳

您可以使用UI創建一個增量表通過導入小CSV或TSV文件從您的本地機器上。

  • 上傳的UI支持上傳10個文件。

  • 上傳文件的總大小必須在100字節。

  • 該文件必須是一個CSV或TSV和擴展”。csv”或“. tsv。”

  • 壓縮文件等郵政編碼焦油不支持文件。

上傳的文件

  1. 點擊新圖標New >文件上傳

    或者,你可以去添加數據界麵並選擇上傳數據

  2. 單擊文件瀏覽器按鈕或直接拖放文件在降級區。

請注意

進口文件上傳到一個安全的內部位置您的帳戶每日垃圾收集。

預覽、配置和創建一個表

你可以上傳數據到暫存區域沒有連接到計算資源,但你必須選擇一個活躍的計算資源預覽和配置表。

你可以預覽你的50行數據上傳表的配置選項。點擊網格或開關按鈕下的文件名列表數據的表示。

磚存儲數據文件管理表中包含的位置配置模式。你需要適當的權限來創建一個表在一個模式。

選擇所需的模式中創建一個表,執行以下操作:

  1. (僅供統一Catalog-enabled工作區)您可以選擇一個目錄或者遺產hive_metastore

  2. 選擇一個模式。

  3. (可選)編輯表名。

請注意

你可以使用下拉選擇覆蓋現有表創建新表。操作試圖創建新表的名稱衝突顯示一條錯誤消息。

您可以配置選項在你創建的表。

要創建表,單擊創建在頁麵的底部。

格式選項

格式選項取決於您上傳的文件格式。通用格式選項出現在標題欄,更少的常用的選項是可用的先進的屬性對話框。

  • CSV,以下選項是可用的。

    • 第一行包含了標題(默認啟用):這個選項指定CSV / TSV文件是否包含一個頭。

    • 列分隔符:列之間的分隔符。隻允許一個字符,不支持反斜杠。這為CSV文件默認為逗號。

    • 自動檢測列類型(默認啟用):從文件內容自動檢測列類型。您可以編輯預覽表類型。如果這是設置為false,所有列類型推斷字符串

    • 行跨多個線(默認情況下禁用):一個列的值是否能跨越多個文件中。

數據更新時自動預覽編輯格式選項。

請注意

當你上傳多個文件,以下規則適用:

  • 上傳數據的模式是所有檢測模式合並的結果。這不能被禁用。

  • 標題設置適用於所有文件。確保頭一直缺失或出現在所有上傳的文件,以避免數據丟失。

  • 上傳的文件將通過添加所有目標表中的數據行。加入或合並記錄期間不支持文件上傳。

列名稱和類型

您可以編輯列名稱和類型。

  • 編輯類型,單擊圖標類型。

  • 編輯列名稱,點擊輸入框頂部的列。

    列名不支持逗號,反斜杠或者unicode字符(如emojis)。

列數據類型的默認為CSV文件。你可以解釋所有列字符串類型通過禁用先進的屬性>自動檢測列類型

請注意

  • 模式推理做了最大的努力發現列類型。列類型的變更會導致一些值,如果該值不能正確地目標數據類型。鑄造長整型數字日期時間戳不支持列。磚建議您首先創建一個表,然後將這些列使用SQL函數。

  • 支持特殊字符表列名,上傳數據的UI利用列映射

  • 將評論添加到列,並導航到創建的表數據瀏覽在那裏你可以添加評論。

支持的數據類型

上傳數據的UI支持以下數據類型。關於個人數據類型的更多信息SQL數據類型

數據類型

描述

長整型數字

8字節整數數字簽名。

布爾

布爾(真正的,)的值。

日期

字段的值組成的值年、月和天,沒有一個時區。

8字節雙精度浮點數。

字符串

字符串值。

時間戳

字段的值組成的值年,月,日,小時,分鍾,第二,當地時區與會話。

已知的問題

鑄造長整型數字non-castable類型等日期,如日期格式的“yyyy”,可能會引發錯誤。