你好傑,
我建議首先創建增量表管理。請運行一個簡單的命令
創建表事件(id)使用δ
這將創建一個名為“事件”的管理的三角洲表
然後執行
% sql描述擴展事件
上麵的命令將顯示“位置”,將存儲的數據。這將是一個默認DBFS位置。
這將給你一個想法就如何創建管理三角洲表數據存儲,將告訴你。
謝謝
Mathan
你有兩種表:托管和非托管。管理的數據存儲在數據磚存儲賬戶。
非托管的數據存儲在其他地方,例如湖您自己的數據
如果你使用管理表,存儲已經安裝了,你必須為非托管表掛載存儲第一個。
https://docs.m.eheci.com/data/tables.html managed-and-unmanaged-tables
接下來,您可以創建一個表。在這裏你可以選擇手動定義表的模式,自動或推導模式。
第二個選項,這取決於文件類型這是如何工作的。如果你的源文件是拚花,三角洲湖自動模式,可以設置為csv inferschema為True。
https://docs.m.eheci.com/sql/language-manual/sql-ref-syntax-ddl-create-table-using.html
不難做,但你的確需要讀了幾頁的文檔。