磚
數據倉庫管理演示
免費開始
Databricks SQL現在在公共預覽中,並在新的工作區中為所有用戶啟用。
視頻記錄
Databricks SQL為所有BI和SQL工作負載提供了一個可伸縮的、完全管理的交互式查詢引擎,在價格/性能基礎上優於領先的數據倉庫。它為BI和您已經使用的報告工具(如Power BI、lookker和Tableau)提供了一流的開放連接器,以及一個內置的SQL IDE。
在本演示的最後,我們將向您展示部署、管理和管理Databricks SQL是多麼容易,從而直接在Databricks Lakehouse平台上啟用自助分析。Beplay体育安卓版本
讓我們開始吧。
單擊此處展開抄本→
我們將輸入想要邀請的每個用戶的電子郵件。
在這裏,我們將賦予它們訪問Databricks工作區的權限,以及訪問Databricks SQL的權限。
一旦用戶能夠訪問Databricks SQL,他們將能夠登錄到湖屋,我們可以開始給他們訪問數據和運行查詢的權限。
配置無服務器SQL端點+數據訪問
現在我們已經邀請了一些用戶,讓我們回到Databricks主頁。
從這裏,我們可以通過單擊側邊欄跳到Databricks SQL,並選擇Databricks SQL鏡頭。您將在左側的麵板中看到全新的Databricks SQL引導的新手體驗。
繼續,點擊“配置數據訪問”作為我們旅程的第一步。
在開始查詢數據之前,作為管理員,我們需要修改SQL Admin Console中的一些設置。
從SQL管理控製台的這個屏幕上,您可以打開無服務器SQL端點,並添加一個實例概要文件,以使您的集群的用戶能夠訪問湖屋中的數據。
數據瀏覽
接下來,讓我們跳到Data Explorer來查看一些數據和管理權限。從這裏,數據分析人員和用戶可以發現lakehouse中的所有數據集、瀏覽模式和查看示例數據。
讓我們看一下“loans_delta”表。當我們選擇它時,我們可以在右手邊查看它的模式。
通過單擊選項卡,我們可以查看該表中的一些示例數據,查看有關數據文件本身實際位置的詳細信息,以及它是否是一個完全受管理的表。
數據權限- UI
在Permissions選項卡上,可以向組或個人用戶授予訪問權限。讓我們繼續添加數據科學家組,以及我們的朋友Amit。
完美的。如您所見,這些權限現在記錄在這裏的右手邊。
SQL GRANT語句
最後,當您需要自動化權限管理時,您可以使用標準SQL grant語句授予或撤銷對湖區數據對象的訪問權,就像這裏看到的那樣。
隻需使用內置的SQL查詢編輯器運行這些語句,Databricks SQL就會立即更新權限。
如果你願意,你也可以直接將這些訪問控製與Azure Active Directory或你選擇的雲身份服務同步。
創建SQL端點
跳回到SQL端點選項卡。
從這裏,我們可以查看和監視當前正在運行的所有端點的運行狀況,或者啟動一個新的端點。現在讓我們繼續創建一個新的端點。
如你所見,我們這裏有一些非常簡單的選項,這很棒!Databricks SQL抽象了集群創建的所有複雜性,隻留下最基本的選項。例如,Databricks SQL端點為集群提供t恤大小。選擇小型、中型或大型,Databricks會自動確定實例類型和配置,以獲得最佳的價格性能。
此外,多集群負載平衡允許您在端點上的負載過高時自動啟動新的集群以滿足需求。
最後,Databricks Photon Engine是一個本地向量化查詢引擎,它為所有SQL工作負載提供更快、更有效的執行。
連接Databricks SQL端點到Tableau
既然已經有了一個運行的端點,我們就可以開始查詢數據了。我們可以使用內置的Databricks SQL查詢引擎和IDE,也可以將我們的端點連接到外部BI工具。對於這個演示,我們將使用Databricks SQL作為Tableau的後端。
現在,讓我們使用Databricks SQL作為Tableau的強大SQL後端,稍後我們將演示內置的BI和可視化工具。
要設置Tableau連接,首先需要從connection Details選項卡複製SQL Endpoint憑據。
然後,切換到用戶設置,創建一個新的個人訪問令牌,該令牌將用於對Tableau進行身份驗證。
現在我們準備切換到Tableau Desktop。
讓我們繼續創建一個新的Workbook,然後選擇Databricks作為我們的數據源。
接下來,隻需粘貼前麵步驟中的憑據。
登錄後,在左上角,您將看到Tableau現在連接到Databricks SQL Endpoint。我們可以搜索到目前為止一直使用的數據庫“deltadb”,並選擇“loans_delta”表。
當我們點擊“立即更新”按鈕時,Databricks SQL幾乎立即返回查詢結果。
下一代Photon查詢引擎盡可能快速有效地運行你的數據倉庫工作負載,因此創建新的卷集,或構建新的自動更新儀表板,就像這樣,是一件輕而易舉的事。
現在我們有了與Tableau的直接連接,我們可以運行交互式查詢,並在後端使用Databricks SQL構建漂亮的可視化和儀表板。
監控SQL端點
現在回到Databricks SQL。作為數據管理員,我們希望能夠監視端點的運行狀況和性能,以盡量減少停機時間。
我們可以通過導航到Monitoring並查看負載平衡圖表來查看端點上的狀態和負載。
作為數據的優秀管理員,我們還希望能夠知道人們訪問了哪些數據集、何時訪問這些數據集以及運行了哪些查詢,以達到可審核性、沿襲性和數據治理的目的。我們可以通過單擊Query History選項卡查看這些信息。
SQL查詢的曆史
從這裏,我們可以查看用戶在特定SQL端點上運行的所有時間戳查詢的中央日誌——不管它是來自像lookker這樣的bi工具,還是來自用戶直接在內置SQL查詢編輯器中運行查詢。
我們可以單擊任何單個查詢來獲得總體概況和一些彙總統計信息。
或者,我們可以選擇Execution Details選項卡,以獲得更細粒度的指標。
執行總結
如果我們想深入研究,可以查看執行摘要。這裏顯示的信息允許您識別長時間運行查詢的瓶頸、理解物理計劃或查看詳細的執行信息以進行調試。
SQL分析師的經驗
現在我們已經接觸了管理體驗,讓我們簡單地轉換一下,從數據分析師的角度來研究Databricks SQL。
如果您想要快速上手,啟動器Databricks SQL Endpoint預裝了示例數據集、查詢和儀表板。您可以將它們複製為模板,也可以隨意使用它們來發現特性並適應內置的SQL IDE。
選項卡SQL查詢編輯器
新的SQL Query編輯器允許您在選項卡中運行查詢,即使您稍後關閉瀏覽器並返回Databricks SQL,這些查詢也會持續存在。
從這裏,您可以快速地將查詢結果轉換為可視化結果,並將其構建到儀表板中。
最後,過去執行選項卡提供了個人查詢曆史的快速查看,以便您可以輕鬆返回並查看感興趣的查詢。
感謝觀看這個演示。訪問m.eheci.com/try,今天就開始使用Databricks SQL。
準備好開始了嗎?