在Databricks SQL、PowerBI和Tableau中運行並可視化查詢

本快速入門教程向您展示如何查詢人員表以查找已命名的女性的數量瑪麗按出生年份分組,並可視化結果。

該表的列為idfirstNamemiddleName性別生日ssn,工資

本文展示了如何使用Databricks SQL UI和BI工具權力BI而且表在線執行相同的查詢。

在開始之前

您的Databricks SQL管理員必須完成Databricks SQL設置查詢表的用戶在完成以下部分中的步驟之前。

切換到不同的工作空間

如果在同一個帳戶中可以訪問多個工作區,則可以在它們之間快速切換。

  1. 單擊Databricks工作區頂部欄中的工作區名稱。

  2. 從下拉菜單中選擇一個工作空間以切換到該工作空間。

登錄“Databricks SQL”

您可以使用側邊欄訪問所有Databricks資產。側邊欄的內容取決於所選擇的角色:數據科學與工程機器學習,或SQL

  • 默認情況下,側邊欄以折疊狀態顯示,隻有圖標可見。將光標移到側欄上以展開到完整視圖。

  • 要更改角色,請單擊Databricks徽標下麵的圖標磚的標誌,並選擇一個角色。

    改變形象
  • 要固定角色,以便下次登錄時出現,請單擊銷的角色在人物角色旁邊。再次單擊以移除引腳。

  • 使用菜單選項在側邊欄底部,將側邊欄模式設置為汽車(默認行為),擴大,或崩潰

如果顯示Databricks數據科學與工程或Databricks機器學習環境,請使用邊欄切換到Databricks SQL。如果您沒有Databricks SQL的訪問權限,請向管理員請求訪問權限。

當你登錄到Databricks SQL時,你的登錄頁麵是這樣的:

用戶登錄頁麵

查詢Databricks SQL中的people表

設置查詢表的用戶,管理員創建了一個名為people10.在本節中,您將在該表上運行一個查詢,查詢每個出生年份中名為Mary的人數。

  1. 點擊新圖標在側欄中選擇查詢

    SQL編輯器將顯示。

  2. 選擇起動器倉庫(或你選擇的倉庫)。

    第一次創建查詢時,可用SQL倉庫的列表將按字母順序顯示。下次創建查詢時,將選擇最後使用的倉庫。

  3. 粘貼進去選擇查詢指定的女性數量的語句瑪麗每年出生的孩子:

    選擇一年生日作為birthYear作為總計默認的people10m在哪裏firstName“瑪麗”性別“F”集團通過birthYear訂單通過birthYear
  4. 新聞Ctrl/Cmd + Enter或者點擊運行(1000)

    限製1000默認情況下為所有查詢選擇,以確保查詢最多返回1000行。如果希望返回此查詢的所有行,可以取消選擇限製1000請按運行(1000)下拉。如果要指定不同的行數限製,可以添加限製子句中使用您選擇的值。

    查詢結果顯示在“表格”頁簽中。

    查詢結果
  5. 點擊保存保存此查詢。

  6. 保存查詢文本框,輸入瑪麗並點擊保存

在Databricks SQL中創建一個可視化

  1. 在結果表中,單擊+然後點擊可視化

    可視化編輯器將顯示。

    可視化編輯器
  2. 將可視化名稱更改為散點1瑪麗通過出生一年

  3. 可視化類型下拉,選擇酒吧

  4. X列下拉,驗證birthYear被選中。

  5. Y列下拉,驗證總計被選中。

  6. 單擊X軸選項卡。

  7. 在Name字段中輸入出生一年

  8. 單擊Y軸選項卡。

  9. 在Name字段中輸入數量瑪麗通過出生一年

  10. 點擊保存

    保存的圖表顯示在SQL編輯器中。

    瑪麗的SQLA圖表

在Databricks SQL中創建一個儀表板

  1. 點擊新圖標在側欄中選擇指示板

  2. 輸入作為儀表板名稱。

  3. 點擊保存

  4. 添加下拉列表,單擊可視化

  5. 在查詢列表中,選擇瑪麗

  6. 選擇現有的可視化列表中,選擇瑪麗通過出生一年

  7. 標題文本框,輸入瑪麗通過出生一年

    添加可視化小部件
  8. 點擊添加到儀表板

  9. 點擊做編輯

    完整的儀表板

獲取SQL倉庫連接詳細信息

  1. 點擊端點圖標SQL倉庫在側欄中。

  2. 在倉庫列表中,鍵入起動器在過濾器盒(或你選擇的其他過濾器)。

  3. 單擊起動器倉庫鏈接(或您選擇的倉庫)。

  4. 單擊連接細節選項卡。

    連接細節
  5. 點擊複製圖標複製“服務器主機名”和“HTTP路徑”。

獲取一個個人訪問令牌

個人訪問令牌對Databricks SQL進行身份驗證。

  1. 單擊工作區右上角菜單欄上的用戶名,然後選擇用戶設置從下拉列表。

  2. 單擊個人訪問令牌選項卡。

  3. 點擊+生成新令牌

  4. 可選地輸入注釋並修改令牌生存期。

  5. 點擊生成

  6. 點擊複製圖標複製令牌,單擊好吧

使用Power BI查詢Databricks SQL

配置Power BI到Databricks SQL的連接

  1. 選擇獲取數據>更多…> Azure並選擇Azure磚連接器。

    在獲取數據列表中的Databricks連接器

    請注意

    盡管標簽上寫著Azure磚,該連接器還可以與AWS上的Databricks一起使用。

  2. 點擊連接

  3. 輸入您複製的服務器主機名和HTTP路徑獲取SQL倉庫連接詳細信息

    電源BI數據源
  4. 點擊好吧

  5. 在身份驗證提示符下,選擇個人訪問令牌選項卡。輸入您複製的個人訪問令牌獲取一個個人訪問令牌

  6. 點擊連接

    如果SQL倉庫沒有運行,它將啟動,但可能需要幾分鍾才能變得可用。

  7. 在“電源BI導航器”中,選擇default.people10m表格

  8. 點擊負載

塑造數據

返回名字為瑪麗的女性的記錄,並計算每年瑪麗的數量。

  1. 刪除所有列,除了firstName性別,生日

  2. 使用firstName瑪麗而且性別F

  3. 更改類型生日日期並刪除除年份以外的所有日期組件。

  4. 按年份分組,計算每年聖母瑪利亞的數量。

mary Power BI表

可視化數據

Marys Power BI圖表

使用Tableau在線查詢Databricks SQL

配置從Tableau Online到Databricks SQL的連接

  1. 在Tableau Online中,打開工作簿或創建一個新的工作簿。

  2. 選擇數據>新數據源

    Tableau在線數據源
  3. 在“連接到數據”對話框中,選擇連接器>數據

    Tableau在線數據
  4. 在Databricks連接對話框中,輸入服務器主機名而且HTTP路徑你複製進去了獲取SQL倉庫連接詳細信息

    Tableau數據源
  5. 驗證使用令牌的用戶名和令牌獲取一個個人訪問令牌作為密碼。

  6. 點擊登錄

    如果SQL倉庫沒有運行,它將啟動,但可能需要幾分鍾才能變得可用。

  7. 在Schema字段中輸入默認的.新聞輸入

  8. 選擇模式下拉,選擇默認的

  9. 在Table字段中輸入people10m.新聞輸入

  10. 拖動people10表到畫布。

塑造數據

返回名字為瑪麗的女性的記錄,並計算每年瑪麗的數量。

  1. 刪除所有列,除了firstName性別,生日

  2. 使用firstName瑪麗而且性別F

  3. 更改類型生日日期並刪除除年份以外的所有日期組件。

  4. 按年份分組,計算每年聖母瑪利亞的數量。

瑪麗的Tableau桌子

可視化數據

形象化的柱狀圖:

Marys Tableau圖表