5步驟開始使用磚在穀歌的雲
2021年10月8日 在Beplay体育安卓版本平台的博客
因為我們推出了磚在穀歌的雲今年早些時候,我們興奮地看到故事的價值這個聯合的解決方案帶來了團隊在全球範圍內的數據。我們的一個最喜歡的名言是道格拉斯·Mettenburg分析副總裁j·b·亨特表示:“最終,磚在穀歌的雲現在象J.B.亨特的事實來源。顯示數據的真正價值我們整個公司,我們創造更多的人工智能解決方案,極大地影響我們的生意。”
如道格拉斯所描述,磚在穀歌的雲是所有數據存儲在一個簡單的設計,開放lakehouse平台,統一所有分析和人工智能工作負載。Beplay体育安卓版本它能提高數據驅動決策組織內通過允許更好地協作數據工程,數據科學分析團隊提供基於雲的lakehouse架構。和使它更容易訪問,該解決方案可在穀歌雲控製台以及其他基礎設施。
邁出了第一步,磚在穀歌的雲很容易,隻是遵循以下新員工培訓指南列出了分步指導。你也可以看到這些步驟在行動演示視頻。
1。訂閱磚從GCP的市場
首先登錄到穀歌的雲平台。Beplay体育安卓版本如果你是一個新用戶,您需要創建一個帳戶在你訂閱磚。一旦在控製台中,開始通過選擇一個現有的穀歌雲項目,或創建一個新項目,並確認你的穀歌雲身份組織對象中定義您的穀歌雲控製台。這個步驟需要您的賬單管理員權限設置穀歌計費帳戶或選擇一個已存在的賬戶,你可以使用磚。這可以通過使用計費在左側導航欄的GCP控製台。
找到磚下的合作夥伴解決方案GCP控製台或簡單的搜索市場。現在,您可以訂閱。
一旦你確認條款,你可以使用熟悉的藍色穀歌SSO登錄。與穀歌緊密集成我允許你簡單的磚工作空間的用戶進行身份驗證你的穀歌賬戶通過雲身份穀歌的OAuth 2.0實現。這意味著磚沒有訪問您的登錄信息,消除與存儲相關的風險在磚或保護你的身份證件。
2。先決條件磚GCP的設置
你幾乎已經準備好創建您的第一個磚工作區,但首先回顧下麵的先決條件。
確保足夠的資源配額
你需要分配的最小配額目標穀歌雲地區磚集群運行。我們建議您驗證配額的整個列表用戶文檔以防你的項目的額度小於GCP違約。
你的網絡規模
接下來,配置GKE磚工作區所使用的子網。你隻能做一次在創建第一個工作空間和工作空間是很重要的,因為需要足夠的IP空間成功運行數據磚工作。為了方便起見,磚了計算器可以幫助你決定是否默認為你的子網IP範圍滿足您的需要。
複習課長度約束
如果你的IT管理員設置一個全局約束為登錄用戶會話長度,磚將無法正常工作。在這種情況下,請管理員添加磚受信任的應用程序的列表在穀歌工作空間。看到更多的細節在這裏。
3所示。創建您的第一個工作空間
現在您已經準備好創建磚工作區。一旦您已經配置了先決條件,創建您的第一個工作空間磚賬戶控製台使用一個名稱,地區,和穀歌雲項目ID。
4所示。將用戶添加到您的工作空間
你的磚管理員可以管理用戶賬戶在管理控製台中。作為管理員,他們可以:
- 邀請更多的用戶或刪除它們。
- 授權其他用戶為管理員允許集群創建權限。
創建組的基於角色的訪問控製(RBAC)不同用戶組可能有不同的權限。再次,本機我集成使得用戶身份驗證非常簡單。
5。運行第一個磚的工作
現在,有趣!創建一個新的集群新磚工作區,這樣你的計算引擎實例運行查詢和工作。當您創建一個新的集群首次磚接連GKE集群,需要20分鍾。隨後磚集群隻需要幾分鍾。
讓我們來探討一個快速入門教程筆記本t啊,看這都在行動。一個筆記本是一家集細胞磚集群上運行計算。一旦你把一個筆記本一個集群,你可以運行在任何支持的查詢語言,像Python, SQL, R和Scala並在它們之間切換在相同的筆記本。
在這裏,我們使用數據從一個示例CSV數據創建一個表文件中可用數據磚數據集,數據集的集合文件係統掛載到磚(DBFS),分布式文件係統安裝在磚集群。
CSV數據寫入三角洲湖格式和創建一個增量表。三角洲湖是一個開放的表格格式,可靠性、安全性和性能數據。三角洲湖格式由拚花加上一個事務日誌文件,我們用三角洲湖獲得最佳性能在未來操作放在桌子上。
接下來,CSV數據讀入DataFrame和三角洲湖格式寫出來。這個命令使用Python語言神奇的命令,它允許您交織命令在其他語言比筆記本電腦默認語言(SQL)。
現在,您可以創建一個增量表的存儲位置和運行一個SQL語句查詢平均鑽石價格的表的顏色。您可以單擊條形圖圖標顯示一個圖表鑽石價格的平均顏色。
就是這樣!這是你如何設置您的磚在穀歌的雲賬戶,開始作為一個用戶通過創建一個工作區,集群和筆記本,然後運行SQL命令和顯示結果。
有問題嗎?
注冊一個生活,教師指導實踐研討會回答你的問題,學習如何開始使用磚在穀歌的雲。有多個日期選擇——今天報名!