使用AWS膠作為磚的一個目錄
發現數據在所有你的服務,你需要一個強大的目錄能夠發現和訪問數據。AWS膠服務是一個Apache-compatible蜂巢serverless metastore,允許您輕鬆地在AWS服務,共享表元數據的應用程序或AWS帳戶。磚和三角洲湖與AWS膠發現集成數據在你的組織和注冊數據磚之間在三角洲湖和發現數據實例。
好處
磚是預先集成與AWS膠水
簡單的
簡化了管理通過使用相同的AWS膠跨多個磚工作區目錄。
安全
集成安全通過身份和訪問管理憑據直通AWS膠元數據。詳細說明,請參閱磚的博客介紹磚AWS我憑據直通。
beplay娱乐ios
更容易訪問元數據在亞馬遜在AWS服務和訪問數據編目膠水。
磚三角洲湖與AWS核心服務的集成
該參考實現展示了獨特的定位數據磚三角洲湖與AWS集成核心服務,幫助您解決最複雜的數據湖的挑戰。三角洲湖上麵運行的S3,集成與亞馬遜運動,AWS膠水,亞馬遜雅典娜,亞馬遜紅移和亞馬遜QuickSight,僅舉幾例。
如果您是三角洲湖,你可以學習更多在這裏。
把磚與AWS膠水
步驟1
如何配置一個磚集群訪問AWS膠目錄嗎
發射
第一次啟動磚計算集群必要的AWS膠目錄我的角色。我的角色和政策需求中明確提出以循序漸進的方式磚AWS膠Metastore文檔。
在這個示例中,創建一個叫做Field_Glue_Role AWS IAM的作用,也有授權訪問S3 bucket。把角色集群配置,作為演示視頻中描述。
更新
接下來,火花配置屬性集群的配置必須設置集群啟動前,如何更新視頻所示。
步驟2
HSetting AWS膠數據庫使用磚筆記本
步驟3
創建一個三角洲湖表,並使用相同的metastore清單文件
創建和目錄
創建和目錄表直接從筆記本到AWS膠數據目錄。指AWS膠填充數據目錄創建和使用爬蟲編目表。
這裏的演示數據集是來自電影推薦網站MovieLens,這是由電影評級。創建一個DataFrame python代碼。
步驟4
查詢使用亞馬遜雅典娜三角洲湖表
結論
整合AWS膠提供了一個強大的serverless metastore所有企業戰略使用AWS的生態係統。提高數據的可靠性湖泊三角洲湖和提供無縫、serverless數據訪問通過集成與亞馬遜雅典娜。磚Lakehouse平台大國戰略AWS湖,使數據分Beplay体育安卓版本析師、工程師和數據科學家獲得性能和可靠的數據訪問。