磚是什麼?
磚Lakehouse平台提供了一套統一的工具用於構Beplay体育安卓版本建,部署大規模共享,和維護企業級數據解決方案。磚與雲存儲和安全集成在您的雲賬號,和代表你的管理和部署雲基礎設施。
與AWS磚是如何工作的?
磚平台體係結構是由兩個主要部分Beplay体育安卓版本:數據磚使用的基礎設施部署、配置和管理平台和服務,和客戶擁有的基礎設施管理由磚和你的公司合作。
與許多企業數據庫公司,磚不強迫你將數據遷移到私有存儲係統為了使用平台。Beplay体育安卓版本相反,你配置一個磚工作區之間通過配置安全集成磚平台和雲賬戶,然後磚部署短暫的計算集群使用雲資源在您的帳戶處理和存儲數據對象存儲和其他綜合服務控製。Beplay体育安卓版本
統一目錄進一步擴展了此關係,允許您管理權限來訪問數據從磚內部使用熟悉的SQL語法。
磚已經部署的工作空間,滿足安全和網絡需求的一些世界上最大的和最安全的公司。磚很容易使新用戶開始在講台上,並移除的很多負擔和顧慮從最終用戶使用雲計算基礎設施,但不限製定製和控製經驗數據,操作和安全團Beplay体育安卓版本隊需要。
磚用於什麼?
我們的客beplay体育app下载地址戶使用磚處理、存儲、幹淨、共享、分析、模型,並從中盈利與從BI解決方案到機器學習的數據集。您可以使用磚平台構建許多不同的應用程序生成數據的角色。Beplay体育安卓版本beplay体育app下载地址客戶完全接受的lakehouse利用統一的平台來構建和部署數據工程工作流,機器學習模型,分析儀表盤,整個組織創新和見解。Beplay体育安卓版本
磚工作區為許多核心數據任務提供了用戶界麵,包括以下工具:
互動的筆記本
工作流調度和管理
SQL編輯器和儀表板
數據攝取和治理
數據發現、注釋和探索
計算管理
機器學習(ML)實驗跟蹤
毫升模型服務
存儲功能
與Git源代碼控製
除了工作區UI,您可以通過編程方式與磚使用以下工具:
REST API
CLI
起程拓殖
常見的用例是什麼磚?
用例在磚一樣多種多樣的數據處理平台和處理數據的許多角色的員工他們的工作的核心部分。Beplay体育安卓版本以下用例突出用戶如何在您的組織可以利用磚來完成任務的必要的處理、存儲和分析的數據驅動關鍵業務功能和決策。
構建一個企業數據lakehouse
數據倉庫的數據lakehouse結合力量和數據加速湖泊,簡化和統一企業數據的解決方案。數據工程師、科學家、分析師和生產係統中所有可以利用的數據lakehouse作為一個真理的來源,允許及時獲得一致的數據和減少建築的複雜性,許多分布式數據係統維護和同步。看到磚Lakehouse是什麼?。
ETL和數據工程
無論你是生成儀表板或推動人工智能應用程序,數據工程提供了以數據為中心的骨幹企業,確保數據是可用的,幹淨,並存儲在數據模型,允許有效的發現和使用。磚結合了Apache火花的力量和三角洲湖和自定義工具提供了一個無與倫比的ETL(提取、轉換、加載)經驗。您可以使用SQL、Python和Scala寫ETL邏輯,然後編排計劃工作部署隻需要點擊幾下。
三角洲生活表通過智能管理進一步簡化了ETL數據集之間的依賴關係,並自動部署和擴展生產基礎設施,以確保及時和準確的交貨數據/您的規範。
磚提供了大量的自定義工具數據攝取,包括自動加載程序,一個有效的和可伸縮的工具逐步和冪等加載數據從雲湖到數據lakehouse對象存儲和數據。
數據倉庫、分析和BI
磚結合了用戶友好的用戶界麵和具有成本效益的計算資源和無限的可伸縮的、負擔得起的存儲提供了一個強大的平台運行分析查詢。Beplay体育安卓版本管理員可伸縮的計算集群配置SQL倉庫,允許最終用戶執行查詢,而不必擔心任何工作在雲計算的複雜性。SQL用戶可以對數據進行查詢lakehouse使用SQL查詢編輯器或筆記本電腦。筆記本電腦支持Python, R, Scala除了SQL,並允許用戶嵌入相同的可視化可以在指示板與鏈接、圖片和評論寫在減價。
數據治理和安全的數據共享
統一目錄提供了一個統一的數據治理模型數據lakehouse。雲管理員配置和集成粗訪問控製權限統一目錄,然後磚管理員可以管理團隊和個人的權限。權限管理與訪問控製列表(acl)通過友好的用戶界麵或SQL語法,使數據庫管理員更容易獲得數據,而不需要規模進行身份訪問管理(IAM)和網絡。
統一目錄使得在雲中運行安全分析簡單,並提供了一個部門的責任,幫助限製reskilling或upskilling必要管理員和最終用戶的平台。Beplay体育安卓版本看到聯合目錄是什麼?。
lakehouse使組織內部的數據共享簡單給予查詢訪問一個表或視圖。分享你的安全的環境外,統一目錄管理版本的特性三角洲分享。
DevOps, CI / CD和任務編製
ETL開發生命周期的管道,毫升模型和分析儀表盤每個展示他們自己的獨特的挑戰。磚允許所有用戶利用單一的數據源,從而減少重複努力和不同步的報告。另外提供一套常用工具的版本化、自動化、調度、部署代碼和生產資源,可以簡化你的開銷監控、編排和操作。工作流時間表磚筆記本,SQL查詢,和其他任意代碼。回購讓你同步磚項目的許多受歡迎的git提供者。工具的完整概述,請參閱開發工具和指導。
實時和流媒體分析
磚利用Apache火花結構化流處理流數據和增量數據的變化。結構化流與三角洲湖緊密集成,這些技術提供基礎三角洲生活表和自動加載程序。看到Apache火花結構化流是什麼?。